domingo, 31 de agosto de 2008

La importancia de la "relevancia" en informacion

From cornella@redestb.es Tue Jan 20 00:43:40 1998
Date: Tue, 20 Jan 1998 00:43:40 +0100
Mensaje 305

Leo en el Bulletin de la ASIS (American Society for Information Science; http://www.asis.org) el discurso del brillante profesor Dagobert Soergel con ocasion de haber recibido el Premio de Honor de la ASIS. El discurso, titulado "An Information Science Manifesto" esta accesible en texto entero en http://www.asis.org/Bulletin/Dec-97/Soergel.htm. Para cualquiera que quiera enterarse de hacia donde va esta disciplina, este es un fantastico Manifiesto.

Soergel considera que la tension entre las necesidades de informacion del usuario y las formas de representacion de esta informacion en algun tipo de almacen es la clave de la disciplina de la ciencia de la informacion. En otras palabras, el problema fundamental para quien estudie cientificamente el campo de la informacion es como una necesidad de informacion de alguien es resuelta o no mediante una busqueda de informacion en algun sistema que la almacene. Esta relacion entre "necesidad de informacion" e "informacion almacenada" define el concepto clave: "relevancia".

La idea de relevancia es muy compleja. Primero, y para simplificar, se pueden definir dos tipos fundamentales de relevancia. La relevancia "formal": cuando los resultados de una busqueda de informacion responden a la ecuacion de busqueda que se habia planteado. Y la relevancia semantica: cuando los resultados obtenidos responden a las necesidades del usuario (he sacado estas dos ideas de un util librito de J.R. Perez Alvarez-Ossorio, Introduccion a la Informacion y Documentacion Cientifica).

De estas dos definiciones se entiende ya algo que va a tomar mas y mas importancia en esta era de Internet: los internautas van a ir descubriendo, ya lo estan haciendo de hecho, por que lo que obtienen en sus busquedas en el Web no les sirven de mucho. La razon por la que no tan solo consiguen informacion muy poco relevante formalmente (sus ecuaciones de busqueda son simplemente pobres, o el lugar en el que buscan no es el adecuado), sino que lo que consiguen es, frecuentemente, tambien irrelevante semanticamente, es decir, que no les sirve para resolver la necesidad de informacion que tenian, porque confunden lo que la informacion que desean obtener con lo que realmente preguntan. Los grandes depositos de informacion que constituyen Internet no sirven de nada si no se les interroga adecuadamente, pero tampoco sirven de nada si quien pregunta no sabe realmente cual es el problema que quiere resolver buscando informacion. Por lo general, se dirigen al Web antes de haber meditado sobre cual es en realidad el problema, es decir, sobre cual es la informacion que necesitan. E incluso en ese caso, no se conocen adecuadamente las formas de interrogar el Web. Cuantos internautas, por ejemplo, se han atrevido a indagar como se plantean busquedas complejas (mediante operadores booleanos, por ejemplo) en los motores de busqueda universalmente conocidos?

O sea: que la practica en el Web lleva a miles de personas a encontrarse con el problema de la relevancia. Y frente a la irrelevancia de muchas de sus busquedas solo se les ocurre dar las culpas a la poca organizacion de la informacion en Internet, a la poca calidad de la misma, etc. Una gran oportunidad, de hecho, para que aparezcan intermediarios que prometan una mayor relevancia en la busqueda de informacion para profesionales. Algo que, sin embargo, resulta siempre dificil de conseguir.

La principal razon es que la verdadera relevancia, es decir obtener informacion relevante para un problema, no consiste simplemente en definir una ecuacion de busqueda correctamente, o en ir a hurgar en una buena base de datos. Porque, como nos recuerda Setfano Mizzaro en un brillante articulo en el Journal del ASIS de septiembre de 1997 (p810), la relevancia es en realidad una relacion entre dos entidades cualesquiera escogidas cada una de ellas entre los componentes de dos grupos distintos. En el primer grupo estan: el problema (aquello que un humano tiene que resolver), la necesidad de informacion (como el humano en cuestion representa en su mente el problema al que se enfrenta), la peticion de informacion (como expresa el humano esa necesidad de informacion a alguien, normalmente en lenguaje natural), y finalmente, la interrogacion (la ecuacion de busqueda a plantear a una base de datos, por ejemplo).

En el segundo grupo estan: el documento (el soporte fisico donde esta la informacion, por ejemplo un articulo de revista en papel), el subrogado (la representracion de ese documento, por ejemplo, el resumen de un documento en una base de datos), y finalmente, la informacion (lo que el usuario capta al leer un documento).

Asi, hablariamos de diversos tipos de relevancia. Por ejemplo, podemos hablar de un subrogado que es relevante de acuerdo con una cierta interrogacion (los registros que se han obtenido de una busqueda en una base de datos satisfacen correctamente la ecuacion de busqueda planteada). O podemos hablar de la relevancia de un documento con respecto a una peticion (el documento obtenido responde a la necesidad expresada por el peticionario). Pero ninguna de las dos relevancias garantiza que el documento en cuestion responda al problema real del usuario, que, por otra parte, puede que incluso no conozca bien.

Todo ello nos lleva a que va a ser mas y mas importante instruir a la gente, en especial a los miembros de una empresa, en como reconocer bien los problemas, como plantearlos en forma de necesidad de informacion, y como plantear ecuaciones de busqueda que lleven a documentos "relevantes" para el problema, eso dejando de lado la necesidad de conocer bien cuales son las fuentes de informacion y como se usan. Estas habilidades forman parte de lo que en otras ocasiones hemos denominado "cultura de la informacion" de los miembros de una empresa.

Este problema, muy conocido por los profesionales de la informacion desde hace decadas, toma ahora una nueva dimension con la divulgacion universal de Internet.

Alfons Cornella, ESADE Barcelona
cornella@esade.es
19/01/98 11:50h
Mensajes anteriores, motor, forum, suscripciones en:
http://www.extra-net.net