miércoles, 24 de abril de 2013

Técnicas de recuperación de información en buscadores

En la presente entrada se procede a comentar las técnicas que emplean los buscadores de internet para recuperar la información que buscamos:

¿Qué es la recuperación de información?

Cuando hablamos de la recuperación de información nos estamos refiriendo a "la ciencia de la búsqueda de información en documentos electrónicos y digitales que se ocupa de la búsqueda de información dentro de los mismos, búsqueda de metadatos que describan documentos,  y búsqueda en bases de datos.
Los buscadores recuperan la información en textos, imágenes, sonido o datos de otras características.

En el proceso de búsqueda y recuperación de información intervienen tres elementos fundamentales:

  1. Usuario que realiza la búsqueda de información.
  2. Sistema de búsqueda donde se incluyen las técnicas de recuperación de información y los documentos.
  3. Los resultados que se obtienen de la búsqueda.
El proceso de recuperación de información se lleva a cabo mediante consultas a la base de datos del buscador empleado, donde se almacena toda la información. El acceso a la base de datos se realiza por medio de un lenguaje de interrogación definido cuando se creó la base de datos.
Los elementos que permiten realizar una búsqueda con mayor grado de precisión y calidad son: los índices, palabras clave y tesauros.

Uno de los mayores problemas que surgen a la hora de recuperar la información es si lo que se recupera es mucha información o poca. Este fenómeno es lo que se conoce como silencio o ruido documental:
  • Llamamos silencio documental a los documentos que se encuentran en la base de datos pero que no han sido recuperados debido a que el criterio de búsqueda ha sido lo suficientemente específico.
  • Por el contrario, el ruido documental son aquellos documentos que se han recuperado de la base de datos pero que no son de vital importancia para el usuario. Aparece cuando el criterio de búsqueda es demasiado genérico.
Técnicas de recuperación de información

Una vez definido el término de recuperación de información, se procede a explicarles las diferentes técnicas que emplean los buscadores (Google, Yahoo!,....) para recuperar la información:

Directorios o índices temáticos

Los resultados se estructuran jerárquicamente por temas o categorías principales que a su vez tienen subcategorías, y así sucesivamente, hasta proporcionar enlaces directos a otras páginas de internet. Estos resultados están condicionados por la información suministrada al directorio cuando se registra el sitio web.
Se requiere más soporte humano y mantenimiento debido a que tanto la selección como la clasificación e indización de recursos son llevados a cabo por personas.
Emplean algoritmos de búsqueda muy sencillos y la tecnología empleada es barata y sencilla.
Su principal uso es para realizar búsquedas generales.

Algunos de los buscadores que emplean este sistema de búsqueda y recuperación de la información son: Open Directory Project, Yahoo! o Terra.

Motores de búsqueda

Los motores de búsqueda se basan en un robot o software denominado "araña o spider" que se encargar de rastrear las páginas web automáticamente para recopilar información de sus contenidos e incorporarlos a la base de datos. Si consideran que un sitio web  es de importancia para el usuario se almacenan todas las páginas. En caso de que el sitio web no sea considerado de importancia para el usuario, únicamente se almacenará un número reducido de páginas.

La búsqueda se realiza a partir de palabras clave que el usuario introduce en el buscador y ,una vez consultada la búsqueda, se devuelven los resultados al usuario clasificados por orden de importancia.

En comparación con los directorios o índices temáticos, realizan una búsqueda más a fondo pero pueden devolver resultados que contengan la palabra clave pero que no tengan nada que ver con lo que el usuario solicita.

Son útiles para realizar búsquedas concretas.

Algunos motores de búsqueda son: Google o AltaVista.

Metabuscadores

No contienen una base de datos propia por lo que cuando un usuario realiza una búsqueda, éstos consultan las bases de datos de otros buscadores, analizan los resultados y devuelven sus propios resultados.

Son útiles para buscar información poco común, o para realizar búsquedas exhaustivas.

Ejemplo de metabuscadores: Metacrawler, Aleyares.

Buscadores verticales o motores de búsqueda temáticos

Un buscador vertical o motor de búsqueda temático, es un buscador especializado en un sector concreto, por lo que las búsquedas ofrecen resultados más precisos y actualizados ofreciendo al usuario herramientas de búsqueda avanzadas.

Funcionan de manera similar a los motores de búsqueda empleando un robot para rastrear la red, pero en este caso se rastrea un número limitado de páginas web sobre un tema concreto, lo que permite que tanto la obtención de la información como la creación del índice sean más especializados en el sector del que se trata.

Ejemplo de buscadores verticales: Nestoria, Wolfram Alpha.


No hay comentarios:

Publicar un comentario