miércoles, 24 de abril de 2013

Business Intelligence

A continuación les voy a hablar del Business Intelligence (Inteligencia Empresarial o Inteligencia de Negocios), un sistema de información muy utilizado en la actualidad tanto en empresas pequeñas como en las grandes:

¿Qué es Business Intelligence?

El Business Intelligence (Inteligencia Empresarial) se define como "la transformación de los datos de una compañía en conocimiento para obtener una ventaja competitiva".

Desde un punto de vista más práctico y asociándolo directamente a las tecnologías de la información, se trata de un conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.

Por lo tanto, ya no se trabaja únicamente con datos e información sino que también se incluye el conocimiento que sirve para incorporar nuevas experiencias e información y ayudar a mejorar la toma e decisiones en una empresa.

En general, Business Intelligence es "la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se puede optimizar el proceso de toma de decisiones en los negocios".

¿Cómo funciona?




Por lo general, Business Intelligence extrae los datos de la empresa de distintas fuentes mediante las herramientas o técnicas ELT (extraer, cargar y transformar) o actualmente ETL (extraer, transformar y cargar) y se almacenan en un almacén de datos temporal denominado datawarehouse.
Más adelante, se cargan los datos contenidos en el datawarehouse en una base de datos OLAP (On-Line Analytical Proccesing).
Por último, la información se trata y consulta en la base de datos OLAP mediante los visores disponibles, según la herramienta de Business Intelligence.

Datawarehouse y Datamart

Se trata de los principales componentes de orígenes de datos de Business Intelligence que existen en la actualidad:

Datawarehouse: es una base de datos corporativa caracterizada por integrar y depurar información de una o más fuentes diferentes. Su objetivo es separar los sistemas operacionales de las necesidades de información para la gestión de manera que los cambios producidos en uno de ellos no afecte al otro.

Las características de datawarehouse son:
  • Integrado. Los datos almacenados en el datawarehouse deben integrarse en una estructura consistente y fiable.
  • Temático. Los datos se almacenan por temas para facilitar el acceso a los usuarios.
  • Histórico. Carga distintos valores que toma una variable en el tiempo para hacer comparaciones y analizar su evolución.
  • No volátil. La información almacenada en un datawarehouse puede ser leída, pero no modificada.
  • Contiene metadatos (datos sobre datos).
Datamart: es una base de datos especializada, departamental, orientada a satisfacer las necesidades específicas de un grupo particular de usuarios.
Dispone de un estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afectan a los procesos de dicho departamento. Puede almacenar datos obtenidos directamente de un datawarehouse, o integrar una mezcla de distintas fuentes de información.

Hay dos tipos de datamarts:

  • Datamart OLAP: basada en los cubos OLAP, que se construyen agregando, en función de las características de cada departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. Están orientadas al procesamiento analítico.
  • Datamart OLTP: pueden basarse en un simple extracto del datawarehouse pero lo normal es incluir mejoras en su rendimiento en base a las características de cada departamento. Están orientadas al procesamiento de transacciones.


Continuando con los aspectos destacados de Business Intelligence, me gustaría comentarles sus principales productos que existen hoy en día:

- Cuadro de Mando Integral (CMI). También conocido como Balanced ScoreCard (BSC), es una herramienta que permite alinear los objetivos de las diferentes áreas que componen la empresa con la estrategia de ésta.

-Sistemas de Soporte a la Decisión (DSS). Ayudan a los gerentes de las empresas a tomar decisiones.

-Sistemas de Información Ejecutiva (EIS). Facilitan al ejecutivo de la empresa el acceso a la información interna y externa al negocio con el objetivo de conseguir el éxito de éste.


Por último me gustaría dejarles la siguiente reflexión: ¿Realmente crees que Business Intelligence mejora el rendimiento de las empresas?

Técnicas de recuperación de información en buscadores

En la presente entrada se procede a comentar las técnicas que emplean los buscadores de internet para recuperar la información que buscamos:

¿Qué es la recuperación de información?

Cuando hablamos de la recuperación de información nos estamos refiriendo a "la ciencia de la búsqueda de información en documentos electrónicos y digitales que se ocupa de la búsqueda de información dentro de los mismos, búsqueda de metadatos que describan documentos,  y búsqueda en bases de datos.
Los buscadores recuperan la información en textos, imágenes, sonido o datos de otras características.

En el proceso de búsqueda y recuperación de información intervienen tres elementos fundamentales:

  1. Usuario que realiza la búsqueda de información.
  2. Sistema de búsqueda donde se incluyen las técnicas de recuperación de información y los documentos.
  3. Los resultados que se obtienen de la búsqueda.
El proceso de recuperación de información se lleva a cabo mediante consultas a la base de datos del buscador empleado, donde se almacena toda la información. El acceso a la base de datos se realiza por medio de un lenguaje de interrogación definido cuando se creó la base de datos.
Los elementos que permiten realizar una búsqueda con mayor grado de precisión y calidad son: los índices, palabras clave y tesauros.

Uno de los mayores problemas que surgen a la hora de recuperar la información es si lo que se recupera es mucha información o poca. Este fenómeno es lo que se conoce como silencio o ruido documental:
  • Llamamos silencio documental a los documentos que se encuentran en la base de datos pero que no han sido recuperados debido a que el criterio de búsqueda ha sido lo suficientemente específico.
  • Por el contrario, el ruido documental son aquellos documentos que se han recuperado de la base de datos pero que no son de vital importancia para el usuario. Aparece cuando el criterio de búsqueda es demasiado genérico.
Técnicas de recuperación de información

Una vez definido el término de recuperación de información, se procede a explicarles las diferentes técnicas que emplean los buscadores (Google, Yahoo!,....) para recuperar la información:

Directorios o índices temáticos

Los resultados se estructuran jerárquicamente por temas o categorías principales que a su vez tienen subcategorías, y así sucesivamente, hasta proporcionar enlaces directos a otras páginas de internet. Estos resultados están condicionados por la información suministrada al directorio cuando se registra el sitio web.
Se requiere más soporte humano y mantenimiento debido a que tanto la selección como la clasificación e indización de recursos son llevados a cabo por personas.
Emplean algoritmos de búsqueda muy sencillos y la tecnología empleada es barata y sencilla.
Su principal uso es para realizar búsquedas generales.

Algunos de los buscadores que emplean este sistema de búsqueda y recuperación de la información son: Open Directory Project, Yahoo! o Terra.

Motores de búsqueda

Los motores de búsqueda se basan en un robot o software denominado "araña o spider" que se encargar de rastrear las páginas web automáticamente para recopilar información de sus contenidos e incorporarlos a la base de datos. Si consideran que un sitio web  es de importancia para el usuario se almacenan todas las páginas. En caso de que el sitio web no sea considerado de importancia para el usuario, únicamente se almacenará un número reducido de páginas.

La búsqueda se realiza a partir de palabras clave que el usuario introduce en el buscador y ,una vez consultada la búsqueda, se devuelven los resultados al usuario clasificados por orden de importancia.

En comparación con los directorios o índices temáticos, realizan una búsqueda más a fondo pero pueden devolver resultados que contengan la palabra clave pero que no tengan nada que ver con lo que el usuario solicita.

Son útiles para realizar búsquedas concretas.

Algunos motores de búsqueda son: Google o AltaVista.

Metabuscadores

No contienen una base de datos propia por lo que cuando un usuario realiza una búsqueda, éstos consultan las bases de datos de otros buscadores, analizan los resultados y devuelven sus propios resultados.

Son útiles para buscar información poco común, o para realizar búsquedas exhaustivas.

Ejemplo de metabuscadores: Metacrawler, Aleyares.

Buscadores verticales o motores de búsqueda temáticos

Un buscador vertical o motor de búsqueda temático, es un buscador especializado en un sector concreto, por lo que las búsquedas ofrecen resultados más precisos y actualizados ofreciendo al usuario herramientas de búsqueda avanzadas.

Funcionan de manera similar a los motores de búsqueda empleando un robot para rastrear la red, pero en este caso se rastrea un número limitado de páginas web sobre un tema concreto, lo que permite que tanto la obtención de la información como la creación del índice sean más especializados en el sector del que se trata.

Ejemplo de buscadores verticales: Nestoria, Wolfram Alpha.


domingo, 14 de abril de 2013

Buscadores actuales

En esta entrada se exponen los buscadores que más se utilizan en la actualidad como son: Google, Yahoo! y Bing:
¿Qué entendemos como buscador?
Un buscador es una página web que permite realizar búsquedas en la red ofreciendo al usuario consultar una base de datos en la cual se relacionan las direcciones de páginas web con su contenido. Son muy fáciles de utilizar ya que sólo necesitamos introducir las palabras clave acerca de lo que necesitamos obtener y se generará un listado de páginas web que contienen información relacionada con el tema solicitado.
Los buscadores se clasifican en tres tipos dependiendo de la manera en que obtienen las direcciones almacenadas en su base de datos. Los tipos de buscadores son: índices de búsqueda, motores de búsqueda y metabuscadores.
Actualmente los buscadores más utilizados por los usuarios de internet son: Google (65,09%), Yahoo! (15,89%) y Bing (13,10%).
Google es el buscador más utilizado hoy en día ya que es el más completo de los que se han creado hasta la fecha.

El objetivo de Google es organizar la información mundial y conseguir el acceso universal y de manera fácil y sencilla satisfaciendo las necesidades de cada usuario.

Fue creado en 1998 por Larry Page y Sergey Brin después de que éstos crearan en 1996 un motor de búsqueda llamado "BackRub" que se basaba en enlaces para determinar la importancia de las web.

De los tipos de buscadores mencionados anteriormente, se trata de un motor de búsqueda con robot que contiene una de las mayores bases de datos. Según datos recogidos de internet, Google es la cuarta base de datos informática más grande del mundo con cerca de 8.000 millones de páginas web.
El éxito de Google fue en gran parte gracias a la inclusión de un algoritmo denominado PageRank que organiza las páginas web obtenidas de la búsqueda por orden de mayor a menor importancia.

Las características más relevantes de Google son:

  • Incluye gran variedad de idiomas por lo que se puede utilizar en casi todos los países del mundo.
  • Proporciona un breve resumen de dos o tres líneas junto con la dirección de la página web conteniendo las palabras que ha introducido el usuario.
  • Incluye un botón "Me siento afortunado" mediante el cual se accede rápidamente a la información que éste desea.
  • Ofrece un servicio de búsqueda personalizada para que el buscador realice una búsqueda de acuerdo a las restricciones del usuario.
  • Almacena las páginas web en memoria caché para que en el caso de que falle el servidor y no se pueda obtener la dirección web, la caché proporcione dicha dirección.
A parte de la base de datos de páginas web, también ofrece otros servicios al usuario como son: Google Book Search (buscador de libros), Google Directory (búsqueda a partir de un tema determinado), Google Image Search (buscador de imágenes), Google News (portal de noticias), Google Catalogs (busca en catálogos), Google Schooler (busca información en documentos académicos), Froogle (busca productos y compara precios), Google Maps (permite localizar direcciones y ver mapas), ofrece un servicio de correo electrónico como es Gmail.
Apareció en 1994 como el primer buscador que se introducía en internet gracias a dos estudiantes de la Universidad de Stanford, Jerry Yang y David Filo, surgiendo como un directorio web que ordenaba los elementos de búsqueda por jerarquías, pero con su evolución y desarrollo se convirtió en un buscador. 
Tras la creación de Google y su fuerte desarrollo e impacto en los usuarios, Yahoo! pasó a ser lo que se denomina un "Portal de Contenidos".

Se trata de un índice de búsqueda cuya misión es ser el servicio global de Internet más importante para consumidores y negocios.

Como se ha comentado, su evolución a dado lugar a un gran motor de búsqueda en el que se han incluido varias mejoras y aumento de servicios. Una de las mejoras a destacar es la inclusión del servicio "My Yahoo! Search" que ofrece al usuario realizar una búsqueda personalizada de modo que los usuarios pueden ir almacenando los enlaces que deseen y pueden añadir comentarios personales.
Otra de las mejoras que se destaca del desarrollo de Yahoo! es la opción "Mi Web" en la que el usuario únicamente encontrará las páginas que ha visitado con anterioridad. Es un servicio parecido al de favoritos o al historial de un navegador. 

Las búsquedas en Yahoo! consisten en introducir las palabras clave, y el buscador devuelve:
  1. Las categorías de Yahoo! que coinciden con las palabras clave.
  2. Las páginas web que encajan con las palabras clave.
  3. Categorías de Yahoo! que contienen registros de las páginas web.
Algunos de los servicios que ofrece Yahoo! son:
  • Yahoo! Noticias permite buscar las noticias de la actualidad.
  • Proporciona servicios de comunicación como Yahoo! Mail y Yahoo! Messenger.
  • Permite buscar imágenes y compartirlas.
  • Mi Web Yahoo! permite organizar los enlaces favoritos para tener un rápido acceso a ellos, es decir, permite almacenar direcciones de sindicación de contenidos con el objetivo de guardarlas y utilizarlas más tarde.
  • Permite bloquear sitios web que no se desea que aparezcan en los resultados.

El motor de búsqueda de Yahoo! es uno de los más populares del mundo únicamente superado por el buscador Google.
Anteriormente conocido como Live Search, Windows Live Search y MSN Search, salió a la luz el 3 de junio de 2009 cuando Microsoft lo incorporó a Internet como un nuevo buscador. Hoy en día es el tercer buscador más utilizado por detrás de Google y Yahoo!.

Bing es un motor de búsqueda renovado que proporciona mejores resultados que otros buscadores ya que rastrea más a fondo la red para proporcionar resultados. Una vez encontrados los resultados, los organiza y se los devuelve al usuario de tal manera que obtiene lo que realmente necesita.

Su funcionamiento es simple y sencillo, en su página principal tiene un cuadro de texto donde se introducen las palabras clave de la búsqueda. Una vez introducidas, Bing busca en su base de datos y devuelve los resultados relacionados con la búsqueda. Estos resultados no contienen únicamente datos de páginas web sino que también incluyen vídeos, imágenes o noticias relacionados con la búsqueda.

Se aprecian dos grandes cambios como son la lista de sugerencias de búsqueda en tiempo real y una lista de búsquedas relacionadas denominada "Panel de explorador".

Entre los servicios que ofrece destaca la opción de realizar una búsqueda segura que filtra el contenido para adultos en los resultados de la búsqueda. Ofrece tres niveles de búsqueda segura: estricta, filtra texto,imágenes y videos para adultos; moderada, filtra imágenes y videos pero no el texto; desactivada, no se filtra ningún tipo de contenido. Este sistema de búsqueda segura no es 100% fiable ya que en algunos casos no detecta todo el contenido y se pueden dejar cosas sin filtrar.

Las características principales de este buscador son:
  • El fondo de pantalla del buscador cambia todos los días.
  • Se trata de un buscador de alta velocidad ya que proporciona rápidamente los resultados de la búsqueda.
  • Está disponible en una gran cantidad de idiomas.
  • Muestra búsquedas que están relacionadas con el tema solicitado.
  • Permite pre-visualizar el contenido de las páginas web al situar el cursor encima del enlace. También se pueden pre-visualizar los vídeos sin necesidad de adentrarnos en el sitio web.
  • En los servicios de compra online buscados mediante Bing, muestra los productos más económicos. Esto también ocurre si queremos obtener billetes para viajes en avión.
  • Ofrece un servicio de traductor online.

Diferencias y similitudes de Google, Yahoo! y Bing
La principal diferencia entre estos buscadores está en el tipo de buscador del que se trata:
  • Por un lado están Google y Bing que son motores de búsqueda en los que un programa denominado araña o robot rastrea la web y va almacenando las direcciones de las páginas web en su base de datos.
  • Por otro lado, Yahoo! pertenece a los índices de búsqueda (primer tipo de buscador que apareció). La base de datos la construye un equipo humano y las páginas web contenidas en dicha base de datos están organizadas por categorías y subcategorías en función de su contenido.
  • Por último están los metabuscadores que aunque no se haya descrito ningún buscador perteneciente a este grupo es conveniente conocerlos. No contienen una base de datos propia por lo que utilizan las bases de datos de varios buscadores para proporcionar resultados. Un ejemplo de metabuscador es Metacrawler.
Otra de las grandes diferencias está en el tamaño de la base de datos de cada buscador. La base de datos más grande es la de Google motivo por el cual proporciona  mayores resultados que sus competidores.

A la hora de obtener los resultados de las búsquedas, Yahoo! proporciona la respuesta concreta al tema solicitado. En cambio tanto Google como Bing al tratarse de motores de búsqueda pueden devolver resultados que contengan las palabras clave introducidas pero que no tengan nada que ver con la búsqueda deseada.

Bing surgió para competir con Google pero lo cierto es que el único buscador que está capacitado para competir con Google es Yahoo!. Bing tiene prácticamente la misma interfaz que Google exceptuando los temas de fondo que cambian a diario.

Por último, en cuanto a la búsqueda de imágenes, Bing está por delante de Google y Yahoo! debido a que tiene mayor número de funcionalidades relativas a imágenes o videos.

De entre las pocas semejanzas que se pueden obtener entre estos tres buscadores destacan las opciones de búsqueda avanzada y búsqueda en tiempo real ya que los tres poseen ambas características.
En cuanto a la búsqueda avanzada, Google está un escalón por encima ya que permite establecer un mayor número de opciones para que la búsqueda se centre únicamente en lo que el usuario necesita.


- Referencias bibliográficas: