lunes, 22 de octubre de 2007

Estrategia de Busquedas

Un poco de historia...
Se denomina web invisible o profunda a la información que no puede recuperarse con los mecanismos de búsqueda comunes. Estos mecanismos tratan de abarcar toda la web, pero se calcula que los mayores motores de búsqueda alcanzan a indizar sólo entre un tercio y la mitad de los documentos disponibles. La web invisible no sólo es de mayor tamaño que la web visible o superficial sino que crece a mayor velocidad. Asimismo, mucha información disponible en la web profunda, como la que se encuentra en bases de datos, tiene un alto valor potencial para el usuario.
La multiplicidad de mecanismos de rastreo, indización, recuperación y organización de documentos en la web puede causar confusión al usuario común. Además, el número de motores de búsqueda, así como los híbridos resultado de la combinación de diferentes mecanismos, ha aumentado. Esto hace necesario clasificar y diferenciar los tipos de herramientas disponibles.

El término “web invisible” fue utilizado por primera vez por la Dra. Jill Ellsworth para denominar la información que resultaba “invisible” para las maquinarias de búsqueda convencionales en la web (Ellsworth, 1995). También se la denomina “web profunda” (deep web), por oposición a la “web superficial” (surface web) cuya información puede recuperarse con los buscadores de Internet (Bergman, 2000). Un buscador es un sitio web cuyo propósito principal consiste en que el público pueda encontrar información. Estos mecanismos y el software que los apoya tratan de indizar toda la web, por lo que generan y mantienen enormes bases de datos recuperables. A pesar de su pretendida exhaustividad, se calcula que los mayores motores de búsqueda indizan sólo entre un tercio y la mitad de los documentos disponibles al público en la Red (Turner, 2003). Un estudio muy citado de Bright Planet ha estimado que la información contenida en la web invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a mucha mayor velocidad (Bergman, 2000). Un estudio posterior de Cyveillance calcula que el tamaño de la web profunda es 275 veces mayor que el de la web visible (Murray, 2000, citado en Ouf, 2001). Estimaciones posteriores, en cambio, señalan que el tamaño de la web invisible es sólo entre 2 y 50 veces mayor que el de la web visible (Sherman y Price, 2001b). Las diferencias en las cifras se deben a las diferentes metodologías utilizadas por los autores. En cualquier caso, el valor de la información contenida en la llamada web profunda justifica su estudio y el de sus formas de acceso.

No hay comentarios: