Ir al contenido principal

Explorar los rincones ocultos de Internet

Un día del verano pasado, el motor de búsqueda de Google alcanzó un hito sin que prácticamente nadie se enterara. Añadió un billón de direcciones a su lista de páginas de Internet. Pero por increíblemente elevado que parezca ese número, representa sólo una fracción de la totalidad de la Red.

Más allá de ese billón de páginas está una Red todavía más grande de datos ocultos: información financiera, catálogos de com­pra, billetes de avión, investigación médica y cualquier otra información que se haya guardado en las bases de datos que resultan invisibles en muchos casos para los buscadores.

Los problemas con los que tropiezan los motores de búsqueda más importantes al penetrar en la llamada Red profunda con­tribuyen de manera esencial a explicar por qué todavía no pueden dar una respuesta sa­tisfactoria a la pregunta de "Cuál es la mejor tarifa para viajar de Nueva York a Londres el jueves". Las respuestas a estas preguntas se podrían obtener fácilmente... si los moto­res de búsqueda supieran cómo hallarlas.

Actualmente está cobrando forma un nue­vo tipo de tecnologías que extenderá el al­cance de los motores de búsqueda para que puedan llegar hasta los rincones ocultos de la Red. Cuando eso ocurra, no sólo mejorará la calidad de los resultados de la búsqueda, sino que también cambiará la forma en que numerosas empresas hacen negocios en Internet.

"La Red rastreable es la punta del ice­berg", explica Anand Rajaraman, cofun­dador de Kosmix, una nueva empresa de búsqueda en la Red profunda. Kosmix ha desarrollado programas que asocian las búsquedas con las bases de datos que tienen más probabilidades de ofrecer información relevante, y luego ofrecen una visión gene­ral del tema obtenida de múltiples fuentes.

"La mayoría de los buscadores te ayudan a encontrar una aguja en un pajar" dice Ra­jaraman, "pero lo que nosotros tratamos de hacer es ayudar a la gente a explorar el pajar".

Ese pajar es inmensamente grande. Con millones de bases de datos conectadas a la Red, e infinitas posibilidades de combinar los términos de búsqueda, resulta sencilla­mente imposible para cualquier motor de búsqueda cribar todas las combinaciones

posibles de datos. Para extraer informa­ción significativa de la Red profunda, los motores de búsqueda tienen que analizar los términos empleados por los usuarios para la búsqueda y determinar el modo en que formularán esas consultas en bases de datos determinadas.

La profesora Juliana Freire de la Univer­sidad de Utah está trabajando en un ambi­cioso proyecto llamado DeepPeep [Ojeada Profunda] que tiene como objetivo rastrear e indexar todas las bases de datos que están en la Red pública. La extracción de conte­nidos en ubicaciones de datos tan ocultas requiere un sofisticado juego informático de adivinanzas.

DeepPeep empieza por hacer un pequeño número de consultas "de forma que luego podamos usarlas para avanzar en nuestro conocimiento de las bases de datos y elegir qué palabras buscamos".

Más allá del reino de las búsquedas de los consumidores, las tecnologías de la Red pro­funda podrían finalmente permitir que las empresas usasen la información de un modo diferente. Por ejemplo, una página web de noticias locales podría ampliar su información si permitiera a los usuarios entrar en los archivos públicos almacenados en bases de datos del Estado

http://www.elpais.com/articulo/internet/Explorar/rincones/ocultos/Internet/elpeputec/20090404elpepunet_1/Tes

Comentarios

Fry ha dicho que…
Esto es lo que hace 10 años (sí, ya sé, la prehistoria)llamábamos la Internet invisible?
L.R. ha dicho que…
Si...hace diez años y hoy en dia.
Justo ha dicho que…
Aunque Google recibe amplia repercusión por ser quien es, existen empresas que están haciendo trabajo en este campo desde hace tiempo. De hecho, unos vecinos tuyos, de Coruña, son de los que más esfuerzo han dedicado a esto internacionalmente hablando, tanto en la navegación y extracción de información estructurada procedente de la web, como de la búsqueda automática (o focused crawling) en la web. Echa un vistazo a http://www.denodo.com .

Justo.
L.R. ha dicho que…
Si, los conozco. He trabajado con ellos, he ido a charlas que han dado, y nos hemos encontrado en más de un sitio y en más de una ocasión. Son muy buen equipo, con muy buenos productos.....

Entradas populares de este blog

La Vigilancia Tecnológica en el desarrollo de un producto

LA VIGILANCIA TECNOLÓGICA EN EL DESARROLLO DE PRODUCTOS
LOPÉZ FORNIÉS, Ignacio (1); FERNANDEZ SORA, Alberto (2); MANCHADO PEREZ,
Eduardo (3); AGUSTÍN HERNANDEZ, Luís (4); ZABALA DIEZ, Enrique (5)

Un poco por casualidad, por que no lo estaba buscando, he encontrado este artículo. Me ha parecido bastante bueno, porque bajo mi punto de vista, explica la correlacion entre la VT y el desarrollo de nuevos productos. Un relación que no siempre se tiene en cuenta y que muchas veces no se valora en su justa medida.

Pensar que una empresa, a dia de hoy, se va a meter en un nuevo desarrollo sin haber tan siquiera explorado su entorno más próximo, es un poco ingenuo. El problema, es que este estudio del "Estado del Arte" pocas veces se tiene en cuenta a la hora de valorar el éxito final de un proyecto.

"El proyecto industrial de desarrollo de producto utiliza en las fases iniciales la vigilancia tecnológica para determinación de los objetivos, detectar nuevas ideas, conocer el estado de…

Referencias bibliográficas y fuentes sobre Vigilancia Tecnológica #VTIC

La patente de la Aspirina

Aspirina: la atribulada vida de una celebridad
El Dr. Felix Hoffmann (1868-1946) tenía dos pasiones. Una de ellas (Historia del arte) sólo le reportó gratificaciones personales. La segunda (Química) proporcionó a la humanidad una de sus más famosas invenciones: la Aspirina®.

El Dr. Hoffmann fue un digno heredero de una larga tradición en el alivio del dolor, la cual se remonta miles de años atrás y que tiene su hito moderno en el año 1897, con la síntesis del ácido acetilsalicílico (ASA). Este es el nombre del principio activo de la Aspirina®, que proviene de la palabra latina Salix (sauce), árbol del que los antiguos médicos brujos obtuvieron este principio activo por primera vez.

Siendo aún un campo fértil de estudio para la química moderna y la farmacología, esta "droga milagrosa" tiene muchas otras propiedades aparte del alivio del dolor. Un fármaco para el cáncer, las enfermedades cardiacas, el Alzheimer, los ataques de apoplejía, la infertilidad, la hipertensión y muchas …