miércoles, 2 de marzo de 2016

Invisible web profunda

Se denomina web profunda o deep web aquella parte de internet que no es indexada por los buscadores tradicionales, en contraposición a la web superficial o visible. Google, por su configuración, no puede rastrear ciertos sitios por razones técnicas: webs que impiden explícitamente recuperar su contenido, páginas que requieres registro y log in de autenticación y contraseña (la web propietaria), redes privadas, páginas cuyo nombre no ha sido registrado según el sistema oficialmente reconocido (web privada), etc. Es una web diseñada en ocasiones para saltarse los buscadores. En otros casos, como es el de la web opaca, los contenido desaparecen porque se trata de URLs desconectadas (sin links desde otras páginas) o por las propias limitaciones de indización de los buscadores, Por último, en la web realmente invisible se pueden encontrar páginas creadas dinámicamente, lo que significa que se genera automáticamente a partir de los datos que introduce el usuario y cuyas bases de datos sólo se extraen con una petición explícita, es decir, son relacionales.




Al parecer todo este conjunto de páginas, como en una especie de fenómeno iceberg, ocupa alrededor del 96% de la información que circula por la red y está diseñada para garantizar el anonimato y asegurar la no trazabilidad de su navegación si bien hay otras diseñadas para un uso científico y académico específico y cuyas bases de datos contienen artículos, documentos, libros, revistas, etc. Algunos ejemplos de estas últimas son AcademiaeduJurn o, en español, Ciencia.


No hay comentarios:

Publicar un comentario