‘Deep web’: lo que se esconde bajo la superficie de internet
Una parte sustancial del contenido de la red de redes está sumergida bajo las aguas de los buscadores convencionales a profundidades variables. Se trata de la ‘deep web’, ese vasto territorio sin indexar que alberga nueve décimas partes de la información total de internet, y que no debe confundirse con su rincón más oscuro, la ‘dark web’.
Antes de centrarse en la ‘deep web’ tal y como hoy la conocemos, conviene hablar de sus antecedentes. Los intentos de transformar internet en un universo de información regulada y ordenada se remontan al científico y programador británico Tim Berners-Lee. Partía de un precedente, el proyecto Xanadú, con el que el sociólogo Ted Nelson se propuso, ya en 1960, interconectar una red planetaria de ordenadores y dotarlos de algo así como “un listín telefónico y un mapa”. En línea con el pensamiento de Nelson, entre 1980 y 1989, Berners-Lee y su equipo desarrollaron para la incipiente red de redes un código común (el lenguaje HTML), un protocolo general de funcionamiento (HTTP) y un sistema para localizar objetos (las URL, es decir, el equivalente a los números de teléfono que pedía el proyecto Xanadú). Es decir, los elementos constitutivos de la llamada World Wide Web, concepto que engloba todos los contenidos accesibles en internet mediante un navegador web.
Con el tiempo, tal y como explica la experta en tecnología Valentina Giraldo, “la necesidad de organizar, clasificar y gestionar mejor semejante volumen de información hizo que surgiesen los motores de búsqueda”, herramientas como “las primerizas Wandex (1993) y Aliweb (1994) o las algo más recientes Lycos y Altavista, sustituidas o eclipsadas a medio plazo por el hoy omnipresente Google”. Giraldo añade que los motores se convirtieron en “la linterna que permitió a los usuarios orientarse en lo que hasta entonces había sido, en gran medida, un laberinto de sombras”.
Lo que no sale en los mapas
Pese a todo, el haz de luz no consiguió penetrar en todos los rincones. Ya en 1994, la divulgadora tecnológica Jill Ellsworth alertaba sobre la existencia de un volumen creciente de contenidos que se mantenían fuera del radar, inaccesibles para los motores de búsqueda. Ella bautizó a ese reducto de oscuridad como “la internet invisible” y calculó, de manera conservadora, que podía suponer alrededor del 55% del contenido global de la red.
Libro - Anuario de Migración y Remesas 2024
En 2001, otro notable curador de tendencias digitales, Michael Bergman, empezó a referirse a esa cara oculta de internet, la que Google no detecta, como ‘deep web’ o ‘red profunda’. Bergman llegaba, además, a conclusiones que por entonces resultaron asombrosas: la red sumergida reunía ya un volumen de información hasta 500 veces superior al de la visible. Es decir, que internet se había convertido, en muy pocos años, en un profundo océano apenas explorado mientras los motores de búsqueda se limitaban a chapotear en su superficie.
Más de nueve de cada diez páginas
Hoy en día, según comenta Rafael Chelala, director académico del Programa de Innovación en Tecnología (PIT) de la Deusto Business School, “la Red es un ‘iceberg’ cuya parte visible desde la superficie son los contenidos indexables, mientras la ‘deep web’ es ese grueso que permanece bajo las aguas”.
¿Qué se puede encontrar en la ‘deep web’?
Mario Micucci, ingeniero informático en Welivesecurity, explica que “en esta amplísima porción de internet cabe un poco de todo, de bases de datos y servidores en nube a servicios de pago, pero lo que predomina es el contenido perfectamente legal, ya sean bases de datos gubernamentales, archivos científicos, sitios web de membresía privada (como pueden ser algunos foros) o un largo etcétera”. En ese etcétera tendrían cabida también cuentas bancarias con acceso encriptado, currículums en línea, blogs restringidos o bases de datos médicos.
Chelala precisa que “el contenido de las redes sociales o las páginas dinámicas que generan plataformas convencionales no es, en sentido estricto, ‘deep web’, ya que se puede acceder a ella mediante buscadores, aunque estarían en un nivel intermedio entre las profundidades y la superficie”.
Nada que ver con el reducto oscuro
Para el académico de Deusto, mención aparte merece la ‘dark web’, que es, por definición, “una parte de la ‘deep web’ que alberga mayoritariamente contenidos ilícitos, peligrosos o criminales”. Si la ‘deep web’ constituye al menos nueve décimas partes de la información total de internet, la ‘dark web’ equivale a apenas el 0,1%. Chelala añade que viene a ser “un gigantesco barrio criminal repleto de mercados ilícitos que crecen de manera exponencial, al mismo tiempo que los propios contenidos y la distribución del acceso a internet”.
Por lo general, la ‘dark web’ es accesible únicamente a través de herramientas complejas que facilitan el anonimato y la falta de trazabilidad de conexiones, lo que favorece la comisión de delitos y aparta a la víctima del criminal, rompiendo cualquier posible relación de cercanía o empatía y dificultando enormemente las investigaciones policiales.
La ‘dark web’ abarca un conjunto de redes (DarkNets) que se ocultan de manera deliberada a los buscadores convencionales enmascarando sus direcciones IP. Para acceder a ella hay que recurrir a ‘software’ especializado o a motores de búsqueda específicos como la red TOR (siglas de The Onion Router) y DuckDuckGo. TOR, en concreto, se basa en una técnica de enrutado (selección de rutas de navegación) por capas que garantiza el anonimato y la privacidad del usuario y deriva de los protocolos de protección de las comunicaciones utilizados por la Marina de los Estados Unidos.
Aunque se trata de un receptáculo preferente de actividades criminales, Chelala precisa que “en la ‘dark web’ hay también contenidos legítimos que utilizan las herramientas del anonimato y la encriptación para actividades lícitas, como pueden ser la expresión de opiniones políticas en lugares del planeta en que no se permite o el intercambio de información muy sensible en foros con altos estándares de privacidad”.