El Internet se ve dividido en tres zonas, la superficial o surfaceweb, la Internet profunda o deep web y la Dark Web.
La Internet superficial se compone de páginas indexadas en servidores DNS con una alfabetización y codificación de página perfectamente entendible por los motores de búsqueda. Aquí se encuentran las páginas Web por las que navegamos a diario, pero no suponen la mayor parte de lo que realmente hay en la red: a esta parte de la red visible se le conoce como Surface Web. Esta parte de la red, hasta hace poco tiempo,se estimaba que sólo representaba aproximadamente un 4% del total.
En 2019, un completo estudio sobre la Dark Web realizado por la compañía Recorded Future, que en total ha analizado 260.000 páginas Onion, para conocer mejor el alcance de la red anónima Tor, concluyó que de los 55.828 dominios Onion diferentes, sólo 8.416 dominios estaban activos en la red anónima Tor lo cual viene a demostrar que ni una parte era tan grande ni la otra tan pequeña.
En WorldWideWebSize.com se encargan de sumar las páginas que han rastreado los grandes motores de búsqueda de Google, Bing y Yahoo y restan las que se solapan porque son las mismas. De esta forma obtienen una estimación más o menos fiable del tamaño de la Web indexada.
https://www.worldwidewebsize.com/
Puedes observar la evolución comparándola con datos de meses o años anteriores. O comparar el tamaño del index de Google o el de Bing en el que se observa como el tamaño que indexa Google es muy superior al de Bing.
Por otro lado, la Internet profunda está compuesta de páginas cuyos dominios están registrados con extensiones .onion y los nombres de los dominios están codificados en una trama HASH. Por tanto, la Internet profunda es un conjunto de sitios web y bases de datos que los buscadores comunes no pueden encontrar ya que no están indexadas.
El motivo por el que los motores de búsqueda no pueden indexar alguna página podría ser porque se trate de documentos o información oculta como Pdfs que no se encuentran en las páginas indexadas o simplemente listas de datos no públicas. Tampoco se indexará el contenido oculto intencionadamente, que requiere un programa o protocolo específico para poder acceder ni el contenido de acceso restringido como páginas protegidas con contraseña o contenido protegido por un Captcha. Lo mismo ocurre con el contenido que no es HTML como el contenido textual en archivos multimedia y otras extensiones como exe, rar, zip… Tampoco serán indexadas la páginas dinámicas obtenidas como respuesta a parámetros, por ejemplo los datos enviados a través de un formulario, ni las páginas que no tienen enlaces desde otras páginas.
En la Internet profunda se aloja el contenido privado, contenido alojado en servicios en la nube, los archivos p2p, pasarelas de pago como Paypal…
Y aun más escondida encontramos la Dark Web. Se trata de una zona oculta a los navegadores Web estándar y a la que solo podemos acceder utilizando la red anónima TOR (The Onion Router). En ella, se puede encontrar casi de todo. Venta de tarjetas de crédito clonadas, todo tipo de fármacos, drogas, armas o pornografía infantil hace de la Dark Web el escenario perfecto para el crimen debido a la dificultad de localizar a quien se esconde detrás, gracias al anonimato que proporciona TOR. Que sea difícil no significa que sea imposible ni que un delito deje de serlo. Utilizar la red TOR no es ilegal, incluso puedes encontrar información interesante no accesible desde la Surface Web. Puedes visitar una página que ofrece venta de drogas o de venta de armas sin ser un delito pero si supone un acto delictivo comprar un arma de forma ilegal o la compra de drogas. En el caso de la pornografía infantil la ley es más estricta ya que es un delito visitar cualquiera de esta páginas aunque no descargues nada.