viernes, 25 de febrero de 2011

Internet Invisible

Es el término utilizado para describir toda la información disponible en Internet que
no es recuperada interrogando a los buscadores convencionales. Generalmente,es la
información almacenada y accesible mediante bases de datos.
El 90% de las bases de datos están públicamente disponible en Internet, los robots de
los buscadores solo pueden indicar su página de entrada y son incapaces de entrar
dentro de las tablas e indicar su registro,les falta seleccionar sus opciones y teclear
una consulta para extraer sus datos.
La información almacenada es por consiguiente''invisible'' a estos,ya que los
resultados se generan en la contestación de páginas que no tienen una URL fija y que
se construyen en el mismo instante desapareciendo una vez cerrada la consulta.
Por cada millón de páginas visibles hay otros 500 o 550 millones ocultas.
La información pública y gratuita del web invisible es actualmente de 400 a 550 veces
mayor que el web visible.
Comprende todos aquellos sitios cuya información puede ser indexada por los robots
de los buscadores convencionales y recuperada casi en su totalidad mediante una
consulta a sus formularios de búsqueda.
Las características principales de los sitios de la web visible son:
1. Su información no está contenida en base de datos
2. Es de libre acceso
3. No requiere la realización de un proceso de registro para acceder
Mayoritariamente está formada por páginas o archivos con una URL fija y accesibles desde otro enlace.


Web invisible
La principal causa de Internet profunda es la imposibilidad de los motores de
búsqueda de encontrar el 100% de la información existente en Internet. Si los
buscadores pudieran acceder a toda la información desaparecería, pero esto es
imposible porque siempre existirán páginas privadas. Estos son los distintos
motivos:
Causas
En el año 2000 se estimaba que el tamaño del
7.500 Terabytes de datos en unos 550.000 millones de documentos. Para
comparar se estima que en aquella época la
Terabytes.
Estimaciones basadas en la extrapolación de la Universidad de California de
Berkeley especula que actualmente el
TeraBytes

TamañoInternet Profundo era deInternet Superficial ocupaba 167Internet Profundo debe tener unos 91.000
Hay dos razones por las cuales un motor de búsqueda no contiene una
página: barreras técnicas que prohiben el acceso y decisiones para excluirla.
¿Por qué Algunas Páginas son Invisibles?
Barreras técnicas:
Se requiere MECANOGRAFÍA y/o JUICIO
páginas web requiere que se mecanografíe algo o se examine una página y se
seleccione una combinación de opciones, los motores de búsqueda son
incapaces de proceder.
·¿POR QUÉ?
Programas robot llamados arrastran por la web buscando el contenido de los motores de búsqueda. Estas arañas navegan la web siguiendo los enlaces en las páginas web que ya están
en la base de datos de su motor de búsqueda. Si no hay ningún enlace a una
página, una araña no puede "verlo". Ellos no tienen la capacidad de
mecanografiar o pensar en ninguna serie de caracteres.
Las páginas creadas como resultado de una búsqueda se les llama páginas
Las bases de datos de los motores de búsqueda son creadas porspiders, programas robot de computación que se"dinámicamente generadas"página web diseñada para llevar la respuesta y enviarla a tu ordenador. A menudo la página no se almacena en ninguna parte después, porque su
contenido único probablemente no es de utilidad para muchas otras personas.
Lo opuesto a una página "dinámica" es una página
estáticas residen en servidores, cada una identificada por un URL único, y
esperando ser recuperada cuando su URL es invocada. Los
encontrar una página estática si un enlace a ella aparece en cualquier otra
página que ellos "conocen".
Cualquier contenido no incluído en páginas estáticas enlazadas hacia algún
otro sitio permanece invisible. Se debe buscar en una base de datos directamente para encontrarlas.
La incapacidad de los páginas de Web Invisible.
Categoría 1:
de búsqueda puede ser enteramente o parcialmente invisible o visible, dependiendo de cuánto está contenido en páginas estáticas con enlaces.Ejemplos de sitios con bases de datos con opción de búsqueda incluyen a la mayoría de los motores de búsqueda como Google o Northern Light o AltaVista. Los contenidos de todas los catálogos de bibliotecas on-line que no requieren una contraseña son también web invisible.
Categoría 2:
contraseña están cerrados para los  debido a que requieren mecanografiar algo que los  "saber". Los contenidos de estos sitios es muy poco probable que estén en cualquier motor de búsqueda general de la Web. Esto incluye todos los recursos que existen que requieren contraseña.


 
FORMATO de la página:páginas porque el formato del documento sería buscado raras veces o sin éxito por los usuarios del motor de búsqueda. No hay ninguna razón técnica para que ellos deban excluirlas, sólo es una política tomada por muchas compañías de motores de búsqueda.
:Los motores de búsqueda pueden escoger no incluir optimizados para "leer" HTML, el lenguaje básico de la Web. Estos otros tiposde lenguajes de programación contienen códigos y requerimientos de formato que son incompatibles con HTML. HTML puede llevar enlaces a estas páginas, pero no el texto completo de su contenido en su formato especial.
EXCEPCIONES
- Google ahora tiene la habilidad de buscar el texto completo de muchos archivos PDF convirtiendo estos archivos a texto, y colocando el texto en HTML de manera que pueda trabajar como una página web
ordinaria en la base de datos de Google. En los resultados de la búsqueda aparece un enlace al documento original completo en PDF.
- Las bases de datos imagen que , AltaVista Google, y otras compañías de motores de búsqueda ofrecen, están estructuradas para manejar estos tipos de archivos con menos texto.


·Páginas que el motor de búsqueda escoge excluir
La respuesta a la búsqueda es colocada en una"estática". Las páginasspiders puedenspiders de mecanografiar y pensar causa dos tipos deel contenido de bases de datos especializadas con opciónRequieren contraseña. Todos los sitios que requieren unaspiders de los motores de búsquedaspiders no pueden
Internet Invisible

No hay comentarios:

Publicar un comentario