Los arqueólogos de Internet, reconstruyendo páginas web perdidas

Firstmouseunderside (1)

Primer ratón (Fuente: Wikipedia)

Un estudio de Technology Review revela un hecho, que aunque suene un poco sensacionalista, es totalmente cierto: Internet se está perdiendo. La conclusión es que los datos se pierden con una media del 11% en un año y 27% en dos.

Al hablar de webs perdidas por supuesto se incluyen por ejemplo foros de discusión, post de bloggers, etc, además de páginas web de todo tipo.

Los investigadores Hany SalahEldeen y Michael Nelson analizaron este hecho después de estudiar e intentar recuperar todos los recursos donde podía haber publicaciones, comentarios, etc, que hablaran sobre la revolución egipcia de 2011. Estos recursos son importantes ya que pueden servir en el futuro como archivo histórico. Fue durante esta búsqueda cuando encontraron que muchos de estos comentarios, posts, etc, estaban desapareciendo cada vez más rápido. De esta forma comenzaron a estudiar la frecuencia y la velocidad de esta desaparición de información.

Algunas de las causas de esta pérdida de información pueden ser un dominio que se elimina, un archivo que se restaura, una cuenta de usuario eliminada y luego restaurada, etc.

¿Cómo se puede recuperar entonces esta información?, pues buscando restos dejados por la web, como por ejemplo retweets, comentarios, etc. y buscar, buscar y buscar mucho por Internet.

Pero lo realmente interesante es que este evento puntual pueda derivar en una nueva disciplina en Internet: la arqueología web. Hay muchas formas de recuperar la información desde incluso servidores, copias de seguridad o simplemente buscando por Internet. Como podéis ver, el perfil de aquellos que nos interesa la seguridad informática encaja bastante en este perfil ...

Hoy día ya existe una web que se dedica a almacenar webs desde 1996: The Internet Archive. Pero claro, guarda las páginas más conocidas o las que se le indique (es imposible almacenar todas las webs de Internet), en cambio lo interesante del arqueólogo web es que tenga que investigar, buscar por Internet, analizar documentación, etc, para recuperar una web que existió, tenía información y queremos recuperar pasado un tiempo.

Muy interesante, pronto veremos auténticos cyber Indiana Jones ;).

Ya hemos hablado antes en CyberHades sobre arqueología informática (aunque de otras disciplinas) en esta entrevista que nos hicieron en el programa de Radio3 "Fallo de Sistema" ó este post sobre la recuperación del código fuente del juego "Prince of Persia".

Visto en Mashable.