Todos estamos muy acostumbrados a teclear “google.com” en nuestro navegador y empezar a buscar todo tipo de páginas. El “buscador” tal o el “buscador” cual está en boca de todos, sin embargo, pocos saben que en realidad, lo que estamos utilizando es una aplicación muy concreta de una “biblioteca digital”, en este caso, una biblioteca cuyos “libros” son todas las páginas que componen Internet.
El estudio e investigación de las bibliotecas digitales corresponde a una rama de la informática llamada Information Retrieval o “Recuperación de la información”, también abreviado como “IR”, y abarca temas como la búsqueda, recuperación, catalogación y preparación de gran cantidad de datos, ya sean estos en forma de texto, multimedia o de cualquier otro tipo.
Las bibliotecas digitales existen mucho antes de los buscadores de Internet, y sus aplicaciones han sido muy variadas: desde esos terminales de pantalla de fósforo verde que encontrábamos en nuestras bibliotecas públicas, hasta los CD-ROM con catálogos de productos o textos de todo tipo (jurídicos, científicos, publicaciones, etc.).
Podemos definir sencillamente una biblioteca digital como “una colección organizada en diversos formatos digitales para los cuales existen servicios tales como clasificación, búsqueda, recuperación y administración”. En esta definición vemos que se habla de “diversos formatos digitales”, y de ciertas tareas que podremos hacer: clasificar, buscar, recuperar y administrar.
Si pensamos en Google, el buscador por excelencia, veremos que cumple (más o menos) con esta definición: almacena una colección organizada en diversos formatos (imágenes de cualquier tipo, textos en formato HTML o PDF, noticias de periódicos…), permitiendo su clasificación (según su relevancia), búsqueda (tecleando las palabras de búsqueda y haciendo clic en “Buscar”), recuperación (llevándonos hasta URL donde reside la información original o a través de su caché) y administración (con la página de preferencias).