La catalogación bibliográfica semántica
“Queremos ganarle a Google”

Sala de lectura de la Biblioteca Regional de Sajonia-Biblioteca fiscal y universitaria de Dresden (SLUB) © SLUB | Photo (detail): © SLUB

En la Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB), una de las mayores bibliotecas de Alemania, ubicada en el estado federado de Sajonia, se desarrolló un programa basado en la tecnología semántica, que permite una novedosa y fácil consulta de catálogo. El doctor Achim Bonte, director general subrogante de la biblioteca, explica las ventajas de este sistema bautizado como SLUBsemantics.

¿Qué se entiende por red semántica?

Dr. Achim Bonte | © SLUB Todo nuestro sistema computacional se basa en un sistema binario. A partir de esto, la serie de signos G, o, e, t, h, e, se puede traducir, por ejemplo, en una serie de ceros y unos. La web semántica le enseña a hablar a la informática, por así decirlo. Es decir, los datos ya no se procesan solo mecánicamente, sino que se los vincula con contenidos. Esto permite crear una red semántica para un determinado concepto, al que se le adjudican adicionalmente otros conceptos. Todo ello ocurre en un lenguaje informático descriptivo llamado Resource Description Framework (RDF). El resultado, es que el computador sabe qué significado asociamos a la serie de signos Goethe, a saber: un escritor del siglo XVIII que entre otras obras, es autor del Fausto.

En muchos idiomas y sin ambigüedades

Su biblioteca ha elaborado el catálogo semántico en conjunto con la joven empresa Avantgarde Labs. ¿Qué diferencia al SLUBsemantics de un catálogo convencional?

La consulta al interior de nuestro catálogo es multilingual. Si una persona ingresa, por ejemplo, "propulsión automática", van a aparecer resultados en inglés o polaco. Además, SLUBsemantics traduce desde el lenguaje cotidiano al lenguaje técnico y vice y versa. Uno busca "Carne podrida" y aparece todo lo que hay sobre el tema de la seguridad alimentaria. O alguien ingresa "Obesidad" y le van a aparecer resultados relativos a sobrepeso y adiposis. Eso no es posible en la búsqueda unidimensional de cadena de caracteres de los catálogos normales.

SLUBsemantics soluciona también las ambigüedades idiomáticas. Si alguien ingresa "Python", podría estarse refiriendo a la serpiente, al lenguaje de programación o al grupo de comediantes de Monty Python. Los catálogos normales le entregarían todos los resultados mezclados. En nuestro catálogo, los resultados va a aparecer ordenados por áreas: biología, informática y cine.

Video: Die Katalogsuche SLUBsemantics

SLUBsemantics se basa en conceptos ya existentes…

Sí. Usamos tecnologías ya existentes. Wikipedia, por ejemplo, nos ofrece las traducciones. Nosotros desarrollamos un procedimiento que coteja nuestras consultas de búsqueda con las entradas de Wikipedia. Allí están descritos los significados y de allí sacamos también las versiones en diferentes idiomas. Y todo eso se compara después con nuestra información.

La definición perfecta de un diccionario

¿Qué desarrollos posteriores tienen en carpeta?

Hasta ahora solo hemos utilizado Wikipedia como un depósito de datos. Es cierto que es gigantesco, pero también tiene límites. Por eso estamos implementando actualmente un proyecto llamado d:swarm, cuya finalidad es integrar fuentes de datos de distintas proveniencias. Recolectamos informaciones, las juntamos y obtenemos finalmente un registro integrado y depurado de redundancias: una definición perfecta de diccionario. Ese sería el próximo paso: profundizar todavía más, sin enredarnos en una maraña de informaciones redundantes.

Es decir, quieren ser mejores que Google…

Sí, aunque eso pueda resultar en primera instancia quizá exagerado. Nuestra ventaja es que nosotros no buscamos un desarrollo horizontal, lo que nosotros queremos es ir cada vez más profundo. Google tiene que buscar soluciones que les sirvan a todos y que sean utilizables en cualquier parte. Nosotros diseñamos nuestros contenidos para nuestra clientela local. Nuestro grupo de usuarios directos no son miles de millones de personas, sino alrededor del ochenta mil. Y nosotros conocemos a nuestros usuarios, por eso podemos trabajar con herramientas más finas que Google, podemos concentrarnos en determinados tipos de datos y determinados lenguajes técnicos. Pero sí, queremos ofrecerles a nuestros clientes un mejor servicio que Google.

Oferta con demanda

¿Hay alguna otra biblioteca que se haya mostrado interesada en el programa?

Sí, la British Library (Biblioteca Británica) está probando actualmente un prototipo basado en nuestra tecnología. Y estamos en conversaciones con otras bibliotecas grandes en Alemania y en Europa. Entre otras, hemos tenido contacto con la Deutsche Nationalbibliothek (Biblioteca Nacional Alemana) en Leipzig y Frankfurt del Meno, que creó el concepto para el desarrollo tecnológico de la Deutsche Digitale Bibliothek (biblioteca digital alemana), y desde allí a la Europeana, el camino no es muy largo.

¿Cómo se articulará en el fututo la relación entre la red semántica y las bibliotecas?

Yo creo que las bibliotecas deben seguir avanzando en este camino. Deberíamos tomar a Google, a Flickr y a otros productos de la industria de internet como referentes, y estudiar qué podríamos hacer mejor. Nosotros no estamos en competencia comercial con esas empresas, pero igual nos movemos en el mercado de la oferta y la demanda. Cada biblioteca debe preguntarse para qué existe, hoy, en 10 y en 20 años. Y la respuesta naturalmente será distinta en el caso de una pequeña biblioteca municipal que en el de un tanque de las dimensiones de la SLUB.

La catalogación bibliográfica semántica “Queremos ganarle a Google”

En muchos idiomas y sin ambigüedades

La definición perfecta de un diccionario

Oferta con demanda

La catalogación bibliográfica semántica
“Queremos ganarle a Google”