Recursos más navegables y reutilizables


Recursos UNED como Datos Enlazados


ISLearning. Grupo de Innovación Docente de la UNED

¿Qué es la Web de Datos? Recursos UNED en la Web de Datos

¿Qué es la Web de Datos?

El gran crecimiento de la cantidad y los tipos de datos que se encuentran en la web hace que su descubrimiento, acceso y recuperación sean tareas cada vez más complicadas.

Las técnicas automáticas de recuperación de información tradicionales (indexado, VSM, ranking, etc.) presentan debilidades para escalar una gran web de recursos con distintos formatos y distintos propósitos que generalmente han sido generados por los humanos para su uso por otros humanos. Estas debilidades originan problemas a los usuarios que se apoyan en diversos motores de búsqueda para llevar a cabo sus actividades cotidianas (personales y profesionales), cuya consecución depende en gran medida de este tipo de aplicaciones.

El concepto de Web de Datos, también conocido como Web Semántica, se funda sobre la capacidad de dotar de significado a la web de recursos, un significado que las computadoras puedan comprender y así mejorar las técnicas de recuperación de información.

Actualmente existen varios portales operando bajo este concepto. Entre ellos, destacamos Wikidata como el ejemplo semántico de Wikipedia, o la adaptación del catálogo de la Biblioteca Virtual Miguel de Cervantes.

Hacia la Web de Datos

El consorcio W3 ha definido una serie de especificaciones que habilitan la descripción de cualquier recurso y sus enlaces con otros recursos, así como su serialización en un formato “machine-readable”. La puesta en práctica de la descripción y enlazado de datos en un formato legible para las máquinas facilita la recuperación de información (basada en significado).

Además, estas especificaciones nos permiten formalizar la manera en la que describimos y relacionamos recursos mediante vocabularios u ontologías. La formalización de las descripciones permite el desarrollo de agentes inteligentes que, no sólo son capaces de recuperar cierta información, sino que además son capaces de razonar u obtener conclusiones sobre los recursos descritos.

De esta forma, la publicación en abierto de los recursos descritos y su formalización en común son dos aspectos críticos hacia la interoperabilidad y la explotación de los benificios de la Web de Datos. Por tanto, es crucial tener en cuenta vocabularios u ontologías existentes, para lo cual se pueden consultar portales de referencia como Linked Open Vocabularies (LOV) para consultar vocabularios de distintas temáticas o Linked Universities dentro del mundo académico.

Recursos UNED en la Web de Datos

La iniciativa del proyecto “Recursos UNED como Datos Enlazados” surge en el departamento de IA con el objetivo de desarrollar agentes inteligentes que faciliten el descubrimiento, recuperación y acceso a recursos UNED en distintos ámbitos y aplicaciones.

Para lograr este objetivo, es necesario otorgar una capa semántica a distintos tipos de recursos de la UNED, todo ello siguiendo las mejores prácticas y recomendaciones de la Web de Datos para lograr las 5 estrellas de datos abiertos. Por este motivo, este trabajo se encuentra inmerso en un proyecto más ambicioso sobre datos de la Escuela en formato enlazable: UNEDATA.

Actualmente, el proyecto se encuentra en fase experimental realizando los primeros trabajos hacia la construcción de una ontología que permita identificar y relacionar distintos tipos de recursos que describen la estructura y oferta académica de la universidad.