Maratón de creación de mapeos para la DBpedia en español
  Cercedilla, 3-4 noviembre 2011
 Organizado por la Red Temática Española de Linked Data

La DBpedia ocupa un lugar central en la Web de Datos por el importante volumen de datos semánticos que proporciona a partir de la información contenida en los infoboxes (Fichas en español) de la Wikipedia. La última versión de la DBpedia (de hace dos meses) proporciona datos semánticos de 3.6 millones de entidades, de las que 1.8 están clasificadas: Personas (416 mil),  Lugares (526 mil), Discos musicales (106 mil), y un largo etcétera. De toda esta información, mil millones de triples RDF, una tercera parte se extrae de la versión inglesa de la Wikipedia, y los dos tercios restantes se extraen de las versiones de Wikipedia en 97 idiomas.

En versiones anteriores, sólo se extraía información de una página en español de la Wikipedia si se apuntaba a ella desde la versión inglesa. Por tanto, muchas páginas con información local relevante (e.g. pueblos, ríos, organizaciones) a la que no se podía llegar desde la versión inglesa de Wikipedia, quedaban fuera del proceso de extracción de DBpedia.

Afortunadamente, esta nueva versión de DBpedia se ha construido usando un nuevo mecanismo de extracción que rompe con la dependencia de la versión inglesa de Wikipedia, permitiendo generar, adicionalmente, información semántica a partir de las versiones de Wikipedia en 15 idiomas, entre ellos el español (ca, de, el, es, fr, ga, hr, hu, it, nl, pl, pt, ru, sl, tr).

Sin embargo, para que la Web de Datos se enriquezca con la información contenida en la versión española de la Wikipedia, es necesario un esfuerzo colectivo importante a fin de aumentar el número de mapeos de Fichas. DBpedia pone a disposición de la comunidad herramientas web para editar estos mapeos en los que se indica la correspondencia entre términos de las Fichas y los términos de la ontología de DBpedia. Actualmente, sólo el 0.3% (4 de 1311) de las Fichas descritas en la versión española de la Wikipedia están mapeadas.

Previo a la publicación de la nueva versión de DBpedia se lanzó la Language Race para aumentar el número de mapeos. Sin embargo, comparado con los otros idiomas, la versión española sigue sin alcanzar un número de mapeos acorde con la relevancia del español en la Wikipedia.

Os animo a que visitéis la página web donde se indican los pasos necesarios para poder contribuir a esta tarea, así como a que me escribáis si tenéis alguna duda o sugerencia. Adicionalmente, en el contexto de la Red Española de LinkedData, hemos pensado organizar una maratón de creación de mapeos. Esta maratón tendrá lugar en la Residencia Lucas Olazabal, en Cercedilla (Madrid). Los detalles sobre cómo llegar los podéis encontrar en http://sssw.org/2011/venue-details.php. La reunión tendrá lugar los días 3 y 4 de noviembre de 2011, con la siguiente agenda (no definitiva aún, dependiendo de los asistentes):

  • Jueves 3. 13:00-15:00. Recepción

            15:00-16:00 Presentación: Usos actuales de la DBpedia en español y creación de mapeos.
            16:00-20:00 Primera sesión de creación de mapeos simples
            20:00-24:00 Cena, brainstorming, discusiones y presentaciones informales

  • Viernes 4. 10:00-11:00 Presentación: Resultados de la sesión anterior, creación de mapeos más complejos, etc.

             11:00-14:00 Segunda sesión de creación de mapeos complejos
             14:00-15:00 Comida, cierre de la maratón, tareas pendientes y salida

Habrá café disponible durante todas las sesiones, y os recordamos que deberíais traer vuestros portátiles para las sesiones de maratón.

Los costes de alojamiento y manutención serán cubiertos por la Red Española de Linked Data, y se podrán financiar algunos costes de transporte únicamente para los miembros de la red.

Para inscribirse al evento, mandad un e-mail con vuestros datos (nombre y apellidos, organización, número de teléfono móvil, e-mail) a Mariano Rico, antes del 15 de octubre.

español (España) English (United States)