II Jornadas esDBpedia
  Cercedilla, 14-15 diciembre 2012
 Organizado por la Red Temática Española de Linked Data

Introducción

DBpedia ocupa un lugar central en la Web de Datos por el importante volumen de datos semánticos que proporciona a partir de la información contenida en los infoboxes (Fichas en español) de la Wikipedia. La última versión de DBpedia (v3.8, agosto de 2012) proporciona datos semánticos de 3.8 millones de entidades, de las que 2.3 millones están clasificadas conforme a la ontología DBpedia: Personas (764 mil),  Lugares (573 mil), Discos musicales (112 mil), y un largo etcétera. 

A partir de los 23 millones de artículos en 285 idiomas que almacena Wikipedia (4.1 millones en inglés, 0.9 millones en español), DBpedia genera 1890 millones datos semánticos (tripletas RDF) en 111 idiomas (400 millones en inglés, y 100 millones en español). 

Hasta julio de 2011 (versiones DBpedia anteriores a la v3.7), sólo se extraía información de una página en español de la Wikipedia si se apuntaba a ella desde la versión inglesa. Por tanto, muchas páginas con información local relevante (e.g. pueblos, ríos, organizaciones) a la que no se podía llegar desde la versión inglesa de Wikipedia, quedaban fuera del proceso de extracción de DBpedia. En julio de 2011, la versión 3.7 de DBpedia se construyó usando un nuevo mecanismo de extracción que rompía con la dependencia de la versión inglesa de Wikipedia, permitiendo generar, adicionalmente, información semántica a partir de las versiones de Wikipedia en 15 idiomas, entre ellos el español (ca, de, el, es, fr, ga, hr, hu, it, nl, pl, pt, ru, sl, tr). La versión 3.8 de DBpedia (junio 2012) amplía la lista de idiomas a 111. 

Sin embargo, para que la Web de Datos se enriquezca con la información contenida en la versión española de la Wikipedia, es necesario un esfuerzo colectivo importante a fin de aumentar el número de mapeos de Fichas. DBpedia pone a disposición de la comunidad herramientas web para editar estos mapeos en los que se indica la correspondencia entre términos de las Fichas y los términos de la ontología de DBpedia. La I Jornada esDBpedia logró mapear el 80% de los datos de la wikipedia del idioma español y permitió la creación de es.dbpedia.org, el capítulo español de DBpedia en mayo de 2012.

Durante estos 7 meses, esDBpedia ha tenido 3400 visitantes distintos, y se han leído 15400 páginas. Sus redes sociales cuentan con decenas de seguidores en twitter Facebook.


El reto de las Jornadas

Esta vez el esfuerzo no estará centrado en la creación de mapeos sino en la mejora de la CALIDAD. Las consultas (queries) realizadas sobre el SPARQL Endpoint de esDBpedia han permitido identificar errores, o ausencias importantes, en la Wikipedia del español (ejemplos). Y el objetivo principal de estar jornadas será buscar soluciones que permitan aumentar la calidad de los datos almacenados en esDBpedia.

Las jornadas tendrán lugar en la Residencia Lucas Olazabal, en Cercedilla (Madrid). Los detalles sobre cómo llegar los podéis encontrar aquí. La reunión tendrá lugar los días 14 y 15 de diciembre de 2012, con la siguiente agenda (no definitiva aún, dependiendo de los asistentes):

·         Viernes 14. 13:00-15:00. Recepción y comida.

            15:00-16:00 Presentación: Uso de la DBpedia del español y creación de consultas SPARQL.
            16:00-20:00 Primera sesión de análisis de incidencias y soluciones
            20:00-24:00 Cena, brainstorming, discusiones y presentaciones informales

·         Sábado 15. 10:00-11:00. Desayuno y presentación: Resultados de la sesión anterior.

             11:00-14:00 Segunda sesión de análisis de incidencias y soluciones
             14:00-15:00 Comida, cierre de la reunión, tareas pendientes y salida

Habrá café disponible durante todas las sesiones, y os recordamos que deberíais traer vuestros portátiles para las sesiones de análisis de incidencias y soluciones.


Coste

  • Para los miembros de la Red Española de Linked Data:  La Red cubre los costes de alojamiento y manutención.
  • Para las personas interesadas en asistir y que no sean miembros de la Red, típicamente personal de empresas,  los costes son:
    • Llegadas el viernes después de la comida: 70€  (incluye alojamiento del viernes, y desayuno y comida del sábado).
    • Llegadas el viernes antes de la comida: 85€  (incluye comida y alojamiento del viernes, y desayuno y comida del sábado).

Existe la posibilidad de que la Red financie los gastos de desplazamiento, alojamiento y manutención a personas no adscritas a ninguna institución con capacidad financiadora (esto es, "becas"). Las personas interesadas en esta opción deberán escribir a Oscar Corcho antes del 10 de diciembre.

 

Inscripción

Para inscribirse al evento, manda un e-mail con tus datos (nombre y apellidos, organización, número de teléfono móvil, e-mail) y, a ser posible, una propuesta de "incidencia esDBpedia" para ser resuelta en las Jornadas, a Mariano Rico, antes del 12 de diciembre.

español (España) English (United States)