II Jornadas esDBpedia Introducción DBpedia ocupa un lugar central en la Web de Datos por el importante volumen de datos semánticos que proporciona a partir de la información contenida en los infoboxes (Fichas en español) de la Wikipedia. La última versión de DBpedia (v3.8, agosto de 2012) proporciona datos semánticos de 3.8 millones de entidades, de las que 2.3 millones están clasificadas conforme a la ontología DBpedia: Personas (764 mil), Lugares (573 mil), Discos musicales (112 mil), y un largo etcétera. A partir de los 23 millones de artículos en 285 idiomas que almacena Wikipedia (4.1 millones en inglés, 0.9 millones en español), DBpedia genera 1890 millones datos semánticos (tripletas RDF) en 111 idiomas (400 millones en inglés, y 100 millones en español). Hasta julio de 2011 (versiones DBpedia anteriores a la v3.7), sólo se extraía información de una página en español de la Wikipedia si se apuntaba a ella desde la versión inglesa. Por tanto, muchas páginas con información local relevante (e.g. pueblos, ríos, organizaciones) a la que no se podía llegar desde la versión inglesa de Wikipedia, quedaban fuera del proceso de extracción de DBpedia. En julio de 2011, la versión 3.7 de DBpedia se construyó usando un nuevo mecanismo de extracción que rompía con la dependencia de la versión inglesa de Wikipedia, permitiendo generar, adicionalmente, información semántica a partir de las versiones de Wikipedia en 15 idiomas, entre ellos el español (ca, de, el, es, fr, ga, hr, hu, it, nl, pl, pt, ru, sl, tr). La versión 3.8 de DBpedia (junio 2012) amplía la lista de idiomas a 111. Sin embargo, para que la Web de Datos se enriquezca con la información contenida en la versión española de la Wikipedia, es necesario un esfuerzo colectivo importante a fin de aumentar el número de mapeos de Fichas. DBpedia pone a disposición de la comunidad herramientas web para editar estos mapeos en los que se indica la correspondencia entre términos de las Fichas y los términos de la ontología de DBpedia. La I Jornada esDBpedia logró mapear el 80% de los datos de la wikipedia del idioma español y permitió la creación de es.dbpedia.org, el capítulo español de DBpedia en mayo de 2012. Esta vez el esfuerzo no estará centrado en la creación de mapeos sino en la mejora de la CALIDAD. Las consultas (queries) realizadas sobre el SPARQL Endpoint de esDBpedia han permitido identificar errores, o ausencias importantes, en la Wikipedia del español (ejemplos). Y el objetivo principal de estar jornadas será buscar soluciones que permitan aumentar la calidad de los datos almacenados en esDBpedia. Las jornadas tendrán lugar en la Residencia Lucas Olazabal, en Cercedilla (Madrid). Los detalles sobre cómo llegar los podéis encontrar aquí. La reunión tendrá lugar los días 14 y 15 de diciembre de 2012, con la siguiente agenda (no definitiva aún, dependiendo de los asistentes): · Viernes 14. 13:00-15:00. Recepción y comida. 15:00-16:00 Presentación: Uso de la DBpedia del español y creación de consultas SPARQL. · Sábado 15. 10:00-11:00. Desayuno y presentación: Resultados de la sesión anterior. 11:00-14:00 Segunda sesión de análisis de incidencias y soluciones
Existe la posibilidad de que la Red financie los gastos de desplazamiento, alojamiento y manutención a personas no adscritas a ninguna institución con capacidad financiadora (esto es, "becas"). Las personas interesadas en esta opción deberán escribir a Oscar Corcho antes del 10 de diciembre.
Inscripción Para inscribirse al evento, manda un e-mail con tus datos (nombre y apellidos, organización, número de teléfono móvil, e-mail) y, a ser posible, una propuesta de "incidencia esDBpedia" para ser resuelta en las Jornadas, a Mariano Rico, antes del 12 de diciembre. |