DBpediaLogoDBpedia, ein Community-Projekt am InfAI, stellt strukturierte Informationen von Wikipedia und Wikidata frei im Web zur Verfügung und ist damit eine der wichtigsten Anlaufstellen für öffentlich verlinkte Daten und deren Extraktion. Nun hat sich DBpedia etwas Besonderes einfallen lassen und die DBpedia Open Text Extraction Challenge – TextExt ausgerufen. Diese Challenge verfolgt die Wissenserweiterung aus Wikipedia-Artikeln, um die Menge strukturierter DBpedia/Wikipedia-Daten zu erweitern und zu vertiefen. Zudem soll eine Plattform für das Benchmarking verschiedener Extraktionswerkzeuge geschaffen werden. Dieses Wissen soll dann im Web frei zugänglich sein.

Ablauf Die DBpedia Open Text Extraction Challenge unterscheidet sich signifikant von bisherigen Wettbewerben in der Sprachtechnologie und anderen Gebieten, da es sich um eine stetig wachsende Herausforderung handelt. Fokussiert wird hierbei der nachhaltige Fortschritt des aktuellen Technologiestandes und die systematische Überschreitung von Grenzen. Die DBpedia Association und die Verantwortlichen der Challenge stellen dabei die notwendige Infrastruktur zur Verfügung und fungieren als Steuerorgan.

DBpedia stellt in regelmäßigen Abständen den extrahierten und bereinigten Volltext aller Wikipedia-Artikel aus neun verschiedenen Sprachen zum Download und als Docker im maschinenlesbaren NIF-RDF-Format (Beispiel für Barrack Obama auf Englisch) bereit. Die Teilnehmer der Challenge werden gebeten, ihre Extraktionswerkzeuge in Docker-Images einzubinden und diese mindestens zwei Monate vor den ausgewählten Konferenzen (LDK 2017 in Galway und SEMANTiCS 2017 in Amsterdam) an das Komitee zu übersenden. Alle technischen Details und Anforderungen sind hier zu finden: http://wiki.dbpedia.org/textext

Sollten alle erforderlichen technischen Voraussetzungen erfüllt sein sowie eine hinreichende Beschreibung geboten werden, können die Teilnehmer ihre Ergebnisse auf der jeweiligen Konferenz präsentieren. Diese werden auch in den jährlich erscheinenden Tagungsberichten veröffentlicht. Im Rahmen jeder Konferenz besteht die Chance 1.000 Euro Preisgeld zu erhalten. Der jeweilige Gewinner wird vom Wettbewerbskomitee bestimmt.

Ergebnisse Ab Dezember 2017 wird DBpedia jedes Jahr einen zusammenfassenden Artikel sowie den Tagungsbericht mit den jeweiligen Teilnehmerbeiträgen unter http://ceur-ws.org/ veröffentlichen. Weitere Informationen zu kommenden Veranstaltungen sind hier zu finden: http://wiki.dbpedia.org/textext. Bei Rückfragen zum Wettbewerb können Sie sich gern per E-Mail an das Challenge-Komitee wenden.

Die Challenge konnten mit Hilfe der H2020 geförderten EU-Projekte HOBBIT (GA-688227) und ALIGNED (GA-644055) sowie durch das BMWi geförderte Projekt Smart Data Web (GA-01MD15010B) realisiert werden. Das Rechenzentrum der Universität Leipzig unterstützt ebenfalls die Umsetzung der Challenge durch die Bereitstellung des Servers Sirius (6TB RAM).

Challenge-Komitee Sebastian Hellmann, AKSW, DBpedia Association, Kompetenzzentrum KILT, InfAI e.V., Leipzig Sören Auer, Fraunhofer IAIS, Universität Bonn Ricardo Usbeck, AKSW, Kompetenzzentrum Semantic Data Management, Leipzig University Dimitris Kontokostas, AKSW, DBpedia Association, Kompetenzzentrum KILT, InfAI e.V., Leipzig Sandro Coelho, AKSW, DBpedia Association, Kompetenzzentrum KILT, InfAI e.V., Leipzig

Ansprechpartner am InfAI:

Dr. Sebastian Hellmann
Telefon: +49 341 97 32223
Mail: hellmann@infai.org