Das Labeling System - Eine Web-App zur Erstellung und Veröffentlichung von Begriffen mit kontextgebundener Gültigkeit als LOD

Abgeschlossen
Labeling System Tower Example i3mainz, CC BY SA 4.0

Das Labeling System Projekt entwickelt einen Prototyp einer Web-App zur Erstellung und Veröffentlichung von Begriffen mit kontextgebundener Gültigkeit als Linked Open Data. Das System basiert auf Linked Data Konzepten, Technologien und Formaten. Kern ist die Modellierung semantischer Beziehungen und Bedeutungen von Begriffen zu autoritativen HTTP-addressierbaren Thesauri.

Motivation

Die Erschließung kulturhistorischer Materialien erfordert die Abstraktion in Schlagworte. Die kontextbezogene Zusammenstellung dieser Begriffe in Form eines Vokabulars ist Bestandteil vieler digitaler Forschungsprojekte. Der Bezeichner eines Begriffes reicht für eine eindeutige Definition nicht aus. Eine Konkretisierung kann durch beschreibenden Text oder Verlinkung zu externen Ressourcen im Web erfolgen. Insbesondere für die Interoperabilität zwischen verteilten Datenbanken sind eindeutige Bezeichner (URIs) zur automatisierten Auswertung von Beziehungen geeignet. Die Linked Data Cloud stellt maschinenlesbare autoritative HTTP-Ressourcen unterschiedlicher Wissenschaftsdisziplinen (z.B. Getty AAT) zur Verlinkung zur Verfügung. Diese basieren auf dem Resource Description Framework (RDF), so dass die Veröffentlichung der Begriffe als Linked Data sinnvoll ist.

Ein gemeinsames Verständnis des Bedeutungsgehalts verschiedener kontextgebundener Begriffe innerhalb geisteswissenschaftlicher Forschungsdisziplinen ist eine zentrale Herausforderung insbesondere im Bereich der »Digital Humanities«. Dazu müssen diese Begriffe publiziert und eindeutig beschrieben werden. Virtuelle Bibliotheken wie Europeana.eu setzen auf eine eindeutige Verschlagwortung mittels RDF.

Die Generierung von verlinkten Begriffen als Linked Data ist ein komplexer Prozess, der von den Geisteswissenschaften mit bestehenden Frameworks nur schwer umgesetzt werden kann. Ziel ist somit ein System, das es Digital Humanists ermöglicht, semantisch in Beziehung gesetzte Begriffe zu erstellen und als Linked Data zu veröffentlichen. Dieses System wird zentral von einer Institution gehostet (z.B. mainzed) und ermöglicht den assoziierten Wissenschaftlern interdisziplinären Austausch ohne Installation eines Servers. Langfristiges Ziel ist der Einsatz des LS als Infrastrukturkomponente, einem Begriffs-Gazetteer bzw. Meta-Index im »mainzed-Netzwerk«.

Aktivitäten

Der Prototyp des Labeling System bietet Fachwissenschaftlern die Möglichkeit, Begriffe mit kontextgebundener Gültigkeit zu erzeugen, zu konkretisieren, in Containern zu gruppieren (Vokabulare) und mit der Forschungscommunity zu teilen. Es stellt dabei nutzerfreuliche webbasierte Werkzeuge bereit, die es ermöglichen eigene Begriffe mit der Linked Open Data Cloud semantisch zu verknüpfen. Das Labeling System dient als dezentrales Begriffs-Repositorium, das zitierfähige Adressen als URI im Web bereitstellt.

Matthias Dufner und Axel Kunz entwickelten 2016 ein nutzerfreundliches Frontend auf Grundlage von AngularJS, HTML5 und CSS3. Das von Florian Thiery implementierte Backend basiert auf JAVA, einem RDF4J Triplestore und einer dokumentierten API. Die Modellierung von Vokabularen und Begriffen wird durch ein vereinfachtes, auf geisteswissenschaftliche Fragestellungen angepasstes, SKOS-Modell umgesetzt.

Eckpfeiler dabei sind die deskriptive Beschreibung eines Begriffs (Concept) durch einen Bezeichner (Label), Übersetzungen und eine Kurzbeschreibung, sowie die hierarchische, assoziative oder mappende Verlinkung externer Ressourcen.

Das GUI ermöglicht ein einfaches Verknüpfen von Begriffen mit Referenz-Thesauri (z.B. Getty) durch Stichwortsuche, Verknüpfungen von Web Ressourcen des Internet Archive und ein prototypisches Arbeiten im Entwurfsmodus.

Der Kompetenzbereich WissIT des RGZM nutzt das LS bereits zur Publikation von Begriffen (z.B. im Reengineering der NAVIS-Datenbanken) und lässt die Begriffe in die eigene Forschung einfließen. Insbesondere die Verwendung des LS als zentraler Knoten der verteilten Datenbankarchitektur (Meta-Index) steht hier im Vordergrund.

Im Jahr 2017 ist die Veröffentlichung des Prototyps als einer der zentralen Komponenten, der sich im Aufbau befindlichen Forschungsdateninfrastruktur des mainzed Netzwerks, unter http://labeling.link vorgesehen. Partner des mainzed werden somit in die Lage versetzt, ihre Fachvokabulare, bzw. Metadaten Schlagwortlisten zentral als LOD zu veröffentlichen und in Ihre Systemarchitektur einzubinden.