Institut für Raumbezogene Informations- und Messtechnik
Hochschule Mainz - University of Applied Sciences

Das Labeling System - Eine Web-App zur Erstellung und Veröffentlichung von Begriffen mit kontextgebundener Gültigkeit als LOD

Das Labeling System Projekt entwickelt einen Prototyp einer Web-App zur Erstellung und Veröffentlichung von Begriffen mit kontextgebundener Gültigkeit als Linked Open Data. Das System basiert auf Linked Data Konzepten, Technologien und Formaten. Kern ist die Modellierung semantischer Beziehungen und Bedeutungen von Begriffen zu autoritativen HTTP-addressierbaren Thesauri.
Motivation und Ziele: 
Die Erschließung kulturhistorischer Materialien erfordert die Abstraktion in Schlagworte. Die kontextbezogene Zusammenstellung dieser Begriffe in Form eines Vokabulars ist Bestandteil vieler digitaler Forschungsprojekte. Der Bezeichner eines Begriffes reicht für eine eindeutige Definition nicht aus. Eine Konkretisierung kann durch beschreibenden Text oder Verlinkung zu externen Ressourcen im Web erfolgen. Insbesondere für die Interoperabilität zwischen verteilten Datenbanken sind eindeutige Bezeichner (URIs) zur automatisierten Auswertung von Beziehungen geeignet. Die Linked Data Cloud stellt maschinenlesbare autoritative HTTP-Ressourcen unterschiedlicher Wissenschaftsdisziplinen (z.B. Getty AAT) zur Verlinkung zur Verfügung. Diese basieren auf dem Resource Description Framework (RDF), so dass die Veröffentlichung der Begriffe als Linked Data sinnvoll ist.
 
Ein gemeinsames Verständnis des Bedeutungsgehalts verschiedener kontextgebundener Begriffe innerhalb geisteswissenschaftlicher Forschungsdisziplinen ist eine zentrale Herausforderung insbesondere im Bereich der »Digital Humanities«. Dazu müssen diese Begriffe publiziert und eindeutig beschrieben werden. Virtuelle Bibliotheken wie Europeana.eu setzen auf eine eindeutige Verschlagwortung mittels RDF.
 
Die Generierung von verlinkten Begriffen als Linked Data ist ein komplexer Prozess, der von den Geisteswissenschaften mit bestehenden Frameworks nur schwer umgesetzt werden kann. Ziel ist somit ein System, das es Digital Humanists ermöglicht, semantisch in Beziehung gesetzte Begriffe zu erstellen und als Linked Data zu veröffentlichen. Dieses System wird zentral von einer Institution gehostet (z.B. mainzed) und ermöglicht den assoziierten Wissenschaftlern interdisziplinären Austausch ohne Installation eines Servers. Langfristiges Ziel ist der Einsatz des LS als Infrastrukturkomponente, einem Begriffs-Gazetteer bzw. Meta-Index im »mainzed-Netzwerk«.
Aktivitäten: 
Der Prototyp des Labeling System bietet Fachwissenschaftlern die Möglichkeit, Begriffe mit kontextgebundener Gültigkeit zu erzeugen, zu konkretisieren, in Containern zu gruppieren (Vokabulare) und mit der Forschungscommunity zu teilen. Es stellt dabei nutzerfreuliche webbasierte Werkzeuge bereit, die es ermöglichen eigene Begriffe mit der Linked Open Data Cloud semantisch zu verknüpfen. Das Labeling System dient als dezentrales Begriffs-Repositorium, das zitierfähige Adressen als URI im Web bereitstellt.

Matthias Dufner und Axel Kunz entwickelten 2016 ein nutzerfreundliches Frontend auf Grundlage von AngularJS, HTML5 und CSS3. Das von Florian Thiery implementierte Backend basiert auf JAVA, einem RDF4J Triplestore und einer dokumentierten API. Die Modellierung von Vokabularen und Begriffen wird durch ein vereinfachtes, auf geisteswissenschaftliche Fragestellungen angepasstes, SKOS-Modell umgesetzt.

Eckpfeiler dabei sind die deskriptive Beschreibung eines Begriffs (Concept) durch einen Bezeichner (Label), Übersetzungen und eine Kurzbeschreibung, sowie die hierarchische, assoziative oder mappende Verlinkung externer Ressourcen.

Das GUI ermöglicht ein einfaches Verknüpfen von Begriffen mit Referenz-Thesauri (z.B. Getty) durch Stichwortsuche, Verknüpfungen von Web Ressourcen des Internet Archive und ein prototypisches Arbeiten im Entwurfsmodus.

Der Kompetenzbereich WissIT des RGZM nutzt das LS bereits zur Publikation von Begriffen (z.B. im Reengineering der NAVIS-Datenbanken) und lässt die Begriffe in die eigene Forschung einfließen. Insbesondere die Verwendung des LS als zentraler Knoten der verteilten Datenbankarchitektur (Meta-Index) steht hier im Vordergrund.

Im Jahr 2017 ist die Veröffentlichung des Prototyps als einer der zentralen Komponenten, der sich im Aufbau befindlichen Forschungsdateninfrastruktur des mainzed Netzwerks, unter http://labeling.link vorgesehen. Partner des mainzed werden somit in die Lage versetzt, ihre Fachvokabulare, bzw. Metadaten Schlagwortlisten zentral als LOD zu veröffentlichen und in Ihre Systemarchitektur einzubinden.

Nachrichten

Die Erschließung kulturhistorischer Materialien erfordert die Abstraktion historischer Realitäten in Schlagworte. Die Zusammenstellung dieser…

Vom 30. März bis zum 3. April trafen sich Wissenschaftler und Experten, um sich über Computeranwendungen und Quantitative Methoden in der Archäologie…

Die Erschließung kulturhistorischer Materialien erfordert die Abstraktion historischer Realitäten in Schlagworte. Die Zusammenstellung dieser…

Verwandte Projekte

Nach erfolgreichem Abschluss des Projektes WIDOP wurde WIDOPII ins Leben gerufen um das Lösungsprinzip auf eine neue Aufgabe zu übertragen.
Dieses Projekt verfolgt einen neuartigen Ansatz zur Erfassung, Kombination und Analyse persönlicher Belastungsinformationen und feinmaschiger Umweltdaten. Hieraus werden individuel…

Publikationen

The Labeling System: A New Approach to Overcome the Vocabulary Bottleneck

2014

F. Thiery,
K.C. Bruhn,
M. Piotrowski,
G. Colavizza

RTF

DH-CASE '14

Shared controlled vocabularies are a prerequisite for collaborative annotation and semantic interchange. The creation and maintenance of such vocabularies is, however, time-consuming and expensive. The diversity of research questions in the humanities makes it virtually impossible to create shared controlled vocabularies that cover a wide range of potential applications and satisfy the needs of diverse stakeholders. In this paper we present a novel conceptual approach for mitigating these problems. We propose that projects define their own vocabularies as needed and link the vocabulary terms to one or more concepts in a reference thesaurus, so that the project-specific term effectively serves as a "label" for a set of shared concepts. We also describe the implementation of this approach in the Labeling System. The Labeling System is a Web application that allows users to easily import concepts or create SKOS vocabularies and link the vocabulary terms to concepts from one or more reference thesauri.