Linked Open Data Wörterbücher und Paläographie
Im Rahmen des Haft Tappeh-Projekts entsteht eine digitale Edition von Keilschrifttexten, welche vollständig kompatibel mit Linked Open Data ist. Um die Interoperabilität mit der Linked Open Data Cloud zu gewährleisten, werden Annotationen von semantischen Aspekten, sowie linguistische Annotationen von Textstellen als zentrale Elemente vorausgesetzt. Diese Voraussetzungen fehlten jedoch für Keilschriftzeichen und -sprachen, weshalb sie zunächst kooperativ aufgebaut werden mussten.
Das Projekt beschäftigt sich daher mit der Digitalisierung vorhandener, analoger Wörterbuchressourcen und von Werken der Paläographie mithilfe frei verfügbaren Schrift- und Zeichen-Fonts in Wikidata. Die Erstellung dieser Ressourcen ist eine Voraussetzung für eine interoperable Annotation von Keilschrifttexten sowie für die Auffindbarkeit und Vernetzung von digitalen Keilschriftressourcen über den Projektkontext hinaus.
Motivation
Nach der Erstellung von anfänglich etwa 4500 sumerischen Lexemen aus den ersten Wörterbuchressourcen im Jahre 2022, wurden im Jahr 2023 ca. 5000 akkadische Lexeme in Wikidata eingepflegt. Gleichzeitig konnte die Anzahl der sumerischen Lexeme auf inzwischen knapp 6000 Einträge erhöht werden. Auf Grundlage eines 2022 auf der Graphematik Konferenz in Paris vorgestellten Papers wurde ein Datenmodell für paleographische Keilschriftdaten in Wikidata entwickelt und anhand von sechs verschiedenen Keilschriftfonts umgesetzt.
Für die Erschließung der Paleographie- und Wörterbuchdaten wurde das Tool PaleOrdia entwickelt, eine statische Webseite, die Inhalte der Wikidata Lexeme visualisiert. Im Rahmen einer Kooperation im DANES Netzwerk wird seit Herbst 2023 auch die Umsetzung eines semantischen Wörterbuchs für die elamische Sprache vorangetrieben. Adam Anderson und Studierende der UC Berkeley tragen im Rahmen des Data Science Discovery Programs weitere Komponenten bei, wie grammatisch ausgezeichnete Wortformen mit Textbelegen, sowie die Überführung von zwei Keilschriftdatenbanken in das Linked Open Data Repository FactGrid.
Aktivitäten
Im Jahr 2024 sollen die Wörterbuchprojekte für Sumerisch, Akkadisch und Elamisch abgeschlossen sein und die so generierte Linked Open Data Cloud mit den Ergebnissen der Haft Tappeh Edition verbunden werden.
Zudem wird angestrebt, die Linked Open Data Ressourcen durch Tools für die Allgemeinheit zugänglicher zu gestalten. Bereits in Arbeit ist hierfür die Integration der Annotationen in den Cuneiform Annotator und eine Browserextension für das Nachschlagen von Wortbedeutungen.