Digitale Edition der Keilschrifttexte aus Haft Tappeh

Aktiv
Keilschrifttexte werden transliteriert und digital bereitgestellt Vanessa Liebler für das i3mainz, CC BY SA 4.0

Das Projekt Digitale Edition der Keilschrifttexte aus Haft Tappeh widmet sich der Transliteration und digitalen Bereitstellung von mehr als 600 Keilschrifttexten aus Haft Tappeh (Iran). Ziel des Projektes ist die Erarbeitung und Weiterentwicklung eines digitalen Arbeitsablaufs unter Berücksichtigung vorhandener Werkzeuge, internationaler Standards und computerlinguistischer Auswerteverfahren.

Motivation

Haft Tappeh (das antike Kabnak) liegt im Südwesten Irans in der Provinz Khuzestan, etwa 15 km südöstlich der alten Stadt Susa. Die geografische Lage hat Haft Tappeh zu einem wichtigen Ort der bronzezeitlichen Geschichte und Kultur gemacht. Bis heute wurden in großflächigen Ausgrabungen neben architektonischen Resten eines Palastes mehr als 1400 Textfragmente von Keilschrifttafeln in babylonischer Sprache freigelegt. Die meisten von ihnen sind Verwaltungsurkunden, deren abschließende sprachwissenschaftliche Edition aussteht.

In der ersten Projektphase des von der DFG geförderten Projekts sollen die 600 bis 650 von Behzad Mofidi-Nasrabadi (JGU) ausgegrabenen Texte in einer zu entwickelnden Softwareumgebung (Cuneiform Workbench) digital ediert und maschinenlesbar aufbereitet werden. In der zweiten Phase geht es insbesondere darum, die Software um die Möglichkeit der Annotation von Medien zu erweitern. Auch werden ältere Textfunde ergänzt und das Ontologie-Modell erweitert. Die Bearbeitung mit zeitgemäßen Verfahren und die offene Bereitstellung der Ergebnisse soll über den engeren Kreis der Altorientalstik hinaus die Untersuchung von Paläographie, Lexik, Syntax, Tafelformaten, Textkategorien, bürokratischem Protokoll und modus operandi des wichtigen Textcorpus ermöglichen.

Dafür entwickelt das i3mainz einen digitalen Workflow für Keilschrifttafeln, die bei den vorhandenen 3D-Daten und Photographien der Tafeln ansetzt und über die Transliteration und die computerlinguistische sowie semantische Annotation die Inhalte digital aufbereitet. Hierbei liegt der Fokus nicht auf der Erstellung eines neuen Portals für die Bereitstellung von Keilschriftdaten, sondern auf der Produktion von FAIRen Daten, die in andere bereits bestehende oder im Aufbau befindliche Repositorien integriert werden können. Das Akronym FAIR steht für findable, accessible, interoperable, reusable und verweist auf international akzeptierte Prinzipien für die Bereitstellung von Forschungsdaten. Die entwickelten Werkzeuge werden in einem Git-Repository zur Verfügung gestellt. Dies erleichtert es, die Abläufe in anderen Projekten zu replizieren. Damit werden nicht nur die Daten findbar, zugänglich, interoperabel und nutzbar sondern auch die Software.

Aktivitäten

Im Februar 2021 tauschten sich im Rahmen des DFG-geförderten, vom i3mainz organisierten, virtuellen Workshops „Status quo und aktuelle Entwicklungen zu digitalen Keilschrifteditionen“ Kolleginnen und Kollegen der Fächer Assyriologie und Computerlinguistik aus. Alle befassen sich mit Digitalen Editionen, deren infrastrukturellen Voraussetzungen, den philologischen wie linguistischen Anforderungen und informationswissenschaftlich relevanten Konzepten. Ziel des Workshops war es, gemeinsam Lösungsstrategien für die digitale Edition von Keilschrifttexten zu entwickeln.

Vorausgegangen war ein Workshop für Nachwuchswissenschaftlerinnen und -Wissenschaftler mit knapp 60 Teilnehmenden der dafür ins Leben gerufenen Initiative for Digital Cuneiform Studies (IDCS). Er wurde von den Projektmitarbeitenden Eva Huber, Tim Brandes und Timo Homburg organisiert und aus dem Programm „Kleine Fächer – Sichtbar innovativ“ der Hochschulrektorenkonferenz gefördert. Die Proceedings des Workshops wurden Ende 2021 im Journal der Cuneiform Digital Library Initiative zur Publikation eingereicht.

Eine Reihe weiterer Vernetzungsmaßnahmen schlossen sich an, darunter ein Koordinierungstreffen mit der Cuneiform Digital Library Initiative (CDLI), um Details zur Bereitstellung der digitalen Editionsdaten aus dem Haft Tappeh Projekt abzustimmen. Ende 2021 waren die Bilddaten soweit konsolidiert, dass ihre Übergabe in das Repositorium der Universitätsbibliothek Heidelberg vorbereitet werden konnte. Dabei wurde das von einem projektübergreifenden Team des i3mainz und des RGZM entworfene Metadatenschema zur Dokumentation des Erstellungsprozesses von 3D-Objekten zugrunde gelegt.

Seit August 2021 intensiviert sich die Kooperation zwischen dem Haft Tappeh-Team, der CDLI und der Ontolex Lemon Gruppe. Ziel ist die Formalisierung der Keilschriftpaläographie, ausgehend von dem Encodingsystem PaleoCodage, das in einer frühen Projektphase entwickelt wurde. Diese Formalisierungen sind nicht nur interessant für die CDLI, sondern auch für die W3C Ontolex-Lemon Working Group, insbesondere deren Untergruppe Multimodality. Diese beschäftigt sich mit der Formalisierung von Wörterbüchern für verschiedene Sprachen und Schriftsysteme und möchte ein Datenmodell für die Darstellung von Schriftsystemen über Sprachgrenzen hinweg entwickeln.

Am Beispiel von rund 30.000 Keilschrifftafeln der Hilprecht Sammlung testete das Haft Tappeh-Team, wie Annotationen auf zweidimensionalen Bildmedien realisiert werden können. Das Ergebnis ist eine in Entwicklung befindliche Webanwendung, die als CuneiformAnnotator nicht nur Grundlagen für eine Integration dieser Technologien in die “CuneiformWorkbench”, der auf Git basierenden Webplattform des Projekts, bietet, sondern auch die Klassifikation verschiedener Keilschriftzeichen ermöglicht. Das Tool wurde im Crowdsourcing Verfahren über die Plattform Zooniverse im Rahmen von Lehrveranstaltungen der Altorientalistik und von externen Kooperationspartnern getestet. Anlässlich des NFDI4Culture Plenary im November 2021 stellte das Haft Tappeh Team das Konzept der Annotationen auf 3D Modellen in dem Kurzvortrag „Rich and sustainable annotations on 3D objects“ vor.

Ein Praxisprojekt im Rahmen des hochschulübergreifenden Masterstudiengangs Digitale Methodik in den Geistes- und Kulturwissenschaften widmete sich der Rückprojektion von bereits existierenden 2D auf 3D Annotationen. Die Ergebnisse des Praxisprojektes sind aktuell unter Begutachtung im CDLI Journal und im Journal for Open Data in Archaeology (JOAD). Auf dem Linked Pasts VII Symposium im Dezember 2021 wurde das Ontologiemodell des Haft Tappeh Projekts in einem Posterbeitrag vorgestellt.

Ein zweites Praxisprojekt widmete sich der Entwicklung von Ähnlichkeitsmetriken auf 3D Modellen von Keilschrifttafeln. Ziel war es, einen digitalen Fingerabdruck der 3D Scans zu erstellen, welcher mit Objekten in größeren Datenrepositorien verglichen werden kann. Hierbei wurde die Ähnlichkeit zu sogenannten Referenzkörpern wie Standardkugeln oder Quadern gemessen, welche zu den 3D Scans in Bezug gesetzt wurden. Kombiniert mit Merkmalen wie etwa Fundorten oder Textinhalten können die Scans für weitere Erkenntnisse berücksichtigt werden.

Das Projektjahr 2022 zeichnete sich durch den Ausbau internationaler Kooperationen, etwa mit der Cuneiform Digital Library Initiative (CDLI), aus. Im Rahmen des Google Summer Of Code entwickelten Studierende Technologien zur Bildannotation. Den Höhepunkt bildete der Workshop Securing Data in Mesopotamia: New Technologies for Secured Cuneiform Texts im März in Leiden. Dort stellten Kai-Christian Bruhn und Timo Homburg die Ergebnisse des Haft Tappeh Projekts vor und diskutierten mit den Anwesenden die Perspektiven zukünftiger Kooperationen.

Gemeinsam mit dem 2022 gegründeten internationalen DANES Netzwerks für Digitale Keilschriftforschung erarbeiteten Mitarbeiter des Haft Tappeh Projekts 2023 das Datenmodell für die Darstellung der digitalen Paleographie der Haft Tappeh-Tafeln in Wikidata.

Im Sommer 2023 fand erneut eine Scankampagne im Iran statt, um noch nicht erfasste Keilschrifttafeln in 3D zu scannen und innerhalb der Projektlaufzeit dokumentieren zu können.

Das bereits existierende Korpus wurde auf Personennamen und weitere Inhalte untersucht und mit den publizierten archäologischen Fachdaten angereichert. Erstere wurden in der Datenbank FactGrid als Linked Open Data publiziert. Im Rahmen der Vorbereitung für die Publikation des Korpus annotierter Keilschrifttafelbilder erfolgte im Sommer die Publikation von MaiCuBeDa, einem Annotationsdatensatz der Hilprecht Sammlung.