Intelligente Datenerfassung, Haltung und Bereitstellung innerhalb der Öffentlichen Verwaltung
Ziel des Projektes ist es, eine Linked Data Infrastruktur am Bundesamt für Kartographie und Geodäsie anhand von einigen ausgewählten Datenbeständen aufzusetzen und zu integrieren. Hierbei sollen Ontologien für Datenstandards definiert und Best Practices für die semantische Integration in der Praxis ausgetestet werden.
Motivation
Das Bundesamt für Kartographie und Geodäsie (BKG) ist die zentrale Instanz für die Bereitstellung von Geodaten in der Bundesrepublik Deutschland. Aktuell sind dies die typischen OGC Formate (Open Geospatial Consortium) wie GML (Geography Markup Language) oder auch Shapefiles, entweder als direkte Downloads oder als Webservices (WMS, WFS), als Open Data bzw. kostenpflichtiges Produkt. Desweiteren wird ein Prozess der Standardisierung von Geodaten beispielsweise von der Europäischen Kommission mit der INSPIRE Initiative angestrebt und innerhalb der nächsten Jahre umgesetzt. Dieser will eine Harmonisierung der europäischen Datenformate auf einer syntaktischen Ebene erreichen. Der Trend - nicht nur in der öffentlichen Verwaltung, sondern in verschiedenen anderen Communities - geht jedoch dahin, Geodaten als LinkedData unter den Prinzipien des 5-Sterne Open-Data-Modells bereitzustellen.
Ziel des Projektes ist es daher, das BKG beim Aufbau einer Linked Data Infrastruktur zu unterstützen und die Integration von verschiedenartigen Daten mit weiteren Linked Data Datenrepositorien zu entwickeln. Auf Basis von Anwendungsfällen mit spezifischen Daten, die vom BKG verwaltet werden, soll eine semantische Integration von Geodaten exemplarisch durchgeführt werden. Hierbei sollen die Rückkonvertierbarkeit in die jeweiligen Ausgangsformate gewährleistet bleiben und die Ergebnisse der Konvertierung auf einer Karte visualisiert werden können. Mögliche Anreicherungen der integrierten Geodaten sollen geprüft und, entsprechend markiert, ebenfalls für den Endbenutzer verfügbar gemacht werden. Dies soll es dem BKG ermöglichen, zum einen eine Integrationsplattform für die Bereitstellung von Linked Data zu entwickeln und zum anderen die Vorteile einer semantischen Integration anhand von Beispielkarten/Beispielservices zu zeigen.
Aktivitäten
Nachdem im Jahr 2019 geeignete Daten für die semantische Integration von den Landesbehörden und der Bundesbehörde ausgewählt wurden, wurden diese im Frühjahr 2020 analysiert, Verfahren für ihre Integration erarbeitet und die Integration durchgeführt. Ontologien, welche für eine weitere Verwendung aus XML Schemata extrahiert wurden, wurden dem Arbeitskreis Architektur zur Bewertung vorgelegt mit dem Ziel, diese in Zukunft in der GDI-DE für die verschiedenen Landesbehörden als Standard zur Verfügung zu stellen.
Die Daten wurden in einen am BKG bereitgestellten Triple Store integriert, welcher zur Publikation aller in linked data umgewandelten Daten am BKG dienen soll. Für die Bereitstellung von Geodaten existieren bisher keine Anbindungen zu Triple Stores in konventioneller Software. Dies wird sich wohl aufgrund der Unterschiedlichkeit der Technologien auf absehbare Zeit auch nicht ändern. Daher war es ein Anliegen des Projektes, hierfür entsprechende Softwares zu entwickeln.
Nach der Integration der genannten Datensätze in das Projekt und der Bereitstellung wurde beschlossen, das Projekt mit Arbeiten zur Erfassung der Geodatenzeiten, der Verwaltung ihrer Metadaten, der Anreicherung und Korrektur der Datensätze, der Verbesserung der Benutzeroberfläche und dem Testen der neuen Software-Infrastruktur durch externe Benutzer in Form eines Hackathons zu erweitern.
Die zweite Phase des Projekts begann im September 2020 und wird im August 2021 enden. Der Fokus lag zunächst auf der Integration und semantischen Verwaltung von Metadaten sowie der Verwaltung und Speicherung von Schemata, die für den Export von RDF-Daten in Geodatenformate verwendet werden. Die Verwaltung der Metadaten wurde durch die Entwicklung eines Webdienstes auf der Grundlage der Empfehlungen der OGC API Records und einer Weboberfläche adressiert, die den Zugriff auf diesen Dienst und die Manipulation der Metadaten ermöglicht. Die Schnittstelle wurde dann erweitert, um Datenschemata zu speichern und diese semantisch mit der Darstellung der zugehörigen Daten zu verknüpfen. Schließlich begannen die Arbeiten zur Integration von Zeit im Zusammenhang mit Geodaten, mit der Erweiterung des ontologischen Modells, um die Konzepte von Zeit und Versionen einzubeziehen. Diese Arbeit an raum-zeitlichen Daten wird 2021 fortgesetzt, um eine Web-Schnittstelle zu entwickeln, die die Visualisierung und den Vergleich dieser Daten ermöglicht.
Resultate
Resultat der ersten Projektphase (Abb. 2):
- Der SemanticWFS: Eine Javawebanwendung, welche es ermöglicht, Inhalte von Triple Stores als FeatureCollections zur Verfügung zu stellen. Diese Anwendung nutzt die von der OGC definierte OGC API Features Schnittstelle und den von der OGC vordefinierten Web Feature Service Standard. Dadurch wird es dem BKG ermöglicht, eigene FeatureCollections auf Linked Data zu definieren und diese so zur Verfügung zu stellen, dass sie von traditioneller GIS Software angezeigt und verarbeitet werden kann. Zusätzlich stellt die Webanwendung ein standardisiertes Webinterface für den Webbrowser zur Verfügung.
- GeoPubby: Ein Linked Data Frontend zur Anzeige von Instanzen im Linked Data Graph des BKG. Das Linked Data Frontend wurde von einem vorherigen Projekt Pubby erweitert und bietet Exportmöglichkeiten für mehr als 15 Geodatenformate, sowie die Möglichkeit, Instanzen in verschiedenen Koordinatenreferenzsystemen herunterzuladen.
- SPARQLUnicorn QGIS Plugin: Ein QGIS Plugin, um SPARQL Queries auf Linked Data Graphen auszuführen, Geodatenlayer anzureichern und Daten nach RDF zu konvertieren. Das Plugin unterstützt den Benutzer bei der Erstellung von Queries, zeigt ihm bereits existierende Konzepte mit Geobezug an und kann Daten zur Integration in ein Linked Data Repository vorbereiten.
- SemanticImporter: Ein Importertool für Geodaten in den Triple Store des BKG. Das Tool, welches mit einem rudimentären Webinterface ausgestattet ist, erlaubt das Hochladen von Geodaten, die Definition von mappings zu Linked Data Vokabularien und das Abspeichern dieser Mappings. Die Mappings können - sofern exportiert - ebenfalls im SPARQLUnicorn QGIS Plugin zur Vorbereitung von Geodaten für Linked Data verwendet werden. Im Importer werden auch Provenance Informationen und weitere Vokabularien, die für die Beschreibung von Metadaten erforderlich sind, angereichert, sodass diese von den vorher genannten Tools berücksichtigt werden können.
Resultat der zweiten Projektphase:
- GeoTime Web Service: Eine auf Spring basierende Java-Webanwendung, die den Zugriff auf und die Manipulation von Informationen in Bezug auf die in den Triple Stores enthaltenen raum-zeitlichen Daten ermöglicht. Diese Anwendung dient dazu, verschiedene Dienste bereitzustellen. Der erste verfügbare Dienst folgt den Empfehlungen der “OGC API - Records - Part 1: Core”, die derzeit standardisiert werden, um einen moderneren Dienst, als die Katalog-Webdienste anzubieten. Dieser orientiert sich an der aktuellen Web-Architektur und den Best Practices für Geodaten im Web. Damit kann das BKG die Metadaten, die die von SemanticWFS zur Verfügung gestellten FeatureCollections beschreiben, verwalten und für die Anzeige und Bearbeitung durch herkömmliche GIS-Software zur Verfügung stellen. Der zweite Dienst ermöglicht die Speicherung und Verwendung von Schemata, die mit FeatureCollections verbunden sind. Der dritte Dienst schließlich, der sich derzeit in der Entwicklung befindet, zielt auf die Manipulation von räumlich-zeitlichen Daten ab.
Darüber hinaus stellt die Webanwendung eine standardisierte Oberfläche für den Webbrowser zur Verfügung:
- GeoTime Frontend: Über diese Weboberfläche können Benutzer Metadaten importieren, anzeigen, bearbeiten und exportieren sowie Verknüpfungen zu FeatureCollections herstellen. Dieses Frontend bietet auch eine Schnittstelle zur Implementierung der OGC API Records. Es ermöglicht Ihnen, Schemata nach der Identifizierung in GitLab zu importieren und zu speichern. Schließlich bietet es die Möglichkeit, zu überprüfen, ob der Export von Geodaten das zugehörige Schema respektiert.