4.2 Formate

Wie bereits im Punkt 7 der Prinzipien von Open Government Data (s. Offene Standards) erwähnt, sollten OGD-Datensätze grundsätzlich in Form offener Standards zur Verfügung gestellt werden. Den Empfehlungen des W3C spricht man von offenen Standards, wenn folgende Punkte erfüllt sind W3C 2007:

  • transparency (due process is public, and all technical discussions, meeting minutes, are archived and referencable in decision making)
  • relevance (new standardization is started upon due analysis of the market needs, including requirements phase, e.g. accessibility, multi-linguism)
  • openness (anybody can participate, and everybody does: industry, individual, public, government bodies, academia, on a worldwide scale)
  • impartiality and consensus (guaranteed fairness by the process and the neutral hosting of the W3C organization, with equal weight for each participant)
  • availability (free access to the standard text, both during development and at final stage, translations, and clear IPR rules for implementation, allowing open source development in the case of Internet/Web technologies)
  • maintenance (ongoing process for testing, errata, revision, permanent access)

Der von Von Lucke 2010/12 angepasste Überblick gängiger Formate (Abbildung 5) untersucht diese hinsichtlich Maschinenlesbarkeit, Verfügbarkeit von Spezifikationen und der Offenheit des Datentyps. Insbesondere der Punkt „Maschinenlesbares Format“ ist nicht eindeutig. Die Vorlage dieser Tabelle beruht auf dem Dokument Unlocking the Potential of Aid Information Gray 2009 der Open Knowledge Foundation. Diese Organisation beschreibt „Machine-readable“ als: „Formats that are machine readable are ones which are able to have their data extracted by computer programs easily. PDF documents are not machine readable. Computers can display the text nicely, but have great difficulty understanding the context that surrounds the text.OKFN 2. Die Tabelle sei hier dennoch abgebildet, da sie oft zitiert wird, wenn es um OGD-taugliche Formate geht.

Abbildung 5: Überblick über gängige Dateiformate im Hinblick auf die Verwendung im Kontext von OGD von Lucke 2010/12: 9.

Daraus ergibt sich jedoch auch ein gewisser Konflikt von Seiten der Datenanbieter. Kann ein Datensatz nicht in einem wünschenswerten Format angeboten werden, stellt sich ja dennoch die Frage ob das ein Ausschlussgrund für eine Publikation sein soll. Das Formular Datenmonitoring der Stadt Wien Wien 9 nimmt – basierend auf Krabina 2011 – die Einhaltung der OGD-Prinzipien nur als eines von neun Kriterien um die Veröffentlichungswürdigkeit zu bemessen. Demnach kann es als wichtiger erachtet werden, dass die Daten überhaupt zur Verfügung gestellt werden, als dass dies auf offene, spezifizierte und maschinenlesbare Formate beschränkt bleibt.

Datenformate lassen sich grundsätzlich dadurch unterscheiden, dass sie binär oder im Klartext codiert sind. Text Dateien werden aus von Menschen lesbare Zeichen, meist im ASCII oder UTF Format, zusammengesetzt. Dahingegen können Binäre Daten nur vom Computer interpretiert werden. Dadurch ist in der Regel die Datenmenge geringer.

Im Folgenden sind jene Dateiformate beschrieben, die im Augenblick in Österreich im Zuge von OGD-Plattformen im Einsatz sind:

Tabelle 4: Verwendung der einzelnen Datenformate im Zuge österreichischer Open Government Data Initiativen (● verwendet für geographische Daten, ○ verwendet für weitere Daten). (Das Bundeskanzleramt bietet im Rahmen von OGD Schnittstellen zum RIS – Bundesrecht konsolidiert und zur Datenbank Authentische Strukturdaten an.)
CSV (Geo)RSS GML GPX HTML JPG JSON KML / KMZ PDF SHP SVG TIF (TFW) TMS TXT WFS WMS WMTS XLS XML / XSD
BKA
BMASK
BMF
BMWF
Graz
Kremsmünster
Linz
Salzburg
Tirol
UBA
Vorarlberg
Wien

Verwendete Literatur

Tags ,

Interessante Webseiten

Interessante Dokumente

Interessante Termine