· 

Was sind METADATEN?

Daten über Daten oder anders gesagt: METADATEN. In diesem Artikel wollen wir uns mal gemeinsam anschauen, was Metadaten sind, warum es sie überhaupt gibt, welche Vorteile sie haben aber vor allem auch, warum man sie in vielen Fällen besser entfernen sollte. 


Was sind Metadaten?

In meinem einleitenden Satz habe ich bereits beschrieben, was Metadaten sind, nämlich Daten, die über Daten gespeichert werden. Werden wir noch etwas konkreter:

Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten. [Q1]

Metadaten beschreiben also die eigentlichen Daten. Das ist vor allem dann wichtig, wenn man größere Datenmengen verwalten und strukturiert speichern möchte. Den Begriff gibt es nicht erst seit dem Aufkommen von Computern und digitalen Dateien. Der Studierende oder Besucher einer Bibliothek erinnert sich vielleicht noch an die Zeit, in der es große Kartenkataloge gab, mit denen man den Ablageort bestimmter Bücher dokumentiert hat, weil man ansonsten ein irgendwo abgelegtes Buch vermutlich sonst nie wieder gefunden hätte. Diese Karten enthielten neben Lokalisierungsinformationen (Flügel 3, Regal 1, 4. Fach) z. B. auch den Autor oder die ISBN-Nummer. Bei dieser Strukturierungsmöglichkeit von Informationen wurden der eigentliche Inhalt (das Buch) von den Metadaten (die Eigenschaften des Buchs) getrennt gespeichert. Trotz dieser schon langjährigen bibliothekarischen Praxis, ist der Begriff "Metadaten" noch relativ neu. Heutzutage werden Metadaten direkt in den Dateien bzw. in den Dateiattributen gespeichert. Klickt man mit der rechten Maustaste auf eine Datei, dann werden einem eine Vielzahl von Informationen präsentiert, wie z. B. das Dateiformat, den Speicherort, die Größe der Datei, die tatsächliche Größe auf den Datenträger, wann die Datei erstellt, wann sie geändert und wann sie zuletzt verwendet wurde. 


Metadaten und Dateninhalt

Wieso habe ich den Titel nicht auch als Metadatum bezeichnet? Nun, das liegt daran, dass die Verwendung die Begriffe "Metadaten" und "Dateninhalt" nicht immer trennscharf ist. Es kommt oftmals auf den Standpunkt an! Für den Leser eines Buches kommt es auf den tatsächlichen Inhalt des Buchs (also die Geschichte) an. Dazu zählt natürlich auch der Titel, da dieser mal mehr und mal weniger Aufschluss darüber gibt, worum es geht. Autor, Auflage und ISBN-Nummer sind dabei die Metadaten, wobei man natürlich auch hier argumentieren könnte, dass der Autor für den Leser durchaus einen wichtigen Stellenwert haben kann. Es macht für viele nämlich einen Unterschied, ob Maria Musterfrau, Josephine March oder J.K.Rowling einen Roman geschrieben haben.

Für den Herausgeber eines Bücherkatlogs sind diese Metadaten (aus der Sicht eines Lesers) die eigentlichen Daten. Es ergibt also Sinn, nicht nur die Daten als solche zu betrachten, sondern auch den Zweck zu dem sie verwendet werden. Wenn der Zweck die NETFLIX-Suche nach Sudio-Ghibli Filmen ist, dann ist der Name des Animationsstudios (also Studio Ghibli) das Metadatum und die verfügbaren Titel auf NETFLIX das Ergebnis.

Diese Thematik hat natürlich auch datenschutzrechtliche Relevanz, auf die wir jetzt allerdings nicht genauer eingehen werden.

Im Kontext von Computernetzwerken werden beim Austausch von Datenpaketen bestimmter Protokolle ebenfalls Metadaten und Dateninhalt ausgetauscht. Der Header enthält dabei die Metadaten (also z. B. Protokollversion, Source IP, Source Port, Paketgröße, Destination IP, Destination Port usw.) und der Body dann die eigentlichen Daten, die ausgetauscht werden.


Weitere Beispiele für Metadaten und Dateninhalt

Hier sind noch ein paar Beispiele, um nochmal den Unterschied zwischen Dateninhalt und Metadaten klarzustellen: 

Metadaten

 

  • das Versand- und Empfangsdatum einer Nachricht
  • die Versand- und Empfangsuhrzeit einer Nachricht
  • der Sender
  • der Empfänger
  • die Dateigröße und
  • die Auflösung (bei Bildern, also z. B. 1920x1080).

Dateninhalt

 

  • Der Betreff einer E-Mail (weil der Aufschluss über den Inhalt geben kann und selbst Inhalt ist),
  • der eigentliche Inhalt einer E-Mail (also der Text), 
  • der Inhalt von Dateianhängen einer E-Mail, 
  • der Inhalt einer WhatsApp-Nachricht,
  • das, was auf einem Bild zu sehen ist und
  • der Inhalt eines Formulars.

Vor- und Nachteile von Metadaten

Schauen wir uns mal an, welche Vorteile die Speicherung von Metadaten haben kann. Als Beispiel nehmen wir Bilddateien:

Vorteile

  • Zufällig entstandene Bilder können oft nicht mehr in einen Kontext eingebunden werden. So ist dieses Bild eines Alpen-Panoramas zwar schön anzusehen, doch es wäre noch schöner, wenn man wüsste, WANN und WO man es aufgenommen hat. Man kann natürlich eine ungefähre geographische Zuordnung vornehmen, doch es gibt mehr als einen Ort auf der Welt, wo es so aussehen könnte! Wenn man mal in China Urlaub gemacht und die Chinesische Mauer (zumindest in Teilen) entlang gelaufen hat, dann möchte man im Nachhinein vielleicht noch wissen, WO GENAU man sich dort aufgehalten hat. Dabei können z. B. geographische Daten helfen, die als Metadaten hinterlegt werden.
  • Möchte man Bilder in einer Datenbank speichern, dann können Metadaten dabei helfen einen Suchindex aufzubauen. Da diese Informationen auch in den Bildern selbst gespeichert sind, kann man den Suchindex anschließend wiederherstellen.
  • Auch statistische Analysen, die zur Verbesserung eines Produkts oder der Wahl einer besseren Datenstruktur dienen, können mithilfe von Metadaten durchgeführt werden.
  • Metadaten können bei der Aufklärung von Verbrechen helfen, wenn man bspw. scheinbar das eigene Alibi bestätigende Fotos vorbringt, doch die Metadaten eine andere Sprache sprechen. 

Nachteile

  • Man stelle sich aber mal vor, ein Promi oder YouTuber schießt ein Bild von sich in seiner Wohnung und postet es in den sozialen Netzwerken. Natürlich hat die Person ein großes Interesse daran, dass man nicht herausfindet, wo sie wohnt, weshalb entsprechende Maßnahmen getroffen werden (z. B. die Gardinen zuziehen, um nicht durch markante Stellen im Hintergrund auf den Wohnort schließen zu können). Wenn allerdings die Geodaten in dem Bild hinterlegt werden, hätte man sich nicht einmal die Mühe machen müssen das Umfeld zu analysieren, sondern bekommt Straße und Hausnummer quasi geschenkt. Das öffnet Stalkern natürlich Tür und Tor! Deshalb sollte man unbedingt aufpassen, dass man beim Upload von Dateien ins Internet oder sozialen Medien möglichst ALLE einen selbst identifizierenden Metadaten entfernt.
  • Auch so etwas Harmloses wie die Uhrzeit kann Aufschluss darüber geben, was man den Tag über so gemacht hat. Insbesondere die Generation Instagram, die sich bei allen nur erdenklichen Aktivitäten selbst in Szene setzt, liefert sozialen Medien durch Metadaten wertvolle Zusatzinformationen, wodurch man u. a. das Nutzerverhalten noch besser analysieren kann (ist man z. B. Jemand, der Fotos recht spontan hochlädt oder sie nach der Aufnahme noch längere Zeit bearbeitet).
  • Metadaten können aber auch relativ leicht gefälscht werden. Das kann man sowohl als Schutzmechanismus, als auch Beweismittelmanipulation interpretieren, wenn es z. B. in den Bereich der gerichtsfesten forensischen Untersuchung geht.

Metadaten geben viele Informationen preis, von denen man selbst aktiv gar nicht viel mitbekommt. Sei es der eigene Standort, die Reaktionszeiten auf Nachrichten und (wie bei bekannten Messenger-Diensten) im schlimmsten Fall ein nahezu lückenloses Profil über die Online- und Offline-Zeiten, aus denen man dann wiederum seine Rückschlüsse ziehen kann. Metadaten geben OBERFLÄCHLICH zwar erstmal nichts über den Inhalt preis, doch bei näherer Betrachtung verraten sie sehr viel (vlt. sogar doch Inhalt). Wenn man nachts um 3 mehrfach hintereinander vom örtlichen Krankenhaus angerufen wird und ein naher Verwandter gerade Patient dort ist, kann man auch ohne Abnehmen des Hörers im Nachhinein aufgrund der produzierten Metadaten durchaus Rückschlüsse auf den Inhalt des Gesprächs ziehen, wenn es stattgefunden hätte.