Business Application Research Center

Experten für Business Intelligence, Analytics, Big Data, CRM und ECM

BARC-Newsletter

Die Bedeutung von Metadaten einfach erklärt

RssRss

07.10.2020

Die Bedeutung von Metadaten einfach erklärt

Wie ich die Bedeutung von Metadaten meinen Freunden erkläre

Kennt ihr das? Ich fotografiere gerne. Und im Laufe der Zeit haben sich tausende Bilder angesammelt, die auf der Festplatte versauern. Erschwerend kommt hinzu, dass ich im Raw-Format fotografiere. Die Inhalte sehe ich auf den ersten Blick nicht. Denn diese Dateien können nur mit Spezialprogrammen geöffnet werden.

Im übertragenen Sinne habe ich eine riesige Datenablage für Bilder geschaffen, wo ich nur ungefähr weiß, was für Aufnahmen ich haben müsste. Die Dateien sind mit rudimentären technischen Metadaten versehen, die über den Dateibrowser einsehbar sind.

Metadaten sind Beschreibungen für Daten: Entstehungsdatum, vielleicht sogar der Kameratyp, Objektiv usw. beschreiben die Datei näher, abhängig von der verwendeten Kamera. Aber aus dem Dateinamen werde ich nicht schlau. Über den Inhalt des Bildes gibt es keine Information.

Und nun stellt euch vor, ihr möchtet ein Familienalbum erstellen. Es ist eine zeitaufwändige und nervige Aufgabe, die Bilder zu suchen. 

Abbildung 1: Verloren im Dateisystem
Abbildung 1: Verloren im Dateisystem

Anstatt sich auf die Gestaltung des Albums zu konzentrieren, suche ich lang nach den Bildern. Zum Glück gibt es Programme zur Bildverwaltung, die auch als Katalog bezeichnet werden können. Diese lesen die Bilder ein, extrahieren weitere technische Metadaten (bspw. Einstellungen bei der Aufnahme, GPS-Daten) und bieten auch die Möglichkeiten Bilder inhaltlich zu beschreiben. Dies können sie allerdings nicht automatisch machen.

Es bedarf in der Regel einer konsequenten, kontinuierlichen manuellen Pflege von fachlichen Metadaten. So könnt ihr Bilder mit verständlichen Attributen beschreiben, wie Art des Bildes, Stil, abgebildete Personen, Situation.

Es ist sogar möglich, die Bildobjekte auch hierarchisch zu strukturieren, im Sinne: Folgende Personen gehören einer Gruppe an. Dies ermöglicht es dann später einfach nach einer Gruppe zu suchen und alle dafür relevanten Bilder zu bekommen.

Um die Arbeit zu vereinfachen, helfen AI-Algorithmen bei der Gesichtserkennung (wenn man denn möchte) oder bei der Generierung der inhaltlich-beschreibenden Metadaten. Auf diese Weise wird jedes Bild markiert, auf dem eine Person abgebildet ist und die Bilder sind fortan nach dieser Person oder dem Objekt durchsuchbar.

Darüber hinaus unterstützen Funktionen bei der Pflege der Metadaten, um dies zeiteffizienter zu gestalten. Denn es ist nervige Zusatzarbeit, die Disziplin erfordert.

Aber ohne gut gepflegte Metadaten hilft einem die tollste Katalog-Technologie nichts. Und auch Funktionen für die Nutzung von Metadaten helfen, um sich bspw. ähnliche Bilder anzeigen zu lassen, eine umfassende Such- und Filterfunktion, Bewertungsfunktion für Bilder usw. 

Abbildung 2: Die Funktionen eines Kataloges am Beispiel Adobe Lightroom CC
Abbildung 2: Die Funktionen eines Kataloges am Beispiel Adobe Lightroom CC

Hätte ich das gehabt, wäre mein Album heute schon fertig.

Bedeutung von Metadaten für Data & Analytics

Data und Analytics Teams stehen vor einer noch größeren Herausforderung: Denn in Unternehmen sind zahlreiche wertvolle Datenobjekte verteilt, die in weitaus mehr Anwendungsfällen genutzt werden als ein Fotoalbum.

Daten können…

  • unterschiedliche Objekte wie Bilder, Datensätze, Berichte, Prozesse, analytische Modelle, Code, Audiodateien sein.
  • strukturierte und unstrukturierte Formate besitzen.
  • in unterschiedlichen Systemen gespeichert sein.


Darüber den Überblick zu behalten scheint eine unlösbare, zumindest hoch-komplexe Aufgabe. Dennoch ist dies die aktuelle Herausforderung und Basis, um datengetrieben agieren zu können. Dazu brauchen wir Daten. Und die müssen wir auch nutzen können.

Wir müssen wissen, was wir an Daten haben und wir müssen diese Daten im Unternehmenskontext inhaltlich verstehen können. Wir brauchen ein Verständnis dafür, wie diese Daten genutzt werden können und worauf wir achten müssen (wie z. B. Datenschutz, Abhängigkeiten). Metadaten schaffen hier Abhilfe und helfen bei der Beschreibung von Daten.

Zu beschreibende Datenobjekte Beschreibende Elemente
  • Datensätze aus transaktionalen Systemen
  • Berichte
  • Analytische Modelle
  • Prozesse
  • Systeme
  • Code
  • Datenintegrationsstrecken
  • Audio-, Bild-, Videodateien
  • Dokumente
  • IoT-Daten
  • Fachliche Beschreibungen
  • Technische Beschreibungen
  • Organisatorische
  • Zusatzinformationen
  • Perspektiven auf Daten
  • Informationen zur Verwendung
  • Abhängigkeiten
  • Zugriffs- und
  • Datenschutzbestimmungen
  • Statistische Daten, bspw. zum Inhalt


Kurz zurück zu den Bildern, liebe Freunde. Es ist richtig, dass euer Handy eure Bilder verwaltet und indexiert.

Aber nun stellt euch vor, ihr möchtet für den 80. Geburtstag eures Opas die tollsten Bilder aus der Verwandtschaft zusammentragen. Da wird es bereits schwieriger, die passenden Bilder in den Sammlungen von Tanten, Onkeln, Frau, Tochter, Sohn usw. zu finden.

Oder stellt euch vor, ihr wechselt euer Handy und verliert dabei eure Handy-spezifische Indexierung. Es kann auch sein, dass ihr Bilder auslagern müsst, da der Speicherplatz auf eurem Handy vielleicht doch mal knapp wird.

In Unternehmen ist es nicht anders: Eine Applikation für sich mag seine Metadaten im Griff haben. Aber systemübergreifende Sichten auf Daten brauchen Integration.

Genau an dem Punkt sollte man das Thema Metadaten strategischer angehen und steuern, welche Informationen benötigt werden, für wen, wann und zu welchem Zeitpunkt und auch über Werkzeugunterstützung nachdenken.

Und dabei unterstütze ich Unternehmen. Damit diese in der Lage sind Fragen zu beantworten, wie:

Abbildung 3: Typische Fragen zur Organisation von Metadaten


Ich freu mich über den Austausch mit euch. Schreibt mich gerne an!