Business Application Research Center

Experten für Business Intelligence, Analytics, Big Data, CRM und ECM

BARC-Newsletter

Der Data Catalog als Gelbe Seiten unternehmensrelevanter Daten

RssRss

30.06.2020

Der Data Catalog als Gelbe Seiten unternehmensrelevanter Daten

Daten sind essenziell für Unternehmen, um im Zeitalter der Digitalisierung Schritt zu halten. Das weiß mittlerweile jeder. Es ist allerdings nicht einfach, den erwünschten Wert aus den Daten zu schöpfen und mit innovativen, datengetriebenen Geschäftsanwendungen zu glänzen. Vielmehr sehen wir ein über Jahre wachsendes Datenchaos in Form von fragmentierten Datenlandschaften und verteiltem Expertenwissen.

Ein heiß diskutierter technologischer Ansatz Wissen über verteilte Daten verfügbar zu machen ist der Datenkatalog, die „Gelben Seiten“ für unternehmensrelevante Daten. Er speichert Informationen über Daten in Form von Metadaten, strukturiert diese und macht diese durchsuchbar.

Ein Datenkatalog-Werkzeug erzielt seinen Nutzen vor allem durch drei wesentliche Punkte:

  • Informationsbedarfe schnell und einfach decken
  • Metadaten (Wissen) möglichst effizient (automatisiert) erfassen
  • Plattform zum Wissensaustausch für „Alle“ bieten

Ergänzend sind Funktionen für Data Governance oder den Datenzugriff wertvoll.

Das richtige Werkzeug zu finden, kann sich als komplizierter erweisen als gedacht. Denn der Markt für Datenkataloge ist alles andere als durchsichtig. Wie bei anderen Trendthemen explodiert das Angebot und so sehen wir, dass derweil mehr als 90 Lösungen mit Data-Cataloging-Funktionen weltweit agieren.

Doch Data Cataloging ist nicht gleich Data Cataloging. Die Angebote variieren im Fokus, im Inhalt, den Funktionen und in den unterstützten Anwendungsfällen. Die folgende Tabelle zeigt eine Übersicht der grundsätzlichen Werkzeugtypen für Data Cataloging.

Grundsätzliche gibt es Angebote für den speziellen Anwendungsfall (als Teil eines BI- oder Analytics-Anwenderwerkzeuges, als Teil einer Umgebung) und Angebote, die eine übergreifende, unabhängige Lösung anbieten (Spezialisten, als Teil einer Data Governance (DG)/Datenmanagement(DM)-Plattform).

Katalog-Szenario

Charakteristika

Tool-Beispiele

…selbst gebaut

rudimentäre Katalogfunktionen

Excel, Confluence, Wiki, …

…als Teil eines BI-/Analytics-Tools

Katalogfunktionen bezogen auf die Daten/Artefakte in der eigenen Umgebung

Alteryx, Qlik, Tableau, …

…als Teil einer Umgebung

Katalogfunktionen bezogen auf technische Daten/Artefakte in der eigenen Umgebung

Amazon, Cloudera, Google, …

…als Spezialist

Umfassende Katalogfunktionen bezogen auf Daten und teils Artefakten aus unterschiedlichen Werkzeugen/Umgebungen, ergänzende Funktionen, bspw. für Data Governance

Alation, Waterline, Zeenea, …

…als Bestandteil einer Data Governance/DM-Plattform

Umfassende Katalogfunktionen bezogen auf Daten und teils Artefakten aus unterschiedlichen Werkzeugen/Umgebungen. Zusätzliche Funktionalität aus dem Portfolio, bspw. Workflows, Datenqualität, …

ASG, Collibra, Infogix, Informatica, SAP, …

Tabelle 1: Werkzeugtypen Data Cataloging

Achten Sie vor allem bei der Auswahl des Datenkatalogs auf Schnittstellen und transparente, offene Metadatenmodelle für den Metadatenaustausch mit anderen Katalogen und Systemen. Dies ermöglicht Ihnen eine Reihe von Vorteilen:

  • Sie entgehen dem Vendor-LockIn und können die Fähigkeiten des Werkzeuges gezielt einsetzen
  • Sie können Kataloge aus unterschiedlichen Bereichen oder Umgebungen einfacher in einen übergeordneten Katalog überführen
  • Es ermöglicht eine einfachere Migration oder Integration mit leistungsstärkeren Werkzeugen oder Werkzeuge mit einem anderen Schwerpunkt


Bei der Auswahl eines Datenkatalogs sollten die Funktionen sorgfältig geprüft werden. Zu prüfen sind:

  • Adapter und Funktionen für die Metadatenintegration und -austausch
  • Unterstützte Inhalte, bspw. unterstützte Metadatentypen, Offenheit und Erweiterbarkeit des Metadatenmodells
  • Funktionen und maschinelle Unterstützung für die Pflege (Kuration) von Metadaten
  • Funktionen und maschinelle Unterstützung für die Nutzung des Kataloges und Suche/Navigation/Analyse von Metadaten
  • Einfachheit in der Anwendung
  • die Unterstützung von Kollaboration
  • weitere Datenmanagementfunktionen für bspw. Data Governance, Data Preparation, Datenqualität oder Datenschutz


Lernen Sie mehr zu Inhalten eines Datenkataloges oder Tipps zur Einführung in unserem Data & Analytics Manager.

Bei der Softwareauswahl unterstützen wir auch gerne direkt mit unseren Best-Practice-Erfahrungen, etablierten Vorgehensmodellen und zahlreichen Templates durch den kompletten Prozess von der Anforderungsaufnahme, über die Erstellung einer Short List, PoC-Begleitung bis hin zur Werkzeugentscheidung. Dadurch gewinnen Sie an Entscheidungssicherheit, sparen spürbar Zeit und Ressourcen und gewinnen einen Partner, der Ihnen hilft, das Ergebnis akzeptiert in das Unternehmen zu tragen. Kontaktieren Sie uns.