Business Application Research Center

Experten für Business Intelligence, Analytics, Big Data, CRM und ECM

BARC-Newsletter

Die Grundlagen des Datenqualitätsmanagements

RssRss

21.08.2015

Die Grundlagen des Datenqualitätsmanagements

Jeder strategische Angang eines Datenqualitätsmanagements sollte einige Grundsätze berücksichtigen, die nach unserer Erfahrung Basis für einen erfolgreiches Konzept zum Management von Datenqualität sind:

Daten haben immer Fehler

  1. Eingabefehler durch Menschen (ca. 5 Prozent aller manuellen Eingaben sind durchschnittlich fehlerhaft)
  2. Verarbeitungsfehler (Rechenfehler, Übertragungsfehler, Datenformatfehler, …)
  3. Bewusste Falscheingabe / Betrug (zum Beispiel Bonus-Systeme für Mitarbeiter mit einer Prämie für Neukunden führen zu mehr Dubletten).
  4. Änderung der Wirklichkeit, die durch die Daten abgebildet werden soll (Beispiel Umzug: Adressinformation in Datenbank wird in diesem Moment falsch).
  5. Mangelnde fachliche Aussagekraft durch die Art der technischen Modellierung/Ablage oder Nutzung und Anzeige der Daten

Die Güte der Daten / Höhe der Qualität im Verwendungskontext

  1. Die praktisch benötigte Güte von Daten ergibt sich nicht aus absolut gültigen Qualitätsmaßstäben, sondern aus dem Verwendungskontext (beispielsweise Kundendaten, die einerseits für die Berechnung einer Kunden-Bonität verwendet werden, andererseits für eine Kundensegmentierung im Zielkundenmarketing. Im ersten Fall müssen strengere Regeln für die Datenqualität gelten, weil der Kunde direkt (negativ) betroffen sein kann. Im letzten Fall hingegen sind die Auswirkungen mangelnder Datenqualität weniger relevant, da in den Konsequenzen wahrscheinlich nicht direkt spürbar).

Daten brauchen Öffentlichkeit, um die Qualitätsmängel zu identifizieren

  1. Datenfehler im ERP-System werden zum Beispiel dort nicht immer entdeckt, da nicht alle Daten in diesem System verarbeitungsrelevant sind; sie zeigen sich erst in der Anzeige, etwa in einem Bericht
  2. Gerade referentielle Fehler werden erst offensichtlich, wenn alle Daten gemeinsam verarbeitet oder angezeigt werden

Fehlerbereingung immer so nah an der Entstehung der Daten wie möglich

  1. Lieber bei der Eingabe als später nach der Verarbeitung (zum Beispiel durch Vorkehrungen, dass nur gültige Werte erfasst werden durch Dublettenprüfung, Prüfung von Geschäftsregeln, vordefinierte Auswahlwerte etc. )
  2. Lieber im ERP-System als im Data Warehouse
  3. Lieber im Data Warehouse als im BI-Werkzeug oder Report

Datenqualitätsmanagement hat drei Dimensionen

  • Organisation: Verantwortlichkeiten, Organisationeinheiten, Anforderungsmanagement
  • Prozesse: Richtlinien, Anwenderprofile, Anwendungsfälle
  • Technologie: Architektur, Software, Konzepte, Einsatzprinzipien

Organisation und Prozesse sind wichtiger als Technologie

  • Organisatorische Aspekte haben einen größeren Einfluss auf Datenqualität als technische
  • Prozesse sind wichtiger als Tools

Die Verantwortung für Daten muss im Fachbereich liegen und muss geklärt werden

  1. Datenqualitätsmanagement ist keine IT-Aufgabe
  2. Bewährt hat sich die Management-Rolle „Data Owner“ (Definition und Überwachung von Qualitätskriterien, gesetzlichen Anforderungen (Aufbewahrungsfristen, Datenschutz u.Ä.) sowie die operative Rolle „Data Stewart“ zur laufenden Überwachung und Bereinigung von Daten

Datenqualitätsmanagement für alle Daten

  1. Für transaktionale Geschäftsdaten sowohl Stammdaten als auch Bewegungsdaten
  2. Maschinendaten
  3. Mensch-generierte Daten (z.B. Dokumente)

Datenqualität wird automatisch schlechter und überwacht und verbessert werden.

  1. Daten „altern“ und müssen laufend gepflegt werden
  2. Datenqualitäts-Metriken helfen, den Qualitätsstand zu überwachen

BARC Data Governance Day 2015

Data-Governance-Vorhaben sind komplex und verlangen klare technische und organisatorische Konzepte. Ein methodisches, strukturiertes Vorgehen ist dabei der Schlüssel zum Erfolg. Orientierung bietet der BARC „Data Governance Day 2015“ am 3.September 2015 in Baden (Schweiz). Die Veranstaltung vermittelt Fachwissen zu wesentlichen Aspekten einer Data Governance und bietet einen Einblick in den Anbietermarkt. Folgende Themen werden behandelt:

  • Datenstrategie und Governance
  • Data Life Cycle
  • Data Driven Organisation
  • Data Integration
  • Data Quality
  • Master Data Management
  • Data Life Cycle
  • Document Management

Neben Herstellerpräsentationen und einer Fachausstellung erwarten den Besucher Fachvorträge der BARC-Analysten und von Fachverbänden. Zielgruppe sind IT- und Business-Verantwortliche. Weitere Informationen und Anmeldung über diesen Link.

Lesen Sie auch hier auf der BARC-Website unsere kleine Artikelserie zur Data Governance!

(sa)