Was ist Datenqualität?

 

Im weiteren Sinne beinhaltet der Begriff Datenqualität die Beurteilung, wie gut Daten für einen bestimmten Zweck verwendbar sind. Eine schlechte Qualität der Daten kann unmittelbare Auswirkungen auf die Unternehmensleistung haben. Verschiedene Konsequenzen einer schlechten Datenqualität sind beispielsweise:

  • Reduzierte Einnahmen
  • Vergeudete Zeit und Ressourcen
  • Eingeschränkter Kundenservice
  • Reputationsschaden

 

Es gibt verschiedene Dimensionen, mit denen die Datenqualität gemessen werden kann. Dazu gehören:

data quality

 

Aktualität der Daten

Daten wie beispielsweise Kundeninformationen ändern sich relativ häufig. Personen wechseln ihre Arbeitsstelle, sie ziehen um oder ändern ihre E-Mail-Adresse. Veraltete E-Mail-Adressen können vor allem im E-Mail-Marketing zum Problem werden, da sie zu Hard Bounces führen und so die Sender-Reputation schädigen können.

Vollständigkeit

Unvollständige Datensätze kosten Zeit und Geld. Vor allem gehen damit Upsell-Möglichkeiten verloren.Daher ist es wichtig, im Unternehmen Standards festzulegen, welche Informationen unbedingt benötigt werden. Diese müssen auf den verschiedenen Kommunikationskanälen eingefordert werden und in den dazugehörigen Formularen Pflicht sein. So sind dann auch Personalisierungen oder Automatisierungen einfacher umzusetzen.

Richtigkeit

Die gesammelten Daten sollten der Realität entsprechen. Fehlerhafte Daten können zum Beispiel durch fehlerhafte Messungen oder falsche Angaben von Personen stammen. Hier können beispielsweise Validation Rules helfen. Eine Validation Rule ist eine Regel für ein Eingabefeld, die prüft, ob die vom Benutzer eingegebenen Daten bestimmte Kriterien erfüllen, bevor der Benutzer den Datensatz speichern kann.

Konsistenz

Gesammelte Daten sollten gewisse im vorhinein festgelegte Regeln einhalten, z.B. Formatierung, Schreibweise und Sprache.

Duplikate

Duplikate können dazu führen, dass Prozesse doppelt ausgeführt werden und dass beispielsweise Kunden mehrfach von verschiedenen Personen kontaktiert werden. Die Implementation eines Duplikat-Managements stellt sicher, dass keine Daten doppelt in einem System sind und es so zu unnötigen Aktivitäten kommt.

Nutzung

Verwende die Daten oder lösche sie. Von Daten, die keinen Verwendungszweck haben, solltest du dich verabschieden.

 

Herausforderungen in Bezug auf Datenqualität

 

Heutzutage ist es relativ leicht, an Daten heranzukommen. Trotzdem sind die Herausforderungen nicht kleiner geworden. Dies beinhaltet zum Beispiel:

  • Die Vielfalt der Datenquellen bringt eine Fülle von Datentypen und komplexen Datenstrukturen mit sich und erhöht so die Schwierigkeit der Datenintegration.
  • Das Datenvolumen ist heutzutage enorm und es ist schwierig, die Datenqualität innerhalb eines angemessenen Zeitraums zu beurteilen.
  • Daten ändern sich sehr schnell und die "Aktualität" der Daten ist sehr kurz, was höhere Anforderungen an die Verarbeitungstechnologie erfordert.

 

Datenmanagementplan

 

Um die Herausforderungen zu meistern, ist es sinnvoll, einen Datenmanagementplan zu erstellen. Ein typischer Datenmanagementplan enthält Standards für die Erstellung, Verarbeitung und Pflege von Daten. Folgende Standards solltest du dabei bedenken:

Naming

Etabliere Konventionen für die Namensgebung und setze diese konsequent um. Wie beispielsweise mit Abkürzungen oder Suffixen (AG, GmbH, etc.) umgegangen werden soll.

Formatierung

Finde heraus wie unterschiedliche Datentypen (z.B. Datum oder Währung) formatiert werden müssen und stelle sicher, dass neue Daten im gewünschten Format erfasst werden.

Workflow

Bestimme einen Prozess, den eingehende Daten durchlaufen müssen. Dies beinhaltet, wie und wann Daten generiert, geprüft, aktualisiert und archiviert werden.

Datenqualität

Setzte Standards für die Datenqualität und kontrolliere, ob diese Standards erreicht werden. Im Idealfall sollte die Qualität mit einem Score gemessen werden.

Sicherheit und Berechtigungen

Bestimme angemessenen Datenschutzstufen. Stelle sicher, dass die gesetzlichen und vertraglichen Verpflichtungen eingehalten werden.

 

Fazit

 

Die Verbesserung der Datenqualität ist ein kritisches Bestreben, da Daten als Grundlage aller Aktivitäten eines Unternehmens dienen. Schlechte Datenqualität führt zu fehlerhaften Reportings, was zu falschen Entscheidungen und sicherlich zu wirtschaftlichen Einbussen führt. Der Umgang mit Daten erfordert eine gezielte Planung und Umsetzung, um die heutigen, daten-bezogenen Herausforderungen zu meistern.

 

Quellenangabe



https://trailhead.salesforce.com/content/learn/modules/data_quality/data_quality_assess_your_data

https://trailhead.salesforce.com/content/learn/modules/data_quality/data_quality_improve_quality

https://towardsdatascience.com/an-introduction-to-data-quality-951cc6fe0274

https://datascience.codata.org/articles/10.5334/dsj-2015-002/