Definition: Was ist Datenqualität?
Datenqualität (oder auch Data Quality) bezeichnet die Erfassung sowie Aufbereitung von Daten (Informationen) und stellt deren Zustand bzw. Qualität fest. Dabei unterscheidet man zwischen guter und schlechter Datenqualität. Beide Zustände – sowohl gute als auch schlechte Datenqualität – können positive oder negative Auswirkungen auf das Unternehmen haben.
Inhaltsverzeichnis
Unsere Beiträge zum Thema Datenqualität
Melissa Data ist erstmals auf dem e-Commerce Day dabei
Weiterlesen
Wie Datenqualität den Unternehmenserfolg beeinflusst
Weiterlesen
Migrationsprojekte als Chance für eine bessere Datenqualität nutzen
Weiterlesen
Melissa Data feiert zehn Jahre Datenqualität in Deutschland
Weiterlesen
Dubletten vermeiden stellt eine hohe Datenqualität sicher
Weiterlesen
Wie B2B-Anbieter von hoher Datenqualität profitieren
Weiterlesen
Mit hoher Datenqualität auf dem internationalen Parkett punkten
Weiterlesen
Positive Customer Experience sorgt für mehr Kundentreue
Weiterlesen
Melissa Data ist Nischenplayer im Gartner® Magic Quadrant™ für Datenqualitätslösungen 2022
Weiterlesen
Hohe Datenqualität als Basis für funktionierende Loyalitätsprogramme
Weiterlesen
Der Unterschied zwischen Informations- und Datenqualität
Als Synonym für Datenqualität wird oft der Begriff „Informationsqualität“ verwendet. Das ist aber nur bedingt richtig. Nichtsdestotrotz stehen sich die Begriffe nahe bzw. folgen aufeinander. Die Grundlage für Informationen sind Daten, daher wirkt sich die Datenqualität auf die Qualität der Informationen aus, die aus den Daten gewonnen werden. So können zum Beispiel keine „guten“ Informationen aus schlechten Daten generiert werden.
Darüber hinaus wird Informationsqualität oftmals mit hoher Qualität gleichgesetzt. Allerdings fehlt zu solch einer wertenden Aussage eine relativierende Betrachtung, da die Qualität an bestimmten Merkmalen, Kennzahlen oder Anforderungen festgemacht werden muss. Deshalb ist die Qualität einer Information immer abhängig vom Kontext und / oder vom Nutzen und sollte niemals isoliert betrachtet werden.
Darum ist Datenqualität so wichtig
Daten sind zu einem wesentlichen Aspekt jedes Unternehmens geworden. Besonders für Entscheider ist die Datenqualität ausschlaggebend. Deren Basis bietet die Grundlage für viele (weitreichende) Entscheidungen. Laut Gartner Research sind schlechte, falsche und/oder unvollständige Daten für 9,7 Mio. Dollar Schaden pro Unternehmen verantwortlich.¹ Aber es entstehen nicht nur Umsatzverluste. Zusätzlich entstehende Kosten (z.B. für Transport, Recherche, Material) oder die Beschädigung der Reputation sind negative Auswirkungen von schlechter Datenqualität. Insbesondere bei Big-Data-Anwendungen/-Projekten sind die Daten größer, vielfältiger und schneller, was das Thema Datenqualitätsmanagement noch wichtiger macht.
Zudem bringt eine hohe Datenqualität zahlreiche Vorteile mit sich und ist deshalb so wichtig:
- Verbesserte Entscheidungsfindung: Durch qualitativ hochwertige Daten ist das Risiko, Fehlentscheidungen zu treffen geringer und potenzielle Auswirkungen sind besser vorhersehbar. Durch diese realen Ergebnisse haben auch die Verantwortlichen mehr Vertrauen in ihre Entscheidungen.
- Bessere Markt- und Zielgruppensegmentierung: Eine hohe Datenqualität ermöglicht es Unternehmen, fundierte Markt- und Zielgruppensegmentierungen vorzunehmen. Dies führt zu potenziellen Neukunden und zur Erschließung neuer Märkte. Somit sind Unternehmen der Konkurrenz einen Schritt voraus.
- Effektive Marketingkampagnen: Neben der Verbesserung der Segmentierung können Sie mit qualitativen Daten mehr über Ihre Zielgruppe erfahren und so personalisierte Angebote bzw. Kampagnen unterbreiten.
- Erhöhte Produktivität: Durch die richtigen Daten können Zustellungen fristgerecht und korrekt ausgeliefert werden. Dies reduziert die Arbeitszeit für eine Datenvalidierung und Fehlerkorrekturen. Die „frei gewordene“ Zeit kann für wertschöpfende Aufgaben verwendet werden.
- Datenschutz / Compliance: Es ist wesentlich einfacher, die DSGVO und weitere Vorschriften einzuhalten, wenn nur korrekte Daten vorliegen.
Wie kann ich Datenqualität messen und verbessern?
Um die Datenqualität zu messen, gibt es bestimmte Kennzahlen. Am bekanntesten sind die folgenden elf Datenqualitätskriterien:
- Vollständigkeit: Ein Datensatz muss alle notwendigen Attribute enthalten.
- Eindeutigkeit: Jeder Datensatz muss eindeutig interpretierbar sein.
- Korrektheit: Die Daten sollten (größtenteils) mit der Realität übereinstimmen.
- Aktualität: Alle Datensätze müssen jeweils dem aktuellen Zustand der abgebildeten Realität entsprechen.
- Genauigkeit: Die Daten müssen in der jeweils geforderten Exaktheit vorliegen.
- Konsistenz: Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen.
- Redundanzfreiheit: Innerhalb der Datenbank dürfen keine Dubletten vorkommen.
- Relevanz: Der Informationsgehalt von Datensätzen muss den jeweiligen Informationsbedarf erfüllen.
- Einheitlichkeit: Die Informationen eines Datensatzes müssen einheitlich strukturiert sein.
- Zuverlässigkeit: Die Entstehung der Daten muss nachvollziehbar sein.
- Verständlichkeit: Die Datensätze müssen in ihrer Begrifflichkeit und Struktur mit den Vorstellungen der Fachbereiche übereinstimmen.

Eine hohe Datenqualität ist ein fortlaufender Prozess. Zu Beginn sollte mit allen Fachbereichen ein Single Point of Truth bestimmt werden – ein System, wo zukünftig alle Daten gespeichert und genutzt werden. So werden Datensilos aufgelöst und Dubletten vermieden. Ab dem Zeitpunkt, an dem eine saubere Basis vorliegt (z.B. Adressprüfung via Batch-Verfahren), sollten Unternehmen die Daten direkt bei der Erfassung am Point-of-Entry validieren und überprüfen lassen (z.B. mithilfe einer Adressvalidierung). Damit gelangen nur noch korrekte Daten in das System und eine Gewährleistung der Datenqualität ist sichergestellt. Wenn diese Schritte getan sind, empfiehlt sich ein Datenqualitätsmanagement, womit die Daten laufend überwacht und kontrolliert werden. Letztendlich lohnt sich hier jeder Euro, da die Kosten, einfach nichts zu tun, um ein Vielfaches höher ausfallen.
Quellen:
¹ https://www.dnb.com/de-de/wissen/studien/datenqualitaet-die-4-kriterien/