Duplicate Elimination

Dubletten vermeiden stellt eine hohe Datenqualität sicher


Max Mustermann, Mustermann Max, M. Mustermann … ein Name, zahlreiche Varianten. Das Risiko, dass Unternehmen Kontaktdaten mehrfach vorhalten, ist groß. Experten schätzen, dass jede Datenbank durchschnittlich 8 bis 10 % Dubletten beinhaltet. Bei Unternehmen, die Daten ihrer Kunden bzw. Interessenten in unterschiedlichen Systemen speichern, kann dieser Wert noch um ein Vielfaches größer sein. Die Folgen sind höhere Kosten durch Mehrfachaussendungen, verärgerte Kunden und falsche unternehmerische Entscheidungen.

Inhaltsverzeichnis

Wie entstehen Dubletten?

Zunächst ist zu klären, was eine Dublette überhaupt ist. Wikipedia definiert sie als „einen Datensatz in einer Datenbank, der redundant, d. h. mehrfach, vorhanden ist, dessen Redundanz aber aufgrund abweichender Schreibung nicht durch Prüfung auf gleiche Inhalte erkannt werden kann“1.

Die Gründe für diese redundanten Daten sind vielfältig. So kann es zu Dubletten kommen, wenn Unternehmen

  • Kontaktdaten über unterschiedliche Lösungen abfragen,
  • es bei neu eingehenden Daten versäumen, zu überprüfen, ob diese bereits vorhanden sind, oder
  • nicht regelmäßig ihre Datenbestände überprüfen.

„Doppelt genäht“ ist nicht immer besser

Wie bereits erläutert, sind Dubletten innerhalb der gespeicherten Kontaktdaten problematisch. Hier sind zunächst die höheren Kosten beispielsweise bei einem postalischen Mailing zu nennen. Aufwendige Kataloge werden in höheren Auflagen als notwendig produziert, und auch höhere Portokosten fallen an. Diese Mehrfachaussendungen kratzen außerdem am seriösen Image des Unternehmens und sorgen beim Kunden für Unverständnis.

Ein weiterer Grund liegt darin, dass Unternehmen auf Basis ihrer Kundenzahl wichtige Entscheidungen treffen. Dazu ein einfaches Beispiel: Ein kleines Handelsunternehmen generiert über sein Shopsystem jährlich 40.000 Euro Umsatz. In seiner Datenbank hat es 10.000 Kontaktdaten erfasst. Ergo beträgt das durchschnittliche Bestellvolumen pro Jahr 40 Euro. Um den Bestellwert zu steigern, initiiert das Unternehmen ein Treueprogramm, das Kunden belohnt, die jährlich Ware im Wert von mehr als 50 Euro ordern. Dabei wird allerdings übersehen, dass 20 % der Kontaktdaten redundant sind und damit die Datenbasis künstlich aufblähen. Das heißt, dass die Kunden bereits im Wert von durchschnittlich 50 Euro einkaufen. Das ausgerufene Treueprogramm wird somit den Umsatz kaum steigern und das Unternehmen hat zusätzliche Kosten durch die offerierten Boni.

Darüber hinaus spielt die Einhaltung der DSGVO eine wichtige Rolle. Hiernach sind Unternehmen verpflichtet, Daten von Personen zu löschen, wenn sie dazu aufgefordert werden. Jedoch ist es für ein Unternehmen kaum möglich, die Daten zur Person Max Mustermann konsequent zu löschen, wenn sie in unterschiedlichen Systemen unter „Max Mustermann“, „Mustermann Max“ und „Herr Mustermann“ geführt werden. Das Risiko ist hoch, dass die Daten nur einmal entfernt werden und der Betroffenen weiterhin Schreiben erhält, der daraufhin gegen das verantwortliche Unternehmen klagen könnte.

melissa-de-blog-dubletten-07-03-2023-1024x576
Ein Name – zahlreiche Varianten (Quelle: Melissa Data GmbH)

Wie lassen sich Dubletten identifizieren?

Grundsätzlich ist die manuelle Prüfung der vorhandenen Kontaktdaten von der Software-basierten zu unterscheiden. Erfolgt die Prüfung manuell, müssen Mitarbeiter jeden einzelnen Datensatz aufrufen und prüfen, ob dieser nochmals vorhanden ist. Diese Variante ist zeitaufwendig und fehleranfällig. Der Aufwand potenziert sich, wenn die Daten in unterschiedlichen Systemen vorliegen, welche die Informationen in variierender Reihenfolge verwalten. Mithilfe geeigneter Softwarelösungen gelingt das Identifizieren von Dubletten deutlich effizienter und schneller.

Schlussfolgerung

Dubletten reduzieren maßgeblich die Datenqualität in Unternehmen und sollten deshalb unbedingt vermieden werden. Gelingt dies, so liefert jeder Datensatz einen eindeutigen Kontakt, bei dem daran anschließend die Adressdaten validiert werden sollten (Stichwort: Golden Record). Auch dies geschieht mit einer Software-basierten Lösung effizient. Im Ergebnis verfügen Unternehmen über eine saubere Datenbasis, mit der sie unnötige Kosten vermeiden und fundierte Entscheidungen treffen können. Nehmen Sie mit uns Kontakt auf, damit wir Ihre Kundendaten von Dubletten befreien!

 

Quellen:

1 https://de.wikipedia.org/wiki/Dublette_(Datenbank)

Similar posts