Doppelte Adressen schleichen sich in jede Kundendatenbank ein: Ohne spezielle Gegenmaßnahmen sind es trotz guter Pflege meist 4-6 Prozent. Neben doppelten Kosten und einem schlechten Image bei doppelt angeschriebenen Kunden entstehen im CRM-System besonders schädliche Folgen: Denn die Dubletten verteilen sich nicht gleichmäßig, sondern häufen sich an der schlimmsten Stelle – bei 5 Prozent Gesamtdubletten sind es oft 30 Prozent bei den Stammkunden. Verteilen sich wichtige Informationen zu einem Kunden auf unterschiedliche Kundennummern, können viele CRM-Nutzenversprechen nicht eingelöst werden. Dubletten verfälschen Marketing-Controlling und Warenkorb-Analysen, behindern wirksames Cross-Selling und zerstören den CRM-Regelkreis. Vermutlich haben auch Sie schon doppelte Werbung erhalten: Der gleiche Brief, der gleiche Absender – nur Ihr Name war etwas unterschiedlich geschrieben (Meier / Mayer). Durch Tippfehler, Schreibfehler, Abkürzungen werden die gleichen Adressen immer wieder anders erfasst. Da die meisten Datenbankprogramme nur buchstabengetreu vergleichen, merkt der Computer nicht, dass eine Adresse bereits in der Datenbank eingetragen ist. Es entstehen Dubletten.

Sind in typischen, gut gepflegten Kundendatenbanken meist 4-6 Prozent der Adressen doppelt enthalten, so findet man sogar in explizit als „bereinigt“ geltenden Datenbeständen nicht selten noch 1-2 Prozent Restdubletten. Die Folgen sind: Doppelte Kosten für Porto, Drucksachen und Lettershop. Mit oft erheblichem Aufwand will man beim Kunden einen möglichst persönlichen Eindruck erwecken. Durch das Signal „Massenwerbung“ wird dieser jedoch zunichte gemacht.

Im CRM kommen zu diesen Auswirkungen neue, schwerwiegendere hinzu: Denn CRM ist ein Regelkreis, der durch Rückkopplungseffekte eine individuelle Betreuung jedes Kunden erreichen soll. Jeder Kunde soll so betreut werden, wie es auf seine Bedürfnisse am besten passt – und wie er sich für die Unternehmen am meisten lohnt. Durch Aktionen (Werbung) und Reaktionen (Anfragen, Bestellungen, Reklamationen) soll sich das System immer besser auf den einzelnen Kunden einspielen. Dieser Regelkreis wird gestört, wenn Aktion und Reaktion nicht dem gleichen Kundendatensatz zugeordnet werden. Genau das passiert aber, wenn der Kunde doppelt angelegt wurde.

100 Wege zu Dubletten

Will man Dubletten finden oder das Neuanlegen von Dubletten verhindern, dann muss man sich erst einmal darüber klar werden, was alles so „schief gehen“ kann.

Bei Privatadressen führen Vertipper, Schreibfehler, verschiedene Namensschreibweisen, Hörfehler und Denkfehler zu Dubletten – typische Beispiele:
Vertipper: Alexander wird zu Alexnader
Schreibfehler: Chryschanowski wird zu Krischanoffsky
Verschiedene Namensschreibweisen: Mattias/Mathias, Silvia/Sylvia, Meier/Mayr/Meier
Hörfehler: Sponheimstr. wird zu Sponhainstr.
Denkfehler: Friedrich-Silcher-Weg wird zu Friedrich Schiller-Weg, weil das Gehirn bei Friedrich schon auf Schiller schaltet.

Bei Firmenadressen kommen zusätzlich zu den Problemen bei Privatadressen Vertauschungen, Zusätze, Word-Mutationen und Abkürzungen hinzu – typische Beispiele:
Vertauschungen: Müller Möbel / Möbel Müller
Zusätze: Möbel Müller Müller / Möbel-Fabrikation
Wort-Mutationen: Müller Direkt- und Dialogmarketing
Abkürzungen: Westf. Inst. F. Agrarökonomie / Agrarökonomisches Institut Westfalen

Diese Dubletten entstehen durch die fehlerhafte Eingabe einer Adresse. Aber Dubletten können auch dadurch entstehen, dass der Absender selbst den Firmennamen oftmals verkürzt („AFD“ heißt eigentlich „Agentur für Dialogmarketing“) oder unterschiedlich auf seinen Briefen, Faxen etc. angibt.

Suchen und Finden

Um Dubletten zu finden, wurden über die Jahre verschiedene Verfahren entwickelt:

Matchcode: Es werden beispielsweise Postleitzahl, Hausnummer, die erste Stelle des Nachnamens und der erste Buchstabe des Nachnamens verglichen. Ein Vorteil dieses Verfahrens besteht darin, dass es sehr schnell ist. Beim Vergleich des dritten Buchstaben von „Mayer“ und „Meier“ würde so keine Dublette gefunden werden. „Maier“ und „Maihofer“ wären hingegen wieder gleich. Dieses Verfahren erzeugt allerdings zu viel Overkill (es werden Dubletten gefunden, die gar keine sind) und zuviel Underkill (wirkliche Dubletten werden nicht gefunden).

Phonetisches Verfahren: Der Gleichklang der Adressen wird untersucht. Bei Wolfgang und dem Vertipper Woglfang würde ein phonetisches Verfahren keine Dublette finden, da diese, durch einen Vertipper erzeugte Dublette, nicht gleich klingt. Da oft Vertauscher, Abkürzungen und Word-Mutationen zu Dubletten führen, ist eine reine Phonetik kaum geeignet, um Firmenadressen zu bereinigen. Eine Phonetik ist sprachabhängig, daher sind allgemeine Phonetiken für Abgleiche kaum geeignet, da keine ausreichende Trennschärfe erzielt wird.

Ähnlichkeitsverfahren: Dabei wird das menschliche Ähnlichkeitsempfinden nachgebildet. Die zu vergleichenden Adressen werden zerlegt und die einzelnen Bestandteile verglichen. Die Trennschärfe ist bei diesem Verfahren am besten. Das bedeutet, dass die wahrscheinlichsten Dubletten gefunden werden. Diese Verfahren werden allerdings nur in High-End-Software eingesetzt. Speziell bei schwierigen Firmenadressen erzielen Ähnlichkeitsverfahren noch gute Ergebnisse. Darüber hinaus sind Ähnlichkeitsverfahren (im Gegensatz z.B. zu Phonetik) relativ unabhängig von der Sprache und damit direkt oder mit geringen Anpassungen/Ergänzungen international einsetzbar.

Generalreinemachen

Spätestens beim Aufsetzen eines neuen CRM-Systems sollte dafür gesorgt werden, dass in dem neuen System erstklassige Datenqualität herrscht und nicht schon mit „Adressmüll“ gestartet wird. Oft werden zu diesem Zeitpunkt diverse bestehende Sammlungen von Adressdaten zusammengeführt, beispielsweise aus dem ERP-System, aus Kontaktmanagern oder aus Excel-Listen.

Dublettenabgleich innerhalb der einzelnen Datenbestände sowie zwischen den zusammengeführten Beständen ist hier als Erstes geboten. Aber oft liegt bezüglich der Datenqualität noch weit mehr im Argen. Typisch ist ein uneinheitlicher Datenaufbau. Sind beispielsweise drei Firmenfelder vorhanden, so wir das dritte Feld gern genutzt, um „Sonderinfos“ festzuhalten. Mal ist dort ein spezieller Ansprechpartner vermerkt, mal steht lapidar „nimmt nie jemand ab“ drin. Man kann sich ausmalen, welche Folge ein Mailing mit diesen Daten hätte. Offensichtlich muss hier eine Bereinigung und Vereinheitlichung statt finden.

Weniger offensichtlich sind Fehler in der Postanschrift. Falsch geschriebene Straßennamen, Ortsnamen oder fehlerhafte bzw. alte Postleitzahlen sollten korrigiert werden. Das spart Geld durch die Vermeidung von unnötigen Rückläufern und Falschzustellungen und hinterlässt beim Empfänger einen professionellen Eindruck.

Für die genannten Aufgabenstellungen gibt es eine Vielzahl von Standardprogrammen (beispielsweise von der Firma OMIKRON). Diese Standardprogramme können meist flexibel auf gängigen Datenformaten wie „Comma separated Value“ aufsetzen – Formate, in denen die zusammenzuführenden Altdaten meist ohnehin vorliegen.

Sauber bleiben

Natürlich sollen die jetzt bereinigten Daten in der neuen CRM-Lösung „sauber bleiben“. Dabei besteht aber bei jeder Neueingabe die Gefahr von Dubletten. An dieser Stelle helfen auch Zusatzprogramme, welche „ab und zu“ die Datenbestände prüfen, wenig. Hier ist eine direkt in die CRM-Lösung integrierte Dublettenprüfung gefordert, die sofort bei der Eingabe auf mögliche Überschneidungen hinweist. Wichtig ist dabei eine schnelle Reaktion und ein angemessenes User-Interface, welches übersichtlich alle möglichen Dubletten aufzeigt und eine einfache Wahl ermöglicht. Wichtig ist aber insbesondere, dass die Dublettenprüfung optimal auf den Sprachraum abgestimmt ist, aus dem die Adressen stammen. Produkte aus den USA liefern für europäische Adressen oft suboptimale bis unakzeptable Ergebnisse.

Fazit

Datenqualität – insbesondere bei Adressdaten – ist von essentieller Bedeutung für erfolgreiche CRM-Lösungen. Die oft stiefmütterliche Behandlung dieses Themas im Rahmen von CRM-Projekten kann sich bitterlich rächen. Eher harmlose Folgen sind ebenso teure wie peinliche Doppelmails an Kunden und Interessenten. Die Zuordnung von Eigenschaften, Anfragen, Bestellungen etc. auf scheinbar mehrere Kundennummern (wegen Dubletten) kann schließendlich den ganzen CRM-Regelkreis zu Nichte machen und „Closed loop Marketing“ ad Absurdum führen. Um dies zu verhindern, steht heutzutage eine Vielzahl leistungsfähiger Werkzeuge zur Dublettenbereinigung und Datenqualitätsverbesserung zur Verfügung, die gerade bei der Einführung von CRM-Lösungen genutzt werden sollten. Um die Datenqualität im laufenden Betrieb zu erhalten, benötigt die CRM-Software eine integrierte Dublettenprüfung. Hier sollte – schon bei der Produktauswahl – geprüft werden, ob die Dublettenerkennung entsprechend leistungsfähig ist, insbesondere in den relevanten Sprachen.

Team4 GmbH

D-52134 Herzogenrath

Telefon: (+49) 02407/9582-0

Web: www.team4.de