business-wissen.de

DatenqualitätDialog mit dem Kunden verbessern

Von Holger Wandt, Human Inference B.V.
Wie schaffen es Unternehmen, den Dialog mit ihren Kunden zu verbessern? Eine bessere Datenqualität und eine einheitliche Sicht auf den Kunden sind die Lösung.
erschienen: 22.02.2010

Die befragten Führungskräfte aus dem Marketing planen mehrheitlich für das Jahr 2010 eine Verbesserung der Kundenbeziehungen. Allen voran sind hier der Handel mit 93,3 Prozent und die Chemie-Branche mit 87,5 Prozent der Meinung, dass die Verbesserung des Kundendialogs die kurzfristig wichtigste Maßnahme zur Bewältigung der Krise und zur Umsatzsteigerung darstellt. Die Maßnahmenschwerpunkte liegen dabei branchenübergreifend auf den kundennahen Bereichen Vertrieb und CRM.

Doch um da hinzukommen, müssen zunächst die Voraussetzungen dazu geschaffen werden. Die wichtigste Voraussetzung ist eine hohe Qualität der Kundendaten. Datenaudits zeigen regelmäßig, dass durchschnittlich zwischen 25 und 30 Prozent der Daten in Kundendatenbanken eines Unternehmens fehlerhaft oder sogar komplett falsch sind. Die direkten Kosten, die sich daraus ergeben, kann man in der Regel ganz konkret beziffern. Dazu zählen etwa Material- und Portokosten, die entstehen, wenn sich etwa Dubletten oder fehlerhafte Adressdaten in der Kundendatenbank befinden und die Mailings entweder an die falsche Adresse oder auch doppelt verschickt wurden.

Die tatsächlichen Kosten sind allerdings noch höher. Zum Beispiel, wenn ein Kunde aus Verärgerung zur Konkurrenz wechselt. In dem Fall handelt es sich um einen verlorenen Lebenszeitwert und die Kosten dafür sind in der Regel um ein Vielfaches höher als die Portokosten, die durch falsche Adressen und Dubletten entstehen. Hier kann der Verlust leicht in die Millionen gehen.

Alle Teile der Wertschöpfungskette betroffen

Mangelhafte Datenqualität und Probleme bei der Integration dieser Daten wirken sich auf die unterschiedlichsten Geschäftsbereiche eines Unternehmens aus. Von der Logistik über das Marketing und den Vertrieb bis hin zu Beschaffung und Personalwesen sind praktisch alle Teile der Wertschöpfungskette betroffen. Und Aktivitäten, die damit in Zusammenhang stehen, sind reine Zeit- und Geldverschwendung. Das Einpflegen von gleichen Kundeninformationen in verschiedene Daten etwa oder die Korrektur fehlerhafter Daten tragen ebenso wenig zur Wertschöpfung des Unternehmens bei wie die Suche nach verschwundenen Daten oder die manuelle Anreicherung von Kundendaten in einem System. Auch das Zusammenstellen von Kundendaten über zersplitterte Datenbanken hinweg oder die Bearbeitung und Lösung von Beschwerden, die mit Kundendaten zusammenhängen, verursachen unnötige Kosten.

Doch warum akzeptieren so viele Unternehmen diesen verschwenderischen und teuren Ansatz? Mitarbeiter machen nun einmal Fehler bei der Eingabe von Kundendaten in Datenbanken. Da werden Namen falsch geschrieben oder Informationen weggelassen, sodass die Datensätze fehlerhaft oder unvollständig sind. Daran wird sich auch in Zukunft nichts ändern.

Kundendaten sind über das ganze Unternehemen verstreut

Nicht wenige Unternehmen verlassen sich außerdem auf eine IT-Infrastruktur, die auf unterschiedlichen Datenbanken und Applikationen aufbaut. Diese Silo-Architektur ist sehr verbreitet, weil die Firmen entlang ihrer Wertschöpfungskette die spezifischen Business-Prozesse innerhalb ihrer primären Strukturen unterstützen müssen. In der Regel verlassen sie sich dabei auf eine ganze Reihe verschiedener ERP-, CRM-, Kundenservice-, Rechnungs- und anderer Front- und Back-Office-Systeme.

In vielen Fällen ist diese Sammlung unterschiedlicher Datenbanken und Applikationen allerdings nicht oder nur sehr mangelhaft integriert. Und das bedeutet, dass die Kundendaten meist über das ganze Unternehmen verstreut sind. Entsprechende Datenqualitätssoftware kann zwar viele Probleme innerhalb der einzelnen Silos lösen, bietet aber keine akkurate und umfassende Übersicht über jeden einzelnen Kunden über die verschiedenen Datenbanken hinweg.

In den meisten Unternehmen ist diese Infrastruktur historisch gewachsen. Die ursprüngliche Zielsetzung bei der Schaffung von CRM-Systemen lag zwar darin, alle Informationen und Prozesse, die zu einem Kunden gehören, in einem einzigen System zusammenzufassen. Doch in vielen Unternehmen zeigte sich recht bald, dass dieser Ansatz nicht zu verwirklichen ist. Und was die Sache oft noch schlimmer macht: Sobald man glaubt, nun endlich das richtige System gefunden und implementiert zu haben, wird der Erfolg durch eine Firmenfusion oder eine Übernahme wieder zunichte gemacht.

CDI-Ansatz: eine ganzheitliche Sicht auf die Kundendaten

Als Werkzeug für eine einheitliche Kundensicht scheitert CRM vor allem wegen seiner „Single System“-Philosophie. Jedes Unternehmen hat nun einmal mit einer historisch gewachsenen Vielzahl von Systemen zu kämpfen, die alle unterschiedliche Geschäftsprozesse unterstützen. Aus diesem Grund wird seit einiger Zeit dem CDI-Ansatz (Customer Data Integration), auch bekannt unter dem Namen „Master Data Management“, vermehrt Aufmerksamkeit geschenkt. Er stellt eine tragfähige Lösung zur Schaffung einer ganzheitlichen Sicht auf die Kundendaten dar.

Dabei handelt es sich – so die Definition von Gartner – um

„eine Kombination aus Technologie, Prozessen und Services, die es ermöglicht, aus einer Vielzahl von Kanälen, Branchen und Abteilungen, Kundendaten aus verschiedenen Quellen und Systemen zu beziehen und so eine akkurate, zeitnahe und umfassende Sicht auf die Kunden erlaubt.“

Im technologischen Teil von CDI spielt die Matching-Engine eine entscheidende Rolle. Sie sorgt innerhalb und über die Grenzen der verschiedenen heterogenen Datenbanken hinweg für die Zuordnung und Gruppierung der Kunden.

Wenn es also zu einem Kunden zwei verschiedene Einträge gibt, die aber in verschiedenen Datenbanken aufgezeichnet sind, dann erkennt die Matching-Engine diese Verbindung und führt die beiden Eintragungen in derselben Gruppe zusammen. So ist es möglich, ein zentrales Register für Kundendaten einzurichten, welches die „Goldene Kundenakte“ enthält sowie Verweise auf die Originalquelle.

High Precision Matching: Computerlinguistik zur Spracherkennung und -synthese

Mit Hilfe von „High Precision Matching“ lassen sich im Rahmen von CDI-Projekten die Kundendaten automatisiert „säubern“. Um eine hohe Datenqualität zu liefern, muss die Matching-Engine jedoch zum Beispiel erkennen können, dass es sich bei „BMW“ und „Bayerische Motorenwerke“ um ein- und dasselbe Unternehmen handelt. Deshalb kommen beim „High Precision Matching“ – über die üblichen mathematischen Prozeduren zur Dublettenerkennung und Adressvalidierung hinaus – auch wissensbasierte Methoden zum Einsatz, die Einsichten der Computerlinguistik zur Spracherkennung und -synthese anwenden. So werden unter anderem

  • Länder- und Subjekt-spezifisches Wissen,
  • linguistische Regeln wie phonetische Konversationen und Vergleiche sowie
  • Geschäftsregeln und Algorithmen wie beispielsweise den Austausch von Buchstaben oder kontextabhängige Akronyme

genutzt, um Ähnlichkeiten zwischen den Eintragungen in den verschiedenen Datenbanken zu finden.

So beruht der Treffer zwischen „EVO AG“ und „Energieversorgungsgesellschaft Offenbach“ zum Teil auf dem Erkennen kontextabhängiger Akronyme und dem Subjekt-spezifischen Wissen über juristische Formeln beziehungsweise Wortzusammensetzungen in der deutschen Sprache: „AG ist im Deutschen die gängige Abkürzung für „Aktiengesellschaft“, dessen Wortteil „gesellschaft wiederum häufig in Wortzusammensetzungen genutzt wird – einem gängigen Vorgang in der deutschen Sprache.

Dieser Matching-Ansatz wird mit Methoden kombiniert, die statistische und mathematische Algorithmen, Qualitativaussagenlogik und die Häufigkeit kontextabhängiger Regeln nutzen, um den Grad der Übereinstimmung zwischen verschiedenen Eintragungen in den Datenbanken zu bestimmen. Hier spielen vor allem Muster, mit einem gewissen Toleranzspielraum für Fehler, eine wichtige Rolle. Dabei drückt diese Methode die Wahrscheinlichkeit einer Übereinstimmung in der Regel in Prozenten aus und trifft auf dieser Basis Entscheidungen. Ein Beispiel dafür: Das Wort „London“ hat unterschiedliche Bedeutungen. Es kann beispielsweise ein Nachname sein oder eine geographische Bedeutung, die „Hauptstadt von Großbritannien“, haben. Die Wahrscheinlichkeit, dass es sich bei dem Wort „London“ um einen Nachnamen handelt, ist dabei aber ungleich geringer als die Wahrscheinlichkeit, dass es sich um eine Ortsbezeichnung handelt.

Fazit

Die Kombination der verschiedenen Matching-Verfahren in einer hybriden Vorgehensweise, wie sie moderne Datenqualitätslösungen verwenden, führt im Ergebnis zu einer wesentlich höheren Trefferquote beim Erkennen von Dubletten und fehlerhaften Datensätzen. Deren weitestgehende automatische Korrektur verbessert den Erfolg von Marketingaktionen zur Kundenbindung erheblich und macht sich schnell bezahlt. Zusammen mit dem Ansatz der Customer Data Integration erhalten Unternehmen so eine ganzheitliche Sicht auf die Kundendaten und können sich der Hauptaufgabe im Jahr 2010 widmen: der Verbesserung des Dialogs mit ihren bestehenden Kunden.

[Bild: Fotolia.com]


Über den Autor
Holger Wandt

Holger Wandt arbeitet seit 1991 für Human Inference. Als Principal Advisor ist er verantwortlich für alle wissensbezogenen Fragen zur Datenqualität. Daneben ist er Studienleiter der Masterclass Data Quality Management an der Nyenrode Business University und Dozent der linguistischen Fakultät an der Universität Utrecht.

AnschriftHolger Wandt
Human Inference B.V.
Fritz-Vomfelde-Str. 34-38
40547 Düsseldorf
Tel.0211-5228150
E-Mailinfo@humaninference.de
Webwww.humaninference.de