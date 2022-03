Datenbestand oder Datenstrom analysieren

Im vorherigen Beispiel hat das Unternehmen in seinem vorhandenen statischen Datenbestand gegraben, sozusagen in der Mine nach Gold geschürft. Es gibt jedoch noch eine zweite Möglichkeit, nach Gold zu suchen – im Fluss stehen und vorbeiströmendes Wasser und Schlamm nach Nuggets durchsieben. Auch diese Strategie kann auf Daten angewandt werden. Die Frage lautet demnach: Schürfen oder Sieben?

Der vorbeirauschende Datenfluss besteht oft aus Streaming- oder Transaktionsdaten, aus denen Informationen zum Zeitpunkt der Entstehung extrahiert werden. Ein häufiger Anwendungsfall ist die Betrugserkennung bei Kreditkartenzahlungen. Jeden Tag wickeln die großen Kreditkartenanbieter weltweit Milliarden von Zahlungen ab. Ein nachträgliches Analysieren in den vorhandenen Datenbeständen, welche Transaktion betrügerisch war, hilft in der Regel nichts. Die Betrüger sind entweder nicht mehr greifbar oder es ist sehr schwer, wieder an das Geld zu kommen.

Ein sinnvolles Betrugserkennungssystem muss also in dem Moment anschlagen, in dem die Zahlung durchgeführt oder angefragt wird. Dazu definieren die Kartenanbieter ein Regelwerk, das jede Transaktion in Echtzeit prüft und bei einem vermuteten Betrug die Zahlung ablehnt.

Eine einfache Regel basiert zum Beispiel auf Entfernungen und Transaktionszeitpunkten. Wird mit einer Kreditkarte um 13:00 in Hamburg in einem Geschäft bezahlt und um 13:15 wird versucht, in London Geld abzuheben, ist das offensichtlich nicht die gleiche Karte. Das System kann zwar nicht entscheiden, welche der beiden Transaktionen betrügerisch ist, aber es wird die zweite aus Sicherheitsgründen ablehnen.