Identitätsauflösung: Data Warehouse vs. Kundendatenplattform

Veröffentlicht: 2022-08-16

Jeder wünscht sich eine Single Source of Truth für Kundendaten, aber was damit verbunden ist, hängt davon ab, wen Sie fragen.

Sicher, das Data Warehouse ist ein „einziger Speicher“ für Kundendaten, die aus mehreren Quellen gesammelt werden; ohne Identitätsauflösung sind die Daten jedoch nur halbwahr. Aus den Daten eine einheitliche Sicht auf die Kundenaktivitäten zu erstellen, ist alles andere als trivial – diejenigen, die damit beauftragt sind, können bestätigen, wie komplex es ist, es richtig zu machen.

Darüber hinaus variiert auch die Definition der Identitätsauflösung von Unternehmen zu Unternehmen – für bestimmte Branchen ist die Lösung der Identitätsauflösung eine Teilmenge eines umfassenderen Entitätsauflösungsproblems.

Identitätsauflösung bezieht sich, wie der Name schon sagt, auf die Identität einer Person – eines einzelnen Benutzers oder Kunden, der eine von mehreren Einheiten ist, mit denen ein Unternehmen zu tun hat. Einige der anderen sind Konten, Produkte, Lieferanten, Anbieter, Partner und Wiederverkäufer.

In diesem Leitfaden möchte ich jedoch etwas tiefer in die Identitätsauflösung eintauchen und die Systeme beschreiben, in denen sie stattfindet, die Unterschiede zwischen automatisierter und manueller Identitätsauflösung und die Vorteile des deterministischen gegenüber dem probabilistischen Abgleich.

Identitätsauflösung: Wo und wie es passiert

Wie Sie wahrscheinlich bereits wissen, ist die Identitätsauflösung der Prozess der Vereinheitlichung von Benutzer- (oder Kunden-) Datensätzen, die über mehrere Quellen (oder Berührungspunkte) hinweg erfasst werden.

Aber wo findet dieser Prozess statt? Wer führt die Vereinigung durch? Wie werden die Daten erfasst und gespeichert? Und was sind die erforderlichen Datenpunkte, um das alles möglich zu machen?

Es ist wichtig, Antworten auf diese Fragen zu haben, bevor Sie in eine Identitätsauflösung investieren.

Datawarehouse (DWH)

Bill Inmon, bekannt als der Vater des Data Warehouse, hat kürzlich einen Artikel mit dem Titel „Was ein Data Warehouse nicht ist“ geschrieben, in dem er populäre Mythen darüber entlarvt, was ein Data Warehouse ist – es ist eine faszinierende Lektüre und ich kann es Ihnen wärmstens empfehlen, wenn Sie möchten gewinnen Sie ein tieferes Verständnis dafür, was in der Welt des Data Warehousing passiert.

Das Data Warehouse ist in seiner typischen Form eine Cloud-Datenbank, die Kundendaten aus unterschiedlichen Quellen speichert und für analytische Workloads verwendet wird.

Bevor eine Identitätsauflösung stattfinden kann, muss sichergestellt werden, dass Daten aus Erstanbieter-Datenquellen – Apps, Websites oder Smart Devices – im Data Warehouse verfügbar gemacht werden, was normalerweise über eine interne oder externe Kundendateninfrastruktur (CDI) erfolgt. Lösung. Welche Daten erfasst und wie sie gespeichert werden, ist wichtig, da die Identitätsauflösung auf einer Reihe von Kennungen (IDs) beruht, die zum Abgleichen und Zusammenführen von Benutzerdatensätzen aus mehreren Quellen verwendet werden.

Schreiben des Vereinigungscodes

Der Prozess der Vereinheitlichung oder Zusammenführung von Datensätzen beginnt, sobald die erforderlichen Daten im Lager verfügbar sind. Dies wird in der Regel von Analysten durchgeführt, die ein gutes Verständnis der Datensätze haben und in der Lage sind, SQL-Abfragen zu schreiben, die komplexe Verknüpfungen über Tabellen hinweg durchführen, um neue Tabellen zu erstellen, die als materialisierte Ansichten bekannt sind. Diese Tabellen dienen dann als Quelle der Wahrheit, die zur Analyse und Aktivierung verwendet wird.

Probabilistisches vs. deterministisches Matching

In Ermangelung von Identifikatoren wie E-Mail, Handynummer, Geräte-ID und Benutzer-ID oder der Möglichkeit, sie aufgrund anderer Faktoren genau zu verbinden, muss man auf einen sogenannten probabilistischen Abgleich zurückgreifen, der sich eher auf Signale als auf Signale stützt personenbezogene Daten (PII).

Der auch als Fuzzy-Matching bezeichnete probabilistische Abgleich sucht nach einer Kombination von Benutzereigenschaften wie Name, Standort, Betriebssystem, IP-Adresse usw., um dann Datensätze zusammenzuführen, wenn die potenzielle Übereinstimmung eine akzeptable Punktzahl erhält.

Einfach ausgedrückt ist das probabilistische Matching flexibler, aber nicht 100 % genau. Es ist sinnvoll, es für kritische Anwendungsfälle wie Betrugserkennung einzusetzen, bei denen die Datensätze groß und komplex sind; Es wird jedoch nicht empfohlen, wenn Sie darauf abzielen, datengestützte personalisierte Erfahrungen zu erstellen.

Der deterministische Abgleich ist einfach deshalb genauer, weil kein „Raten“ erforderlich ist – es handelt sich um ein 0- oder 1-Szenario basierend auf den verfügbaren Kennungen. Die Vorteile dieses Ansatzes werden unten beschrieben.

Ich hoffe, dass Sie jetzt ein angemessenes Verständnis dafür haben, wie die Identitätsauflösung im Data Warehouse gehandhabt wird. Es ist an der Zeit zu verstehen, wie es von CDPs gemacht wird.

Kundendatenplattform (CDP)

Ich wollte auf einen Artikel verlinken, der beschreibt, was ein CDP nicht ist (hier ist, was ein CDP ist ) , aber leider konnte ich keinen finden, also möchte ich zuerst schnell erwähnen, dass ein CDP kein CDI ist, noch ist es ein CRM.

Im Wesentlichen ist eine Kundendatenplattform eine Plattform auf der Grundlage der Kundendateninfrastruktur – die Plattform ermöglicht es den Leuten, Zielgruppen mit Tools von Drittanbietern über eine visuelle Oberfläche zu segmentieren und zu synchronisieren.

Wo findet also die Identitätsauflösung statt und wie?

Im Allgemeinen erfolgt dies zum Zeitpunkt oder kurz nach der Datenerhebung. Unter der Haube speichert ein CDP eine Kopie der Daten und führt auf automatisierte Weise einen deterministischen Abgleich basierend auf bereitgestellten Identifikatoren durch.

Wie bereits erwähnt, spielen personenbezogene Daten (PII) eine Schlüsselrolle bei der Ermöglichung eines deterministischen Abgleichs und bieten ein hohes Maß an Genauigkeit – ein integriertes System zur Erfassung der Daten und Durchführung der Vereinheitlichung macht eine CDP attraktiv.

Einige CDP-Anbieter haben den probabilistischen Weg eingeschlagen und preisen ihre Angebote als überlegen an. Anstatt die Nachteile des probabilistischen Abgleichs zu erläutern, möchte ich einige der Hauptvorteile des deterministischen Abgleichs hervorheben.

Deterministische Identitätsauflösung: Hauptvorteile

Personalisierung ist der heilige Gral für SaaS- und E-Commerce-Unternehmen, aber wenn sie schief gehen oder zu einem ungünstigen Zeitpunkt sind, können sich Personalisierungsbemühungen als nachteiliger erweisen als gar keine Personalisierung.

Die deterministische Identitätsauflösung gewährleistet nicht nur eine genaue Personalisierung im großen Maßstab, sondern ermöglicht es Unternehmen auch, datenschutzfreundlicher zu sein und Vorschriften strenger einzuhalten. Lassen Sie mich das auspacken.

Personalisierung

Da die deterministische Identitätsauflösung nur dann stattfindet, wenn das System in der Lage ist, Benutzerdatensätze basierend auf den vom Benutzer direkt bereitgestellten Kennungen (normalerweise E-Mail oder Telefonnummer) zu identifizieren, ist es höchst unwahrscheinlich, dass die Personalisierungsbemühungen durcheinander geraten.

Darüber hinaus ist die Aktualität gewährleistet, da CDPs in der Lage sind, die Identitätsauflösung zum Zeitpunkt der Datenerfassung automatisch durchzuführen.

Ein einfacher Anwendungsfall, der für die meisten SaaS-Unternehmen gilt, ist das Versenden einer hochgradig personalisierten Willkommens-E-Mail an Benutzer – fast unmittelbar nach der Anmeldung – die auch andere Benutzerattribute wie Standort, Branche oder Vorlieben berücksichtigt.

SaaS-Unternehmen erlauben es einem Benutzer normalerweise, mehrere Konten oder Arbeitsbereiche zu erstellen, aber es macht wenig Sinn, dieselbe Standard-Willkommens-E-Mail an einen bestehenden Benutzer zu senden. Deterministische Identitätsauflösung in Verbindung mit vordefinierter Segmentierung und Echtzeitsynchronisierung kann sicherstellen, dass der Benutzer nicht als neuer Benutzer behandelt wird und die erhaltene Kommunikation dies widerspiegelt.

Ein allgemeineres Beispiel, das für so ziemlich alle Branchen gilt, ist die Benachrichtigung von Benutzern, wenn sie sich auf einem neuen Gerät oder an einem unbekannten Ort bei ihrem Konto anmelden. Da das System bereits die Benutzer-ID mit einer bestimmten IP-Adresse und Geräte-ID verknüpft hat, kann es unbekannte Muster sofort erkennen und den Benutzer in Echtzeit benachrichtigen.

Datenschutzfreundlich

Niemand braucht eine Lektion darüber, warum ein datenschutzfreundlicher Ansatz für Unternehmen von entscheidender Bedeutung ist – die Folgen einer Nichteinhaltung von DSGVO oder CCPA können brutal sein.

Mit deterministischem Abgleich können Marken sicher sein, dass ein Benutzer, der sich gegen den Erhalt von Mitteilungen entschieden hat oder vergessen werden möchte, über nachgelagerte Systeme – E-Mail, SMS, Werbekanäle usw. – genau identifiziert und seine Daten gelöscht werden überall, überallhin, allerorts.

Das Erreichen dieses Compliance-Levels ohne eine CDP mit deterministischen Identitätsauflösungsfunktionen ist alles andere als trivial und kann auf dem Weg zu mehreren Verstößen führen.

Welche Form der Identitätsauflösung ist die richtige für Sie?

Das Ziel dieses Leitfadens ist es, einen Überblick darüber zu geben, wie die Identitätsauflösung in verschiedenen Umgebungen unter verschiedenen Einschränkungen erreicht wird, und hoffentlich ist mir das gelungen.

Diese Tipps und Vorschläge eignen sich besser für Anwendungsfälle in den Bereichen Produkt, Wachstum und Marketing, vor allem bei B2B-SaaS-Unternehmen. Darüber hinaus soll dieser Artikel nicht zu dem Schluss kommen, dass ein Ansatz besser als der andere ist, und basierend auf bestimmten Faktoren könnte die Verwaltung der Identitätsauflösung im Data Warehouse mithilfe von Fuzzy-Matching für einige Unternehmen doch besser funktionieren.

Erfahren Sie mehr über die Identitätsauflösung im Amplitude CDP , indem Sie mit einem Produktexperten sprechen .