Rozpoznawanie tożsamości: hurtownia danych a platforma danych klienta

Opublikowany: 2022-08-16

Każdy chce jednego źródła prawdy dla danych klientów, ale to, co to za sobą pociąga, zależy od tego, kogo pytasz.

Oczywiście hurtownia danych to „pojedynczy magazyn” dla danych klientów zebranych z wielu źródeł; jednak w przypadku braku rozpoznawania tożsamości dane są tylko w połowie prawdziwe. Budowanie ujednoliconego widoku aktywności klientów na podstawie danych nie jest trywialne — osoby, które mają za to zadanie, mogą potwierdzić złożoność związaną z prawidłowym wykonaniem tego zadania.

Co więcej, definicja rozwiązywania tożsamości również różni się w zależności od firmy — w niektórych branżach rozwiązywanie tożsamości jest podzbiorem szerszego problemu rozwiązywania jednostek.

Rozpoznawanie tożsamości, jak sama nazwa wskazuje, odnosi się do tożsamości osoby – indywidualnego użytkownika lub klienta, który jest jednym z kilku podmiotów, z którymi ma do czynienia firma. Niektóre z pozostałych to konta, produkty, dostawcy, sprzedawcy, partnerzy i sprzedawcy.

W tym przewodniku chcę jednak zagłębić się w rozwiązywanie tożsamości i opisać systemy, w których ma to miejsce, różnice między automatycznym i ręcznym rozpoznawaniem tożsamości oraz zalety dopasowania deterministycznego nad probabilistycznego.

Rozpoznawanie tożsamości: gdzie i jak to się dzieje

Rozpoznawanie tożsamości, jak zapewne już wiesz, to proces ujednolicania rekordów użytkowników (lub klientów), które są przechwytywane w wielu źródłach (lub punktach kontaktu).

Ale gdzie przebiega ten proces? Kto dokonuje zjednoczenia? Jak zbierane i przechowywane są dane? A jakie są wymagane punkty danych, aby to wszystko było możliwe?

Ważne jest, aby uzyskać odpowiedzi na te pytania, zanim zainwestujesz w próbę rozwiązania tożsamości.

Hurtownia danych (DWH)

Bill Inmon, znany jako ojciec hurtowni danych, napisał niedawno artykuł zatytułowany „Czym nie jest hurtownia danych”, w którym obala popularne mity dotyczące tego, czym jest hurtownia danych — to fascynująca lektura i gorąco polecam, jeśli chcesz uzyskać głębsze zrozumienie tego, co dzieje się w świecie hurtowni danych.

Hurtownia danych w swojej typowej formie jest bazą danych w chmurze, która przechowuje dane klientów z różnych źródeł i jest używana do obciążeń analitycznych.

Zanim będzie możliwe rozpoznanie tożsamości, należy upewnić się, że dane z własnych źródeł danych — aplikacji, witryn internetowych lub urządzeń inteligentnych — są udostępniane w hurtowni danych, co zwykle odbywa się przy użyciu wewnętrznej lub zewnętrznej infrastruktury danych klientów (CDI). rozwiązanie. To, jakie dane są gromadzone i jak są przechowywane, jest ważne, ponieważ rozpoznawanie tożsamości opiera się na zestawie identyfikatorów (identyfikatorów), które są używane do dopasowywania i scalania rekordów użytkowników pochodzących z wielu źródeł.

Pisanie kodu unifikacyjnego

Proces ujednolicania lub scalania rekordów rozpoczyna się w momencie udostępnienia wymaganych danych w hurtowni. Zwykle robią to analitycy, którzy dobrze rozumieją zestawy danych i są biegli w pisaniu zapytań SQL, które wykonują złożone sprzężenia między tabelami w celu tworzenia nowych tabel, znanych jako widoki zmaterializowane. Tabele te służą następnie jako źródło prawdy wykorzystywanej do analizy i aktywacji.

Dopasowanie probabilistyczne a deterministyczne

W przypadku braku identyfikatorów, takich jak adres e-mail, numer telefonu komórkowego, identyfikator urządzenia i identyfikator użytkownika, lub możliwość ich dokładnego połączenia ze względu na inne czynniki, należy uciec się do tak zwanego dopasowania probabilistycznego, które opiera się na sygnałach, a nie informacje umożliwiające identyfikację osoby (PII).

Dopasowywanie probabilistyczne, znane również jako dopasowanie rozmyte, szuka kombinacji właściwości użytkownika, takich jak nazwa, lokalizacja, system operacyjny, adres IP itp., aby następnie scalić rekordy, gdy potencjalne dopasowanie uzyska akceptowalny wynik.

Mówiąc prościej, dopasowanie probabilistyczne jest bardziej elastyczne, ale nie jest w 100% dokładne. Sensowne jest stosowanie go w krytycznych przypadkach użycia, takich jak wykrywanie oszustw, w których zbiory danych są duże i złożone; jednak nie jest to zalecane, jeśli Twoim celem jest tworzenie spersonalizowanych środowisk opartych na danych.

Dopasowywanie deterministyczne jest dokładniejsze po prostu dlatego, że nie wymaga „zgadywania” — jest to scenariusz 0 lub 1 w oparciu o dostępne identyfikatory. Korzyści płynące z tego podejścia omówiono poniżej.

Mam nadzieję, że teraz dobrze rozumiesz, jak obsługiwane jest rozpoznawanie tożsamości w hurtowni danych. Czas zrozumieć, jak to robią CDP.

Platforma danych klienta (CDP)

Chciałem zamieścić link do artykułu opisującego czym CDP nie jest (oto czym jest CDP) , ale niestety nie mogłem go znaleźć, więc chciałbym najpierw szybko wspomnieć, że CDP nie jest CDI, ani nie jest CRM.

Zasadniczo platforma danych klientów jest, cóż, platformą uzupełniającą infrastrukturę danych klientów — platforma umożliwia użytkownikom segmentację i synchronizację odbiorców z narzędziami innych firm za pomocą interfejsu wizualnego.

Gdzie więc odbywa się rozwiązywanie tożsamości i jak?

Ogólnie rzecz biorąc, odbywa się to w czasie lub wkrótce po zebraniu danych. Pod maską CDP przechowuje kopię danych i w sposób zautomatyzowany dokonuje deterministycznego dopasowania na podstawie dostarczonych identyfikatorów.

Jak wspomniano wcześniej, informacje umożliwiające identyfikację osób (PII) odgrywają kluczową rolę w umożliwianiu deterministycznego dopasowania i oferują wysoki poziom dokładności — to, co czyni CDP atrakcyjnym, jest zintegrowany system do zbierania danych i przeprowadzania ujednolicenia.

Niektórzy dostawcy CDP obrali drogę probabilistyczną i zachwalają, że ich oferty są lepsze z natury. Zamiast szczegółowo opisywać wady dopasowania probabilistycznego, chciałbym podkreślić niektóre kluczowe zalety dopasowania deterministycznego.

Deterministyczne rozpoznawanie tożsamości: kluczowe korzyści

Personalizacja jest świętym Graalem dla firm SaaS i e-commerce, ale jeśli się nie uda lub w nieodpowiednim czasie, wysiłki personalizacji mogą okazać się bardziej szkodliwe niż brak personalizacji w ogóle.

Deterministyczne rozpoznawanie tożsamości nie tylko zapewnia dokładną personalizację na dużą skalę, ale także umożliwia firmom bardziej przyjazne zachowanie prywatności i bardziej rygorystyczne przestrzeganie przepisów. Pozwól mi to rozpakować.

Personalizacja

Ponieważ deterministyczne rozpoznawanie tożsamości ma miejsce tylko wtedy, gdy system jest w stanie zidentyfikować rekordy użytkownika na podstawie identyfikatorów dostarczonych przez użytkownika bezpośrednio (zwykle e-mail lub numer telefonu), jest bardzo mało prawdopodobne, aby próby personalizacji zawiodły.

Ponadto zapewniona jest terminowość, ponieważ dostawcy CDP są w stanie automatycznie przeprowadzać rozpoznawanie tożsamości w momencie gromadzenia danych.

Prostym przypadkiem użycia, który ma zastosowanie w większości firm SaaS, jest wysłanie do użytkowników wysoce spersonalizowanej wiadomości powitalnej — prawie natychmiast po zarejestrowaniu — która uwzględnia również inne atrybuty użytkownika, takie jak lokalizacja, branża lub preferencje.

Firmy SaaS zazwyczaj pozwalają użytkownikowi na tworzenie wielu kont lub obszarów roboczych, ale wysyłanie tego samego standardowego e-maila powitalnego do istniejącego użytkownika nie ma sensu. Deterministyczne rozpoznawanie tożsamości w połączeniu ze wstępnie zdefiniowaną segmentacją i synchronizacją w czasie rzeczywistym może zapewnić, że użytkownik nie będzie traktowany jako nowy użytkownik, a odbierana przez niego komunikacja to odzwierciedla.

Szerszym przykładem, który dotyczy prawie wszystkich branż, jest powiadamianie użytkowników, gdy logują się na swoje konto na nowym urządzeniu lub w nieznanej lokalizacji. Ponieważ system ma już identyfikator użytkownika powiązany z określonym adresem IP i identyfikatorem urządzenia, jest w stanie natychmiast rozpoznać nieznane wzorce i powiadomić użytkownika w czasie rzeczywistym.

Przyjazny dla prywatności

Nikt nie potrzebuje lekcji na temat tego, dlaczego podejście przyjazne prywatności ma kluczowe znaczenie dla firm — konsekwencje nieprzestrzegania RODO lub CCPA mogą być brutalne.

Dzięki deterministycznemu dopasowaniu marki mogą być pewne, że jeśli użytkownik zrezygnował z otrzymywania wiadomości lub chce zostać zapomniany, są dokładnie identyfikowane w kolejnych systemach — e-mailach, SMS-ach, kanałach reklamowych itd. — a ich dane są usuwane z wszędzie.

Osiągnięcie tego poziomu zgodności w przypadku braku CDP z deterministycznymi możliwościami rozpoznawania tożsamości nie jest trywialne i może skutkować wieloma naruszeniami po drodze.

Która forma rozwiązywania tożsamości jest dla Ciebie odpowiednia?

Celem tego przewodnika jest przedstawienie przeglądu tego, w jaki sposób rozwiązywanie tożsamości jest osiągane w różnych środowiskach przy różnych ograniczeniach i miejmy nadzieję, że udało mi się to zrobić.

Te wskazówki i sugestie są lepiej dopasowane do zastosowań związanych z produktami, rozwojem i marketingiem, głównie w firmach B2B SaaS. Co więcej, ten artykuł nie ma na celu stwierdzenia, że ​​jedno podejście jest lepsze od drugiego, a w oparciu o pewne czynniki zarządzanie rozpoznawaniem tożsamości w hurtowni danych przy użyciu rozmytego dopasowania może w końcu działać lepiej w niektórych firmach.

Dowiedz się więcej o rozpoznawaniu tożsamości w Amplitude CDP , rozmawiając z ekspertem ds. produktu .

Skontaktuj się z działem sprzedaży