Resolusi Identitas: Gudang Data vs. Platform Data Pelanggan

Diterbitkan: 2022-08-16

Semua orang menginginkan satu sumber kebenaran untuk data pelanggan, tetapi apa yang diperlukan tergantung pada siapa yang Anda tanyakan.

Tentu, gudang data adalah "satu toko" untuk data pelanggan yang dikumpulkan di berbagai sumber; namun, dengan tidak adanya resolusi identitas, data hanya setengah benar. Membangun pandangan terpadu tentang aktivitas pelanggan dari data bukanlah hal yang sepele—mereka yang ditugaskan dengannya dapat membuktikan kompleksitas yang terlibat dalam melakukannya dengan benar.

Selain itu, definisi resolusi identitas juga bervariasi dari satu bisnis ke bisnis lainnya—untuk industri tertentu, pemecahan untuk resolusi identitas adalah bagian dari masalah resolusi entitas yang lebih luas.

Resolusi identitas, seperti namanya, mengacu pada identitas seseorang—pengguna individu atau pelanggan yang merupakan salah satu dari beberapa entitas yang berurusan dengan bisnis. Beberapa lainnya adalah akun, produk, pemasok, vendor, mitra, dan pengecer.

Namun, dalam panduan ini, saya ingin menggali sedikit lebih dalam tentang resolusi identitas dan menjelaskan sistem di mana itu terjadi, perbedaan antara resolusi identitas otomatis dan manual, dan manfaat deterministik dibandingkan pencocokan probabilistik.

Resolusi identitas: Di mana dan bagaimana hal itu terjadi

Resolusi identitas, seperti yang mungkin sudah Anda ketahui, adalah proses menyatukan catatan pengguna (atau pelanggan) yang ditangkap di berbagai sumber (atau titik kontak).

Tapi di mana proses ini terjadi? Siapa yang melakukan unifikasi? Bagaimana data ditangkap dan disimpan? Dan apa saja poin data prasyarat untuk memungkinkan semuanya?

Sangat penting untuk memiliki jawaban atas pertanyaan-pertanyaan ini sebelum berinvestasi dalam upaya resolusi identitas.

Gudang data (DWH)

Bill Inmon, yang dikenal sebagai bapak gudang data, baru-baru ini menulis sebuah artikel berjudul “Apa yang Tidak Ada Gudang Data” di mana ia menyanggah mitos populer tentang apa itu gudang data—ini bacaan yang menarik dan saya sangat merekomendasikannya jika Anda mau mendapatkan pemahaman yang lebih dalam tentang apa yang terjadi di dunia pergudangan data.

Gudang data, dalam bentuknya yang khas, adalah database cloud yang menyimpan data pelanggan dari sumber yang berbeda dan digunakan untuk beban kerja analitik.

Sebelum resolusi identitas dapat terjadi, kita harus memastikan bahwa data dari sumber data pihak pertama—aplikasi, situs web, atau perangkat pintar—tersedia di gudang data, yang biasanya dilakukan menggunakan infrastruktur data pelanggan (CDI) internal atau eksternal. larutan. Data apa yang dikumpulkan dan cara penyimpanannya penting karena resolusi identitas bergantung pada serangkaian pengidentifikasi (ID) yang digunakan untuk mencocokkan dan menggabungkan catatan pengguna yang berasal dari berbagai sumber.

Menulis kode penyatuan

Proses menyatukan atau menggabungkan catatan dimulai setelah data yang diperlukan tersedia di gudang. Ini biasanya dilakukan oleh analis yang memiliki pemahaman yang baik tentang kumpulan data dan mahir dalam menulis kueri SQL yang melakukan penggabungan kompleks di seluruh tabel untuk membuat tabel baru yang dikenal sebagai tampilan terwujud. Tabel-tabel ini kemudian berfungsi sebagai sumber kebenaran yang digunakan untuk analisis dan aktivasi.

Pencocokan probabilistik vs. deterministik

Dengan tidak adanya pengenal seperti email, nomor ponsel, ID perangkat, dan ID pengguna, atau kemampuan untuk menggabungkannya secara akurat karena faktor lain, seseorang harus menggunakan apa yang disebut sebagai pencocokan probabilistik, yang mengandalkan sinyal daripada informasi pengenal pribadi (PII).

Juga dikenal sebagai pencocokan fuzzy, pencocokan probabilistik mencari kombinasi properti pengguna seperti nama, lokasi, sistem operasi, alamat IP, dll. untuk kemudian menggabungkan catatan ketika kecocokan potensial menerima skor yang dapat diterima.

Secara sederhana, pencocokan probabilistik lebih fleksibel tetapi tidak 100% akurat. Masuk akal untuk menggunakannya untuk kasus penggunaan kritis seperti deteksi penipuan di mana kumpulan datanya besar dan kompleks; namun, tidak disarankan jika tujuan Anda adalah membangun pengalaman personalisasi yang didukung data.

Pencocokan deterministik lebih akurat hanya karena tidak ada "tebakan" yang terlibat—ini adalah skenario 0 atau 1 berdasarkan pengidentifikasi yang tersedia. Manfaat dari pendekatan ini dibahas di bawah ini.

Saya harap Anda sekarang memiliki pemahaman yang adil tentang bagaimana resolusi identitas ditangani di gudang data. Saatnya untuk memahami bagaimana hal itu dilakukan oleh CDP.

Platform data pelanggan (CDP)

Saya ingin menautkan ke artikel yang menjelaskan apa yang bukan CDP ( inilah yang dimaksud dengan CDP ) , tetapi sayangnya, saya tidak dapat menemukannya, jadi pertama-tama saya ingin segera menyebutkan bahwa CDP bukan CDI, juga bukan sebuah CRM.

Intinya, platform data pelanggan adalah, yah, platform di atas infrastruktur data pelanggan—platform ini memungkinkan orang untuk menyegmentasikan dan menyinkronkan audiens dengan alat pihak ketiga menggunakan antarmuka visual.

Jadi di mana resolusi identitas terjadi dan bagaimana?

Secara umum, itu terjadi pada saat, atau segera setelah, data dikumpulkan. Di bawah tenda, CDP menyimpan salinan data dan secara otomatis, melakukan pencocokan deterministik berdasarkan pengidentifikasi yang disediakan.

Seperti disebutkan sebelumnya, informasi pengenal pribadi (PII) memainkan peran kunci dalam memungkinkan pencocokan deterministik dan menawarkan tingkat akurasi yang tinggi—sistem terintegrasi untuk mengumpulkan data dan melakukan penyatuan adalah apa yang membuat CDP menarik.

Beberapa vendor CDP telah mengambil rute probabilistik dan menggembar-gemborkan penawaran mereka agar lebih unggul. Alih-alih merinci kerugian dari pencocokan probabilistik, saya ingin menyoroti beberapa manfaat utama dari pencocokan deterministik.

Resolusi identitas deterministik: Manfaat utama

Personalisasi adalah cawan suci untuk SaaS dan bisnis e-niaga, tetapi jika salah atau tidak tepat waktu, upaya personalisasi dapat terbukti lebih merugikan daripada tidak ada personalisasi sama sekali.

Resolusi identitas deterministik tidak hanya memastikan personalisasi yang akurat dalam skala besar, tetapi juga memungkinkan bisnis menjadi lebih ramah privasi dan mematuhi peraturan dengan lebih ketat. Izinkan saya untuk membongkar ini.

Personalisasi

Karena resolusi identitas deterministik hanya terjadi ketika sistem mampu mengidentifikasi catatan pengguna berdasarkan pengidentifikasi yang diberikan oleh pengguna secara langsung (biasanya email atau nomor telepon), sangat kecil kemungkinannya upaya personalisasi menjadi kacau.

Selain itu, ketepatan waktu dipastikan karena CDP dapat secara otomatis melakukan resolusi identitas pada saat pengumpulan data.

Kasus penggunaan sederhana yang berlaku untuk sebagian besar bisnis SaaS adalah mengirim email selamat datang yang sangat dipersonalisasi kepada pengguna—hampir segera setelah mereka mendaftar—yang juga mempertimbangkan atribut pengguna lain seperti lokasi, industri, atau preferensi.

Bisnis SaaS biasanya memungkinkan pengguna untuk membuat beberapa akun atau ruang kerja tetapi mengirim email selamat datang standar yang sama ke pengguna yang sudah ada tidak masuk akal. Resolusi identitas deterministik digabungkan dengan segmentasi yang telah ditentukan sebelumnya dan sinkronisasi waktu nyata dapat memastikan bahwa pengguna tidak diperlakukan sebagai pengguna baru dan komunikasi yang mereka terima mencerminkan hal itu.

Contoh yang lebih luas yang berlaku untuk hampir semua industri adalah memberi tahu pengguna ketika mereka masuk ke akun mereka di perangkat baru atau di lokasi yang tidak dikenal. Karena sistem sudah memiliki ID pengguna yang terkait dengan alamat IP dan ID perangkat tertentu, sistem dapat segera mengenali pola yang tidak diketahui dan memberi tahu pengguna secara real-time.

Ramah privasi

Tidak ada yang membutuhkan pelajaran tentang mengapa pendekatan ramah privasi sangat penting untuk bisnis — konsekuensi dari tidak mematuhi GDPR atau CCPA bisa menjadi brutal.

Dengan pencocokan deterministik, merek dapat yakin bahwa jika pengguna telah memilih untuk tidak menerima komunikasi atau ingin dilupakan, mereka secara akurat diidentifikasi di seluruh sistem hilir—email, SMS, saluran iklan, dan sebagainya—dan data mereka dihapus dari di mana pun.

Mencapai tingkat kepatuhan ini tanpa adanya CDP dengan kemampuan resolusi identitas deterministik jauh dari hal sepele dan dapat mengakibatkan banyak pelanggaran di sepanjang jalan.

Bentuk resolusi identitas apa yang tepat untuk Anda?

Tujuan dari panduan ini adalah untuk memberikan gambaran tentang bagaimana resolusi identitas dicapai di lingkungan yang berbeda di bawah kendala yang berbeda, dan mudah-mudahan, saya telah berhasil melakukannya.

Kiat dan saran ini lebih cocok untuk bidang kasus penggunaan produk, pertumbuhan, dan pemasaran, terutama di perusahaan SaaS B2B. Selain itu, bagian ini tidak dimaksudkan untuk menyimpulkan bahwa satu pendekatan lebih baik daripada yang lain, dan berdasarkan faktor-faktor tertentu, mengelola resolusi identitas di gudang data menggunakan pencocokan fuzzy mungkin bekerja lebih baik untuk beberapa bisnis.

Pelajari lebih lanjut tentang resolusi identitas di Amplitude CDP dengan berbicara dengan pakar produk .