Resolución de identidad: almacén de datos frente a plataforma de datos del cliente

Publicado: 2022-08-16

Todo el mundo quiere una única fuente de verdad para los datos de los clientes, pero lo que implica depende de a quién le preguntes.

Claro, el almacén de datos es un "almacén único" para los datos de los clientes recopilados a través de múltiples fuentes; sin embargo, en ausencia de una resolución de identidad, los datos son solo una verdad a medias. Construir una vista unificada de la actividad del cliente a partir de los datos es cualquier cosa menos trivial: los encargados de hacerlo pueden dar fe de las complejidades involucradas para hacerlo bien.

Además, la definición de resolución de identidad también varía de una empresa a otra: para ciertas industrias, la resolución de la resolución de identidad es un subconjunto de un problema más amplio de resolución de entidades.

La resolución de identidad, como sugiere el nombre, se refiere a la identidad de una persona: un usuario o cliente individual que es una de las varias entidades con las que trata una empresa. Algunos de los otros son cuentas, productos, proveedores, vendedores, socios y revendedores.

En esta guía, sin embargo, quiero profundizar un poco más en la resolución de identidades y describir los sistemas en los que se lleva a cabo, las diferencias entre la resolución de identidades automatizada y manual, y los beneficios de la coincidencia determinista sobre la probabilística.

Resolución de identidad: dónde y cómo sucede

La resolución de identidad, como probablemente ya sepa, es el proceso de unificar registros de usuarios (o clientes) que se capturan a través de múltiples fuentes (o puntos de contacto).

Pero, ¿dónde tiene lugar este proceso? ¿Quién realiza la unificación? ¿Cómo se capturan y almacenan los datos? ¿Y cuáles son los puntos de datos necesarios para que todo sea posible?

Es importante tener respuestas a estas preguntas antes de invertir en un esfuerzo de resolución de identidad.

Almacén de datos (DWH)

Bill Inmon, conocido como el padre del almacén de datos, escribió recientemente un artículo titulado "Qué no es un almacén de datos", en el que desacredita los mitos populares sobre lo que es un almacén de datos. Es una lectura fascinante y la recomiendo encarecidamente si desea obtenga una comprensión más profunda de lo que está sucediendo en el mundo del almacenamiento de datos.

El almacén de datos, en su forma típica, es una base de datos en la nube que almacena datos de clientes de fuentes dispares y se utiliza para cargas de trabajo analíticas.

Antes de que pueda ocurrir la resolución de identidad, uno debe asegurarse de que los datos de fuentes de datos propias (aplicaciones, sitios web o dispositivos inteligentes) estén disponibles en el almacén de datos, lo que generalmente se hace utilizando una infraestructura de datos de clientes (CDI) interna o externa. solución. Los datos que se recopilan y cómo se almacenan son importantes, ya que la resolución de identidades se basa en un conjunto de identificadores (ID) que se utilizan para hacer coincidir y combinar registros de usuarios que se originan en múltiples fuentes.

Escribiendo el código de unificación

El proceso de unificación o fusión de registros comienza una vez que los datos necesarios están disponibles en el almacén. Normalmente, esto lo realizan analistas que tienen un buen conocimiento de los conjuntos de datos y son expertos en escribir consultas SQL que realizan uniones complejas entre tablas para crear nuevas tablas conocidas como vistas materializadas. Estas tablas luego sirven como la fuente de verdad que se utiliza para el análisis y la activación.

Emparejamiento probabilístico versus determinista

En ausencia de identificadores como correo electrónico, número de teléfono móvil, ID de dispositivo e ID de usuario, o la capacidad de unirlos con precisión debido a otros factores, se debe recurrir a lo que se conoce como coincidencia probabilística, que se basa en señales en lugar de información de identificación personal (PII).

También conocida como coincidencia aproximada, la coincidencia probabilística busca una combinación de propiedades de usuario, como el nombre, la ubicación, el sistema operativo, la dirección IP, etc., para luego fusionar registros cuando la coincidencia potencial recibe una puntuación aceptable.

En términos simples, la coincidencia probabilística es más flexible pero no es 100% precisa. Tiene sentido emplearlo para casos de uso críticos como la detección de fraudes donde los conjuntos de datos son grandes y complejos; sin embargo, no se recomienda si su objetivo es crear experiencias personalizadas basadas en datos.

La coincidencia determinista es más precisa simplemente porque no hay "conjeturas" involucradas: es un escenario 0 o 1 basado en los identificadores disponibles. Los beneficios de este enfoque se describen a continuación.

Espero que ahora tenga una comprensión justa de cómo se maneja la resolución de identidad en el almacén de datos. Es hora de entender cómo lo hacen los CDP.

Plataforma de datos de clientes (CDP)

Quería enlazar a un artículo que describe lo que no es un CDP (esto es lo que es un CDP) , pero desafortunadamente no pude encontrar uno, así que primero me gustaría mencionar rápidamente que un CDP no es un CDI, ni lo es. un CRM.

En esencia, una plataforma de datos de clientes es, bueno, una plataforma sobre la infraestructura de datos de clientes: la plataforma permite a las personas segmentar y sincronizar audiencias con herramientas de terceros mediante una interfaz visual.

Entonces, ¿dónde tiene lugar la resolución de identidad y cómo?

En términos generales, tiene lugar en el momento de la recopilación de datos o poco después. Bajo el capó, un CDP almacena una copia de los datos y, de manera automática, realiza una comparación determinista basada en los identificadores proporcionados.

Como se mencionó anteriormente, la información de identificación personal (PII, por sus siglas en inglés) juega un papel clave para permitir la coincidencia determinista y ofrece un alto nivel de precisión: un sistema integrado para recopilar los datos y realizar la unificación es lo que hace que un CDP sea atractivo.

Algunos proveedores de CDP han tomado la ruta probabilística y promocionan sus ofertas como de naturaleza superior. En lugar de detallar las desventajas de la coincidencia probabilística, me gustaría resaltar algunos de los beneficios clave de la coincidencia determinista.

Resolución de identidad determinista: beneficios clave

La personalización es el santo grial para las empresas de comercio electrónico y SaaS, pero si sale mal o se hace en un momento inoportuno, los esfuerzos de personalización pueden resultar más perjudiciales que la falta de personalización.

La resolución de identidad determinista no solo garantiza una personalización precisa a escala, sino que también permite a las empresas ser más respetuosas con la privacidad y cumplir las normativas de forma más estricta. Permítanme desempacar esto.

Personalización

Dado que la resolución de identidad determinista se lleva a cabo solo cuando el sistema puede identificar los registros de los usuarios en función de los identificadores proporcionados por el usuario directamente (por lo general, el correo electrónico o el número de teléfono), es muy poco probable que los esfuerzos de personalización se arruinen.

Además, se garantiza la puntualidad ya que los CDP pueden realizar automáticamente la resolución de identidad en el momento de la recopilación de datos.

Un caso de uso simple que se aplica a la mayoría de las empresas de SaaS es enviar un correo electrónico de bienvenida altamente personalizado a los usuarios, casi inmediatamente después de que se registren, que también tenga en cuenta otros atributos del usuario, como la ubicación, la industria o las preferencias.

Las empresas de SaaS generalmente permiten que un usuario cree varias cuentas o espacios de trabajo, pero enviar el mismo correo electrónico estándar de bienvenida a un usuario existente tiene poco sentido. La resolución de identidad determinista junto con la segmentación predefinida y la sincronización en tiempo real pueden garantizar que el usuario no sea tratado como un nuevo usuario y que la comunicación que reciba lo refleje.

Un ejemplo más amplio que se aplica a casi todas las industrias es notificar a los usuarios cuando inician sesión en su cuenta en un dispositivo nuevo o en una ubicación no reconocida. Dado que el sistema ya tiene la ID de usuario asociada con una dirección IP específica y una ID de dispositivo, puede reconocer inmediatamente patrones desconocidos y notificar al usuario en tiempo real.

Respetuoso con la privacidad

Nadie necesita una lección sobre por qué un enfoque amigable con la privacidad es fundamental para las empresas: las ramificaciones de no adherirse a GDPR o CCPA pueden ser brutales.

Con la coincidencia determinista, las marcas pueden estar seguras de que si un usuario ha optado por no recibir comunicaciones o quiere ser olvidado, se lo identificará con precisión en los sistemas posteriores (correo electrónico, SMS, canales de publicidad, etc.) y sus datos se borrarán. En todas partes.

Lograr este nivel de cumplimiento en ausencia de un CDP con capacidades de resolución de identidades deterministas está lejos de ser trivial y puede resultar en múltiples violaciones en el camino.

¿Qué forma de resolución de identidad es adecuada para usted?

El objetivo de esta guía es proporcionar una descripción general de cómo se logra la resolución de identidad en diferentes entornos bajo diferentes restricciones y, con suerte, lo he logrado.

Estos consejos y sugerencias son más adecuados para el ámbito de los casos de uso de productos, crecimiento y marketing, principalmente en empresas B2B SaaS. Además, este artículo no pretende concluir que un enfoque es mejor que el otro y, en función de ciertos factores, administrar la resolución de identidad en el almacén de datos mediante coincidencias aproximadas podría funcionar mejor para algunas empresas después de todo.

Obtenga más información sobre la resolución de identidades en Amplitude CDP hablando con un experto en productos .

Contactar con ventas