Разрешение идентификации: хранилище данных и платформа клиентских данных

Опубликовано: 2022-08-16

Всем нужен единый источник достоверных данных о клиентах, но что это влечет за собой, зависит от того, кого вы спрашиваете.

Конечно, хранилище данных — это «единое хранилище» для данных о клиентах, собранных из нескольких источников; однако в отсутствие разрешения идентичности данные верны только наполовину. Построение единого представления о действиях клиентов на основе данных совсем не тривиально — те, кому это поручено, могут подтвердить сложности, связанные с его правильным получением.

Кроме того, определение разрешения идентификационных данных также варьируется от бизнеса к бизнесу — для определенных отраслей решение для разрешения идентификационных данных является подмножеством более широкой проблемы разрешения сущностей.

Разрешение личности, как следует из названия, относится к личности человека — отдельного пользователя или клиента, который является одним из нескольких субъектов, с которыми имеет дело бизнес. Некоторые из других — это учетные записи, продукты, поставщики, продавцы, партнеры и торговые посредники.

Однако в этом руководстве я хочу немного углубиться в определение личности и описать системы, в которых это происходит, различия между автоматическим и ручным определением личности, а также преимущества детерминированного сопоставления перед вероятностным.

Разрешение личности: где и как это происходит

Разрешение удостоверений, как вы, вероятно, уже знаете, — это процесс объединения записей пользователей (или клиентов), полученных из нескольких источников (или точек взаимодействия).

Но где происходит этот процесс? Кто осуществляет объединение? Как собираются и хранятся данные? И каковы предварительные данные, чтобы все это стало возможным?

Важно получить ответы на эти вопросы, прежде чем инвестировать в усилия по разрешению личных данных.

Хранилище данных (ХДХ)

Билл Инмон, известный как отец хранилища данных, недавно написал статью под названием «Чем не является хранилище данных», в которой он развенчивает популярные мифы о том, что такое хранилище данных. получить более глубокое понимание того, что происходит в мире хранилищ данных.

Хранилище данных в его типичной форме представляет собой облачную базу данных, в которой хранятся данные о клиентах из разрозненных источников и которая используется для аналитических рабочих нагрузок.

Прежде чем можно будет разрешить идентификацию, необходимо убедиться, что данные из сторонних источников данных — приложений, веб-сайтов или интеллектуальных устройств — доступны в хранилище данных, что обычно делается с использованием внутренней или внешней инфраструктуры данных клиентов (CDI). решение. Какие данные собираются и как они хранятся, важно, поскольку разрешение личности зависит от набора идентификаторов (ID), которые используются для сопоставления и объединения пользовательских записей, происходящих из нескольких источников.

Написание кода унификации

Процесс унификации или слияния записей начинается после того, как необходимые данные становятся доступными в хранилище. Обычно это делают аналитики, которые хорошо разбираются в наборах данных и умеют писать SQL-запросы, выполняющие сложные соединения между таблицами для создания новых таблиц, известных как материализованные представления. Затем эти таблицы служат источником правды, который используется для анализа и активации.

Вероятностное и детерминированное сопоставление

При отсутствии таких идентификаторов, как электронная почта, номер мобильного телефона, идентификатор устройства и идентификатор пользователя, или возможности точного присоединения к ним из-за других факторов приходится прибегать к так называемому вероятностному сопоставлению, которое опирается на сигналы, а не на личную информацию (PII).

Вероятностное сопоставление, также известное как нечеткое сопоставление, ищет комбинацию свойств пользователя, таких как имя, местоположение, операционная система, IP-адрес и т. д., чтобы затем объединить записи, когда потенциальное совпадение получает приемлемый балл.

Проще говоря, вероятностное сопоставление является более гибким, но не на 100% точным. Имеет смысл использовать его для критических случаев использования, таких как обнаружение мошенничества, когда наборы данных большие и сложные; однако это не рекомендуется, если вашей целью является создание персонализированного опыта на основе данных.

Детерминированное сопоставление является более точным просто потому, что в нем нет «угадывания» — это сценарий 0 или 1, основанный на доступных идентификаторах. Преимущества этого подхода описаны ниже.

Я надеюсь, что теперь у вас есть четкое представление о том, как разрешение личности обрабатывается в хранилище данных. Пришло время понять, как это делают CDP.

Платформа клиентских данных (CDP)

Я хотел дать ссылку на статью, описывающую, чем CDP не является (вот что такое CDP) , но, к сожалению, я не смог найти ее, поэтому сначала хотел бы быстро упомянуть, что CDP не является CDI и не является CRM.

По сути, платформа клиентских данных — это платформа поверх инфраструктуры клиентских данных — платформа позволяет людям сегментировать и синхронизировать аудиторию со сторонними инструментами с помощью визуального интерфейса.

Так где же происходит разрешение личности и как?

Вообще говоря, это происходит во время или вскоре после сбора данных. Под капотом CDP хранит копию данных и автоматически выполняет детерминированное сопоставление на основе предоставленных идентификаторов.

Как упоминалось ранее, личная информация (PII) играет ключевую роль в обеспечении детерминированного сопоставления и обеспечивает высокий уровень точности — интегрированная система для сбора данных и выполнения унификации — вот что делает CDP привлекательным.

Некоторые поставщики CDP пошли по вероятностному пути и рекламируют свои предложения как лучшие по своей природе. Вместо подробного описания недостатков вероятностного сопоставления я хотел бы выделить некоторые ключевые преимущества детерминированного сопоставления.

Детерминированное разрешение идентичности: основные преимущества

Персонализация — это святой Грааль для SaaS-бизнеса и электронной коммерции, но если все сделано неправильно или несвоевременно, усилия по персонализации могут оказаться более пагубными, чем отсутствие персонализации вообще.

Детерминированное разрешение удостоверений не только обеспечивает точную персонализацию в любом масштабе, но и позволяет компаниям более бережно относиться к конфиденциальности и более строго соблюдать правила. Позвольте мне распаковать это.

Персонализация

Поскольку детерминированное разрешение идентификационных данных происходит только тогда, когда система способна идентифицировать записи пользователей на основе идентификаторов, предоставленных пользователем напрямую (обычно это адрес электронной почты или номер телефона), крайне маловероятно, что усилия по персонализации будут испорчены.

Кроме того, обеспечивается своевременность, поскольку CDP могут автоматически выполнять разрешение идентификации во время сбора данных.

Простой вариант использования, применимый к большинству SaaS-предприятий, заключается в отправке персонализированного приветственного письма пользователям почти сразу после их регистрации, которое также учитывает другие атрибуты пользователя, такие как местоположение, отрасль или предпочтения.

Предприятия SaaS обычно позволяют пользователю создавать несколько учетных записей или рабочих пространств, но отправка одного и того же стандартного приветственного письма существующему пользователю не имеет особого смысла. Детерминированное разрешение идентичности в сочетании с предопределенной сегментацией и синхронизацией в реальном времени может гарантировать, что пользователь не будет рассматриваться как новый пользователь, и сообщения, которые они получают, отражают это.

Более широкий пример, применимый практически ко всем отраслям, — уведомление пользователей, когда они входят в свою учетную запись на новом устройстве или в неизвестном месте. Поскольку в системе уже есть идентификатор пользователя, связанный с определенным IP-адресом и идентификатором устройства, она способна немедленно распознавать неизвестные шаблоны и уведомлять пользователя в режиме реального времени.

Конфиденциальность

Никому не нужен урок о том, почему подход, ориентированный на конфиденциальность, имеет решающее значение для бизнеса — последствия несоблюдения GDPR или CCPA могут быть жестокими.

Благодаря детерминированному сопоставлению бренды могут быть уверены, что, если пользователь отказался от получения сообщений или хочет, чтобы о нем забыли, они будут точно идентифицированы в нижестоящих системах — электронной почте, SMS, рекламных каналах и т. д. — и их данные будут удалены. везде.

Достижение такого уровня соответствия при отсутствии CDP с возможностями детерминированного разрешения удостоверений далеко не тривиально и может привести к многочисленным нарушениям на этом пути.

Какая форма разрешения личности подходит именно вам?

Цель этого руководства — предоставить обзор того, как достигается разрешение удостоверений в разных средах с разными ограничениями, и, надеюсь, мне это удалось.

Эти советы и предложения лучше подходят для использования в сфере продукта, роста и маркетинга, в первую очередь в компаниях B2B SaaS. Более того, эта часть не предназначена для вывода о том, что один подход лучше другого, и, исходя из определенных факторов, управление разрешением идентичности в хранилище данных с использованием нечеткого сопоставления может, в конце концов, работать лучше для некоторых предприятий.

Узнайте больше о разрешении идентификационных данных в Amplitude CDP , поговорив с экспертом по продуктам .