Как контролировать большие данные и использовать лишь те сведения, которые могут реально повлиять на рост продаж? Об этом рассказывает Александр Старостин, CEO и сооснователь martech-компании First Data.
- Почему большое количество данных — не всегда хорошо
- Собственные данные бренда: как нужно работать с CRM
- Данные от партнёров: почему важно контролировать их сбор
- Данные от операторов и организаций: как понять клиента по поведению и покупкам
- Почему работать с операторами данных выгоднее, чем собирать их самостоятельно
Почему большое количество данных — не всегда хорошо
Объёмы информации, которые генерирует человечество, постоянно растут. Если в 2019 году глобальный массив данных составлял 13,6 зеттабайт, то в 2021 году он достиг уже 79 зеттабайт. К 2025 году мировой объём Big Data, по прогнозам, может превысить 150 зеттабайт.
При этом, согласно исследованию 2021 года, всего около 16% корпоративных данных имеют решающее значение для бизнеса. Ценность ещё 35% неизвестна, а половина собираемой и хранимой информации является избыточной, устаревшей или тривиальной.
Для компаний огромное количество информации оборачивается увеличением затрат на её хранение, ростом числа ошибок в данных, сложностями при попытках их структурировать и иногда невозможностью грамотно проанализировать.
Всё это, в частности, приводит к ошибкам при создании маркетинговых стратегий, нарушению коммуникации с клиентами и, в конечном итоге, к ухудшению работы всей компании и финансовым потерям.

При разработке рекламных кампаний маркетологи опираются на три основные категории данных.
Собственные данные бренда: как нужно работать с CRM
First Party Data — это собственные данные компании, которые она напрямую собирает от своих клиентов.
Сюда входит:
- историях покупок,
- демографические данные,
- контактная информация,
- выводы на основании анализа покупательской активности.

Иначе всё сводится просто к цифровому хордингу (от англ. Digital Hoarding — «цифровое накопление») — бессмысленному собирательству данных, которые не структурируются и не обновляются.
49,8% российских компаний для управления рабочими процессами до сих пор используют Excel, а это гарантирует накопление ненужных и повторяющихся данных. Кроме того, таблицы как хранилище информации попросту ненадежны и совсем не подходят для проведения эффективного и точного анализа.
CRM-системы обладают гораздо большими преимуществами, а именно:
- упрощённый доступ к данным,
- настройка под особенности бизнеса
- автоматизация решения маркетинговых задач.
По данным сервиса планирования карьеры Zippia, компании, внедрившие CRM, могут получить увеличение коэффициента конверсии до 300%.
Однако и в этом случае встречаются подводные камни, касающиеся ошибочных данных и неправильной настройки внутренней базы. К примеру, в некоторых системах CRM есть функция очистки данных, которая позволяет выявить дублирование клиентов или связать данные одного клиента, полученные из разных подразделений. Однако ошибки при добавлении информации могут затруднить этот процесс.
Использование устаревших, повторяющихся и неструктурированных данных при настройке рекламной кампании приводит к тому, что до одних клиентов предложение не доходит, другие получают его несколько раз, а третьим приходит сообщение с акцией, которая абсолютно не соответствует их потребностям.
Так, в нашей компании First Data есть сотрудница, которая до сих пор получает рекламу памперсов, хотя её сыну уже исполнилось 10 лет. Скорее всего, после нескольких подобных нерелевантных предложений клиент просто навсегда отпишется от рассылки.
Чтобы избежать таких проблем, нужно постоянно поддерживать качество внутренней базы клиентских данных: обновлять возраст пользователей, удалять повторяющиеся номера телефонов или электронных адресов, просить подтверждение предоставленных контактных данных (с помощью звонка, SMS или письма).
Данные от партнёров: почему важно контролировать их сбор
Second Party Data — данные, которые компания получает от других организаций по соглашению о партнёрстве. Использование партнёрской информации помогает бизнесу расширить аудиторию. Разумеется, для этого у клиентов обеих компаний должны быть схожие интересы.
Например, сеть салонов красоты может обмениваться данными с бьюти-брендом, а магазин спортивной одежды — с фитнес-клубами. При этом стороны должны обязательно получить согласие пользователей на использование, обработку, хранение и передачу данных.
Однако при покупке сторонних данных нужно понимать, что они могут содержать те же ошибки, о которых говорилось выше. Поэтому партнёрские базы также требуют контроля с точки зрения актуальности, достоверности и достаточности содержащихся в них сведений.
Проблемы, которые влечёт за собой неверная информация, могут усугубляться по мере её накопления и приводить к серьёзным финансовым потерям. Согласно исследованию Gartner, некачественные данные обходятся организациям в среднем в 12,9 млн долларов каждый год. При этом почти 60% предприятий, преимущественно крупных, просто не измеряют потери от данных низкого качества.
Кроме того, если компания накопила большой объём информации, у неё могут возникнуть проблемы с работой серверов. Поиск и сортировка больших объемов данных занимают значительное время, что часто приводит к замедлению работы сервера и увеличению времени ответа, а также сбоям из-за перегрузки памяти.
Этого можно избежать. Например, в компании First Data мы распределяем приобретённые данные в «холодные» и «горячие» хранилища. Во вторые поступает информация сроком давности до 3 лет, то есть та, которая чаще всего используется в работе и сохраняет максимальную актуальность. В более дешёвом «холодном» хранилище находятся данные сроком давности от 3 лет.
Данные от операторов и организаций: как понять клиента по поведению и покупкам
Third Party Data — данные сторонних компаний, которые собирают информацию о пользователях из разных источников. Это могут быть:
- данные о поведении пользователей на различных сайтах и в соцсетях;
- данные о покупках;
- информация сотовых операторов, банков, транспортных компаний.
Все эти сведения обезличены. Отдельным пользователям соответствуют специальные идентификаторы — так называемые Hard ID. Они представляют собой захешированные (закодированные) телефонные номера или адреса электронной почты и не привязаны к конкретным имени, фамилии и другой персональной информации.
Разница от Second Party Data и Third Party Data в том, что первые были получены от компании, которая непосредственно связана с пользователями и имеет прямые отношения с ними (например, это может информация из CRM).
При дополнении внутренней базы данных транзакционными данными от поставщиков компании начинают лучше понимать своих клиентов, могут отслеживать их реальные потребности по данным о текущих покупках, создавать актуальные предложения и таргетировать рекламу с большей эффективностью.

Например, магазин видит, что клиент перестал заказывать выпечку, хотя раньше делал это регулярно. Причин может быть несколько: он мог начать покупать сдобу в другом магазине или же просто перестал это делать.
Сторонние данные помогают разобраться: если мы видим, что человек купил абонемент в фитнес-клуб, то, возможно, он теперь строже следит за питанием и ему стоит рекламировать не хлебобулочные изделия, а продукты из ЗОЖ-позиции.
Почему работать с операторами данных выгоднее, чем собирать их самостоятельно
При всей пользе Third Party Data, для компании обычно невыгодно скупать, структурировать и хранить такую информацию, а также держать в штате специалистов, умеющих с ней работать. Гораздо дешевле и практичнее сотрудничать с операторами подобных данных, получать от них готовую аналитику под конкретный проект и сразу использовать её в рекламной кампании.
Вот как это выглядит на практике:
- Бренд детских подгузников продвигал новую линейку. Стояла задача поднять досматриваемость рекламного ролика мамами маленьких детей. Аналитик First Data предложил вычислить момент, когда мамы не спят, не заняты с ребёнком и не пролистывают ленту в соцсетях, поскольку заказывают товары онлайн.
- Для этого были собраны деперсонализированные данные об онлайн-заказах женщин с детьми в возрасте до полугода и по чекам выделены временные промежутки, в которые они чаще всего делали покупки. Именно в это время пользовательницам, которые ещё никогда не покупали подгузники бренда, стали показывать рекламу нового товара. Досматриваемость роликов со средних 60% выросла до 85%. CTR на выбранном сегменте целевой аудитории составил 3,7%.
Ещё один пример:
- Когда в 2022 году бренд женской и мужской повседневной одежды Colin’s искал возможность поднять продажи и выручку, специалисты First Data предложили компании привлечь аудиторию ушедших ритейлеров — Stradivarius, Cos, Bershka, Pull&Bear, Cropp.
- С помощью обезличенных транзакционных данных были найдены постоянные покупатели этих марок. Мы запустили на них рекламу Colin’s с выгодными предложениями. Итог: performance-конверсия в среднем на 12,5% превысила уровень конверсии органического трафика, который раньше показывал максимальные результаты.
Таким образом, чтобы не утонуть в безбрежных массивах данных и иметь возможность в нужный момент извлечь из баз точную и актуальную информацию для эффективных рекламных кампаний, стоит:
- Использовать современные системы для хранения, структурирования и анализа данных.
- Следить за качеством вносимых в системы данных, регулярно контролировать базы на предмет устаревания информации, её достоверности, отсутствия дублей. Ввести процедуру подтверждения контактных данных клиентов.
- При использовании партнёрских данных, по мере возможности проверять и их тоже.
- Не гнаться за количеством информации, скупая все доступные источники. Для проверки гипотез и запуска рекламных кампаний, которые требуют подключения транзакционных данных, пользоваться услугами компаний с обширными базами и специализированными алгоритмами на основе ИИ.
Точка зрения эксперта может не совпадать с позицией редакции

