Tengri Data: как бизнес монетизирует данные и зарабатывает на них
Директор по продукту Tengri Data Николай Голов рассказал, какую ценность представляют большие массивы данных и почему не всем компаниям удается на них заработать

Данные — это актив, способный приносить прибыль для бизнеса. В цифровую эпоху данные стали новой ценностью, а поиск способа их монетизировать — современной «золотой лихорадкой». Но, как и искателям середины XIX века, далеко не всем компаниям удается достичь успеха и превратить свои данные в деньги.

Николай Голов
Николай Голов
Директор по продукту Tengri Data
О том, почему так происходит и сколько можно реально заработать на данных, если грамотно их монетизировать, рассказал Николай Голов, директор по продукту Tengri Data.

Монетизация данных о клиентах: норма или повод для паники

На сегодняшний день для монетизации применимы практически все данные, что есть у компании. Их разумно разделить на два блока. Первый — внутренние данные. Это информация о заказах, бюджете и его исполнении, финансовые данные, а также данные о складских запасах и остатках, о сложных технических системах, используемых в работе.

Однако наиболее важные и ценные данные — это данные о клиентах. Они представляют собой самый большой и интересный с точки зрения монетизации блок, в который входят данные о поведении, предпочтениях, расположении, покупках, поездках и сделках клиентов. Конечно, в отрыве от контекста монетизация такой информации может напугать. Компании монетизирует данные клиентов — звучит как повод для паники. «Куда сообщать об утечке?», — подумает читатель. На деле здесь происходит подмена понятий, ведь монетизация — это не обязательно продажа данных кому-то вовне.

Монетизация данных — это принятие решений, например, о предоставлении скидки, повышении или снижении цен, выборе нового поставщика. Такие решения принимаются компанией на основе совокупности информации о клиентах. Тем временем продажа персональных данных — незаконная практика, которая к тому же не способна принести реальной выгоды. Поэтому никто из серьезных игроков не станет этим заниматься. Внутренняя монетизация данных намного эффективнее.

От банков до ретейла: кто и как монетизирует данные

Компании из разных отраслей находят способы конвертировать данные в реальную прибыль. Например, страховые компании и банки научились экономить на специалистах по страховому и кредитному скорингу. Технологии анализируют данные о человеке и принимают решение о том, насколько он благонадежен, а следовательно, стоит ли давать ему кредит или одобрять страховку на крупную сумму.

Еще один подход, который практикуют многие компании — это прогнозирование продаж и закупок, чтобы оптимизировать управление торговыми остатками. Прогноз спроса помогает замораживать на складах меньше товара и, как следствие, увеличить оборачиваемость капитала. Это особенно важно для продуктового ретейла, так как он работает со скоропортящимися товарами. Впрочем, прогнозирование продаж применяют и в других сферах: нефтепереработке, фармакологии и некоторых других.

Данные используют и в динамическом ценообразовании — переоценке товаров в режиме реального времени с учетом смещения спроса. Это позволяет максимизировать прибыль. Также мы видим множество примеров использования данных в предложениях, основанных на рекомендациях. Человек заходит на сайт, где в нужный момент ему показывают некий товар или скидку, напоминают о забытой корзине или сообщают о выгодной рассрочке. Здесь необходимо отследить момент контакта пользователя с информацией и выдать таргетированную персонализированную рекомендацию, которая подтолкнет к покупке. Пользователь отреагирует на нее, продавец получит свою прибыль.

Сколько реально заработать на данных

Грамотная монетизация данных способна принести бизнесу огромную выгоду. Так, одна очень крупная российская компания, работающая на рынке объявлений, заявляет о росте выручки вплоть до 15% за счет алгоритмов, позволяющих оптимизировать работу службы поддержки. В такого рода компаниях модераторы службы поддержки — основная статья расходов, потому что их нужно очень много для поддержания комфортных коммуникаций с клиентами. Автоматизированные решения, анализирующие данные о клиентах, позволяют снизить темпы найма. Вся экономия на зарплате модераторам — это чистая выручка компании, то есть те самые 15%.

Прибыль за счет монетизации данных зависит от масштаба самого бизнеса. Для компаний на небольшой марже это обычно несколько процентов от оборота; для крупных технологических компаний и торговых сетей эффект может достигать 5% — с учетом их оборота набирается колоссальная сумма, которую можно получить благодаря всего одному интеллектуальному решению.

Однако до сих пор не весь бизнес осознает потенциал монетизации данных. Одни компании не воспринимают их как актив и не пользуются открывающимися возможностями. Другие попробовали и разуверились в успехе. Достаточно вспомнить, как еще пару лет назад все говорили, что данные принесут огромную прибыль. Но прошло время, и компании начали задаваться вопросом: где они, те обещанные результаты? Почему компаний, которые действительно смогли добиться от данных позитивного измеримого возврата в деньгах, так мало?

Провал монетизации: проблема в технологиях или в людях

С одной стороны, существует проблема технологий. 10 лет назад большие данные описывались характеристиками 3V: volume («объем»), velocity («скорость») и variety («разнообразие») — данных слишком много, они поступают слишком быстро, они слишком разнообразны. Проблема объема технически сегодня почти решена — диски, где можно хранить данные, стали очень большими. А вот вопрос скорости по-прежнему остается актуальным. Например, рекомендательная система обязана работать почти в реальном времени, задержка от события до решения должна быть минимальной.

С другой стороны, существует организационная сложность. Не так давно компании ошибочно думали, что процесс монетизации незамысловат и всем доступен: они возьмут все свои данные скопом, куда-то загрузят и сразу же получат деньги купюрами. Но оказалось, что монетизация данных — это процесс, и процесс долгий. Данные нужно загрузить, доставить, структурировать, очистить, понять смысл, найти гипотезы, оценить их с точки зрения прибыли, подтвердить гипотезы и лишь потом коммерциализировать.

Каждое звено этой цепочки требует не только технологии, но и человеческого понимания, как это сделать. Здесь и начинаются проблемы того самого разнообразия: пока аналитик будет учиться прогнозированию продаж, данные уже изменятся. Старые модели не работают на новых данных, а реальный бизнес не успевает за их изменчивостью.

Казалось бы, ответом должно было стать машинное обучение. Технологии на основе искусственного интеллекта быстро находят сложные взаимозависимости между разными данными, а значит, адаптируются к переменам быстрее, чем люди. Но, хотя машинное обучение действительно помогает в монетизации данных, ошибочно думать, что оно полностью решит проблему за человека.

Мы знаем много попыток, когда компания хотела просто залить данные в алгоритм или в нейросеть и сразу же получить ответ, но это не приносило результата.

Решение здесь кроется не только в технологии, но и в грамотной организации эксперимента и честном ответе на вопрос, что бизнес на самом деле хочет получить от данных и какую метрику посчитать. Многие компании начинают с машинного обучения и терпят неудачу, потому что они сами себе не ответили на эти вопросы. Без четко сформулированной цели с измеримыми показателями не добиться результата. Все-таки, машинное обучение — это пусть и прорывной, но инструмент, а не магия.

Альтернатива облакам: как одна платформа решает все задачи монетизации данных

Последние десятилетия я внедрял хранилища данных и аналитические платформы в разных компаниях в России и за рубежом и заметил несколько тенденций. Одна из них заключается в том, что рынок западной половины планеты сильно сместился в сторону облаков, а альтернативы им практически не осталось. Раньше было много опенсорса и поставщиков, готовых предоставить решение на инфраструктуре заказчика, но со временем такие варианты почти исчезли, уступив долю рынка облакам. Но далеко не каждый бизнес может хранить свои данные в облачных сервисах — и не только из-за санкций.

Показательный пример — страны Центральной Азии. Там многим отраслям бизнеса, например, телекоммуникационным операторам и банкам, запрещено законом хранить данные клиентов в облаках. А те, кому можно, не напрасно боятся, что в какой-то момент вся их инфраструктура просто пропадет из облака. Такие примеры действительно существуют — и их немало. Фактически сегодня ни одна компания кроме тех, что базируются непосредственно в США, не защищена от риска потерять свои данные в облаке.

Это стало для нас стимулом к разработке собственной российской платформы для аналитики больших данных. Причем мы поставили себе целью создать решение, способное обрабатывать и анализировать данные в десятки петабайт, что открывает крупным организациям доступ к масштабной аналитике без ограничений. Так появилась аналитическая платформа Tengri Data, которая основана на современном подходе Open LakeHouse, где данные не просто хранятся, а организованы так, что с ними легко и безопасно работать без привязки к одному конкретному поставщику.

Обработка и хранение разделены. Это значит, что можно легко добавлять новых аналитиков или увеличивать объемы данных: система останется быстрой и не станет дороже в эксплуатации. В итоге компания тратит меньше на поддержку и быстрее получает реальную пользу от своих данных.

Платформа объединяет разные этапы работы с данными в одном решении. Раньше для этого требовалось множество инструментов: один для написания кода, другой для создания аналитической базы, третий для доработки модели машинного обучения. Все эти компоненты нужно было поставить, настроить, интегрировать друг с другом, что требовало огромного объема усилий и долгого «допиливания» вручную.

Tengri Data объединяет в себе эти инструменты так, что с ними можно работать в формате одного окна. Для аналитика это означает, что он может зайти на платформу и в одном месте забрать данные, сохранить их в базу, сразу же запустить алгоритмы машинного обучения, сделать визуализацию данных, а затем отправить их коллегам, которые тоже находятся в этой системе, и даже попросить помощи. Самое интересное, что часть из этих коллег не люди, а ИИ-алгоритмы, которые помогают написать код, найти причину ошибки и исправить ее.

Кстати, именно поэтому платформа Tengri Data получила такое название. Тенгри — это пространство духов в шаманских религиях. Наша платформа — словно дом для этих духов, нематериальных аналитиков, так называемых ИИ-агентов, которые помогают человеку.

Вопросы безопасности: почему нужно защищать данные даже от аналитиков

Платформа Tengri Data удобна тем, что устанавливается одним пакетом, а не как коллекция отдельных решений. Во-первых, это упрощает ее интеграцию в технологический стек компании. Во-вторых, снижает потребность в рабочих руках — для успешного применения достаточно одного аналитика и специалиста по машинному обучению. В-третьих, позволяет без труда ее масштабировать, увеличивая охват хоть в 10, хоть в 1000 раз.

Но, возможно, самый важный плюс платформы — это подход к безопасности. Сейчас, когда вопросы утечек стоят наиболее остро, компании принципиально важно уберечь свои данные от несанкционированного доступа. Именно поэтому в Tengri Data мы объединили все компоненты в единый дистрибутив, строго контролируем доступ в систему и права на работу с данными компании — в случае выявленных нарушений или ухода сотрудника из компании его права на доступ моментально отзываются.

Важное преимущество Tengri Data — безопасность. Мы объединили все компоненты в единый дистрибутив, строго контролируем доступ в систему и права на работу с данными компании

База реального времени: будущее монетизации данных с Tengri Data

Наше решение универсально как для малых, так и для крупных компаний, им может пользоваться любой бизнес. Пожалуй, единственное ограничение — это операционная система. Мы фокусируемся на развертывании на Linux Debian или Astra Linux, поскольку Linux фактически служит стандартом для серверных систем.

Мы продолжаем развивать свое решение: уже реализовали расчеты на SQL, поддержали полностью все библиотеки Python. Сейчас мы сфокусированы на развитии ИИ-агентов — тех самых цифровых сотрудников, которые «живут» внутри нашей системы и с которыми можно общаться по чату, получить помощь и подробный анализ ошибок.

Также мы планируем реализовать дата-сервисы — легкие независимо масштабируемые микросервисы для управления данными с собственными транзакционными базами данных в единой экосистеме, доступные извне через программный интерфейс. Таким образом платформа из чисто аналитической станет многофункциональной базой реального времени и на уровне дата-сервисов будет поддерживать в том числе рекомендательные системы.