Data Science - стероиды для бизнеса - Никита Пустовойтов - CNews
←
→
Транскрипция содержимого страницы
Если ваш браузер не отображает страницу правильно, пожалуйста, читайте содержимое страницы ниже
whoami Если кратко: Практический опыт: • Выпускник ФУПМ МФТИ, кафедра Data Mining • Первый раз банковскую скоринговую систему • 15 лет в Data Mining/ Machine Learning/ Data разрабатывал 14 лет назад Science • Разрабатывал и внедрял приложения для • 6 лет читал лекции по Computer Science на классификации документов/переписки Физтехе, ставил IT-образование на ФИВТе МФТИ • Прогнозировал продажи для ритейла • 6 лет Founder + CEO/CTO в DS-стартапах • Делал СППР для онкологии (диагноз, лечение) • За год поднимался до 278 позиции в рейтинге • Применял DS в промышленности и Kaggle, участвуя в соревнованиях соло и тратя на академической науке соревнование 8-12 часов • Искал фрод не только в страховании, но и в • Последние 5 лет – занимаюсь Data Driven FMCG и металлургии консалтингом (Head of Data Science@DoubleData, • Разрабатывал рекомендательные системы Head of Data Science@BCS/CEO@DataUnicorn.AI) 2
Что такое Data Science? Data Science Междисциплинарная наука, использующая Machine Learning методы Machine Learning, мат. статистики и + других областей математики и Computer Business Analysis и Science, для извлечения знаний и интерпретация результатов закономерностей из данных с целью их + применения в бизнесе Основы Big Data 3
Data Science Фундаментальный Прикладной (*CompanyName* Research) Разработка новых алгоритмов и Используется напрямую в 1 технологий ради повышения 1 операционных процессах капитализации и т.д. Приносит измеримые деньги 2 в обозримой перспективе Важен факт создания/обладания • Увеличение прибыли 2 технологией • Уменьшение расходов • Уменьшение Cost/Income Часто новый источник данных и feature 3 Приносит отложенную прибыль 3 engineering дают больший эффект, чем авторский алгоритм 4
Data Science — стероиды для бизнеса Одно из ключевых направлений для Data Science в mass-oriented бизнесе – это клиентская аналитика Кого Где Как Привлечение клиентов привлекать? привлекать? привлекать? Как повышать Работа с новыми и Какие продукты Кого и как доход текущими клиентами предлагать? удерживать? с клиента? Как развивать Какие нужны экосистему? Какие тарифы Data-driven консалтинг новые Что в нее должны быть? экосистемы? добавить? 5
DataUnicorn существует? ≔ − σ 2 =σ ( − )2 ȁ ⋅ ȁ = > 15 лет опыта работы с ~ 15 человек данными в бизнесе DS /DE/ Dev/PM Машинное Традиционные обучение исследования Разработка софта > 8 успешных кейсов только за последний год.
On-line Off-line On-line Outstaff Решения Агентский канал партнеры партнеры Привлечение на совместные продукты Data Unicorn – DU партнеров стероиды для Трафик на агентский DU DU +XX% бизнеса портал Увеличение скорости On-line партнеры Off-line партнеры On-line аудитория привлечения агентов +XX% Активные агенты KYTA Онлайн-привлечение D Подбор площадок U Увеличение охвата целевой аудитории Приоритизация списка пот. Увеличение конверсии партнерских D Конверсия агента Скоринг Трафик на сайт +X% клиентов +0,X клиента в мес. D баз +XX% Метчинг пар U партнерских Конверсия в заявку +X% агент клиент баз U KYTA Стоимость заявки -X% D Онлайн-привлечение U Лиды +X% Лиды +XX% Улучшение конверсии Рекомендашки Конверсия в открытие счета +X% Конверсия в клиента +X% Стоимость клиента -X% D Повышение качества скоринга D U Склонность к продуктам U Клиенты +X% Клиенты +X% Маршрутизация входящих заявок Клиенты Продукты KYTA D Сегментация U Рекомендашки KYTA D Разработка новых продуктов U Ежемесячная +X% Время жизни +X% х прибыль с клиента х клиента = Прибыль DU DU DU Тарификация Upsale / Crossale Прогноз LTV Склонность к продуктам Выбор коммуникации Предсказание оттока Подбор партнеров для Реактивация спящих Off-line кобренда/лояльности Выбор локация для ритейла
Потенциальные проблемы DS в стыковке с бизнесом «Siri вот со мной общается, а вы (Не говоря уже о сквозной поток клиентов в 10 раз не аналитике) можете мне увеличить с помощью искусственного интеллекта?» Отсутствие базовой Неоправданные аналитики или технологий для Отсутствие расчета ожидания от тестирования юнит-экономики технологии Фокус только на Не всегда задачу Сопоставимость Незрелый заказчик верхней части стоит решать затрат воронки Отсутствие Если объем клиентов Например, нет смысла решать сейчас недостаточен для процессов/неготовность изменить Churn prediction без XSell/Next Best сходимости экономики процессы для использования Action кейса, то кто результатов DS, отсутствие vision, … Важно оценивать TCO кейса: инвестирует? работа DS + затраты смежных подразделений + затраты на поддержку и сопровождение 8
CRISP-DM – дьявол в деталях Обязательно должна быть связь DS с бизнесом Оценка: AUC-и хорошо, но надо доводить до рублей Сравнивать необходимо сравнимые вещи: Результат с моделью vs результат без модели год назад Результат с моделью vs результат без модели на клиентах За время проекта/ время внедрения может измениться окружающая реальность Контроль соответствия данных на проде тем данным, которые использовались при построении модели
Иногда Data Science может изменить модель бизнеса 1 Большой набор 2 3 По нашим оценкам, конверсия 4 данных из заявки в выдачу лучше, чем у конкурентов Данные Bankiros.ru • Кредитные рейтинги и кредитная история Возможность • Анкета пользователя После внедрения на изменения клиентского • UTM метки Одобрим.ру CR из Рост конверсий на сайте пути для части • Поведение на сайте зарегистрированного Bankiros.ru после установки пользователей (кредит пользователя в заявку виджета Одобрим.ру с Моделью наличными -> микрозайм) • Операторы сотовой связи вырос на 40% принятия решений DS • Внешние провайдеры данных В результате изменилась стратегия, был сделан упор на White Label, стали появляться партнеры 10
Модель принятия решений улучшает пост-продажу кредитных продуктов • У кредитных лидогенераторов (например, Одобрим.ру) накапливается значительная база пользователей Проблема / боль • Воникает потребность в дополнительной монетизации старых/ холодных партнеров пользователей • Присутствует непоределенность отностительно продуктового предложения для данных клиентов (что им сейчас предложить?) • Текущая база пользователей разбивается на сегменты в соотвествии с Решение для гипотезами партнеров • Модель принятия решений определяет какой из имеющихся продуктов наилучшим образом подойдет под конкретного пользователя • Конверсия из отправленной СМС в заявку ~7% Результат • Cost/ Income ratio: от 20% до 80% в зависимости от сегмента • Выручка +10% (относительно общей выручки сервиса) 11
Сквозная аналитика… Какой шаг следующий? Сравнение двух сегментов аудитории предпринимателей: Переход на следующий этап конверсии может иметь structural bias. Сравнивай все (и оставляй только стат. значимые результаты)! 4,0 Бизнес 3,0 2,0 1,0 0,0 Каналы/источники Переход на другой Владение продуктами Регионы / локации / Соцдем привлечения уровень воронки магазины Образование Можно использовать как внутренние, так и 2,5 + внешние данные 2,0 1,5 Если есть возможность – выделить внешние сегменты, 1,0 сравнить внутренние сегменты с внешними, оценить емкость 0,5 + внешних с точки зрения потенциального проникновения и 0,0 Английский МГУ ВШЭ Гуманитарии возможного дохода язык Стиль жизни 2,0 1,5 Применение: маркетинговая стратегия, позиционирование продукта, 1,0 сегментация аудитории, уточнение таргетингов в performance, 0,5 выявление новых каналов привлечения, управление ассортиментом 0,0 Вегетарианство Путешествия Кальяны
Fun facts: Хорошие клиенты VS дефолтники Хорошие клиенты VS дефолтники Доход 10к- 25к VS 60к+ Кредитные карты МФО Чаще веганы\вегетарианцы Любят мемы про кошек\собак Любят модную обувь
Откуда брать данные? Внутренние Внешние • CRM, анкетные данные, программы • Сотовые операторы лояльности • Гос. данные • Транзакции • Статистические данные (крупные банки, • Кликстрим на сайте крупные отраслевые порталы, гос. • Данные из установленного приложения статистика) • Взаимодействие с рассылками • Соцсети, приложения • Взаимодействие с ТП • Пиксели • Картографические сервисы • Ритейл? • …. • DataUnicorn!
Что мы знаем о человеке? Пол Оценка наличия, марки, возраста Возраст и стоимости авто Доход Оценка наличия и стоимости Семейное недвижимости положение, состав семьи Его/Ее интересы, хобби, увлечения Наличие и состояние Места бизнеса притяжения
Решения для Маркетинга / CRM и Рисков Скоринг физлиц Анти-фрод Предсказание дефолта скоринг мсб Предсказание дохода Оффер-менеджмент KYTA - Анализ Обогащение соц.дем пользователей и их Сегментация клиентов переменными предпочтений Предсказание наличия и Сегменты для рекламных характеристики Интересы\хобби\увлечения кабинетов бизнеса/авто/недвижимости
Спасибо за +7 (926) 579 96 27 внимание! www.dataunicorn.ai PustovoytovNY@msk.bcs.ru Никита
Вы также можете почитать