Как это работает

Как зарабатывать на информации, когда ее очень много

Последний год нашей работы в области Больших Данных и Машинного обучения, а также часто повторяющиеся при общении с заказчиком вопросы, навели нас на мысли о необходимости в одном тексте еще раз повторить основные ответы, проиллюстрировав их некоторыми практическими примерами применения этой технологии в цифрах.

С Большими данными нужно работать.

Отношение бизнеса к использованию технологий Больших данных очень напоминает ситуации имевшие место раньше.
Примерно 30 лет назад многие предприниматели решали: «Действительно ли необходимо использовать компьютер для бизнеса?»
Примерно 15 лет назад рассматривался вопрос: «Необходимо ли использовать Интернет, Сайт, E-mai для бизнеса?»
Примерно 5-8 лет назад решали вопрос «А нужно ли использовать мобильные приложения для бизнеса?»
Для тех, кто еще не видит бизнес-перспектив Больших данных хочется сказать:
«Хотим мы или нет, но мы УЖЕ живём в мире Больших данных!»
Ведь ни для кого не секрет:
  • Рекламные предложения поступают к нам таргетированно, в зависимости от нашего поведения (в Интернет, в торговой или сотовой сети);
  • Искусственный интеллект определяет риск при выдаче кредита конкретному клиенту банком на основании данных клиента;
  • На интернет-картах прогнозируются (а не отображаются текущие) пробки;
  • Сотовые провайдеры определяют, не собираемся ли мы провайдера сменить, не задавая нам этого вопроса.
Но это большие сверх-компании, а может ли работать с Большими данными средний бизнес?

С Большими данными можно работать.

Вопрос терминологии в Больших данными сложен. Область находится в процессе бурного развития. Терминология – тоже. При этом если добавить сюда огромное количество статей, написанных малознакомыми с вопросом людьми, получается серьезная путаница.
Распутываем: Большие данные (Big Data) используются для решения практических задач. Методология решений на Больших данных называется Машинным обучением (Machine Learning). Рабочее решение, реализованное с помощью Машинного обучения, может являться частью Искусственного интеллекта (Artificial Intelligence).
Однако, важно понимать, что: Далеко не все задачи, решаемые с помощью Машинного обучения, требуют огромных объёмов данных.
Например:
Почти в любом курсе по Машинному обучению первой разбирается одна из задач Классификации (Classification).
Суть задачи в том, что нужно определить вид цветка Ириса по его размерам.
Ирисы Фишера
Набор данных помещается на листе формата А4.
Другой миф: Для решения таких задач Больших данных нужны десятки специалистов.
Тут можно привести исторический факт:
В 2009-м году был завершён Netflix Prize
Призовой фонд был достаточно большим, чтобы привлечь большое число высококлассных профессионалов. И, в результате их работы, некоторые задачи Машинного обучения стали считаться окончательно разрешёнными. Сегодня о них известно любому грамотному специалисту.
Никто не гарантирует, что в конкретном бизнесе всё будет так просто. Простота – всё-таки крайность. Но и мнение о том, что для задач бизнеса нужны огромные технические мощности и огромные же человеческие ресурсы – тоже крайность.

Семь в одном.

Особенность задач Машинного обучения в том, что при решении понадобятся исследования данных, в результате этих исследований почти всегда появляются интересные побочные продукты.
Пример из нашей практики:
Мы создали систему «дозаказа» для доставки ресторанной сети.
«Дозаказом» мы назвали таргетированное дополнительное предложение клиенту сразу после того, как он сформировал свой заказ.
Первое, что пробуем – Анализ рыночной корзины (Ассоциативные правила).
Это решение как раз из тех, что изучены очень хорошо. В дозаказе работает слабо.
Мы решаем, что причина в недостатке таргетинга. И разделяем клиентов на большое количество групп.
Выясняется, что одна из групп составляет около половины всех клиентов и это клиенты, делающие лишь один заказ за всё время.
Анализируем источники клиентов.
Выясняется, что один из агрегаторов, поставляет примерно 30% клиентов которые «отцеплялась» от агрегатора, делают заказы уже самостоятельно.
Сходным образом появляются и другие под продукты:
  • Анализ поведения клиентов по источникам (оценка эффективности источника);
  • Группировка клиентов (с каждой группой нужен свой вид работы);
  • Нахождение похожих по составу блюд (может быть использовано для замены блюда при отсутствии, и для работы с меню);
  • Автозаполнение корзины на сайте/в мобильном по истории заказов клиента;
  • Поиск возможных наборов блюд для акций;
  • «Стандартный» ABC-анализ меню.
Заказчик остановил работы, т.к. не мог использовать даже этот объем дополнительной информации о своем бизнесе, хотя изучение можно было углублять.

Экономический эффект.

В примере с ресторанной сетью получилось так:
  • Система дозаказа работает с показателями: 5% отклика (столько клиентов откликаются на предложение) и до 35% среднего увеличения суммы заказа.
  • Оперативный анализ источников клиентов используется при принятии решений о работе или не работе с ними.
  • Рекламная акция по вычисленной группе клиентов, принесла около 15% дополнительной выручки по результатам первого же месяца.
Известна статистика, о том, что не более 30% компаний видят результат своих вложений в новые технологии Машинного обучения. Такая картина обусловлена кажущейся простотой применения технологии, зачастую сводящейся к бездумной подстановке своих данных в предлагаемые «коробочные» инструменты. Наш опыт показывает что, как и в любом деле, успех зависит от глубины погружения в задачу и специализации решений под конкретную проблему.
Универсальность инструментов Больших Данных и Машинного обучения оказалась применима для решения самых разных практических бизнес-задач. Рассматривая решения для других областей, мы обнаружили, что эти инструменты успешно работают и для рынка недвижимости, и для транспортной логистики, и для производственных процессов.
Возможность применения инструментов Больших Данных и Машинного обучения ограничивается только наличием самих данных, но и этот вопрос при желании, решается: данные могут быть получены из других источников.
Необходимость всерьез работать с информацией
диктуется практическими и конкурентными условиями современного бизнеса.