Прогноз с точностью до 98%. Кейс по веб-аналитике

Команда Stylus пришла с задачей составить прогноз на следующий месяц в разрезе ежедневного количества покупок и обращений в call-центр. Также ритейлер хотел заранее узнать, из каких городов будут поступать эти заказы. Как специалистам Promodo удалось разработать модели прогнозирования с точностью до 98% – рассказываем в этом кейсе.

В нише электронной коммерции с помощью инструментов веб-аналитики можно измерить практически все бизнес-процессы: от операционных работ до поведения пользователя на сайте. И если описательная аналитика требует навыков «чтения» цифр и схем, то прогнозная отвечает за интерпретацию этих цифр, отвечая на вопрос: «Что должно произойти?».

Для прогнозирования временных рядов мы использовали скрипты, написанные на Python, машинное обучение (machine learning) и различные модели прогнозирования, а также Power BI для наглядной визуализации полученных данных.

Составление тестового прогноза

Чтобы сделать точный прогноз по каждой из метрик, мы воспользовались набором данных за последние два года из CRM-системы и аккаунта Google Analytics. Сделали тестовые прогнозы по сеансам и транзакциям на 3 месяца и 2 года, отследив все аномальные периоды, которые увеличивали погрешность. Также проанализировали ключевые компоненты: тренд, недельную и годовую сезонность.

На скрине: тестовый прогноз на 2 года

Проанализировав тренды: отследили, что существенный рост продаж у ритейлера начался с ноября 2018 года.

Проанализировав графики недельной и годовой сезонности: смогли выявить период роста и спада количества транзакций и спрогнозировать частотность заказов с погрешностью 10-15%.

Такие показатели нас не устроили в полной мере, поэтому мы решили составить более точный прогноз, чтобы получить данные в разрезе каждого дня.

Точный прогноз с показателями по транзакциям

Чтобы составить более точный прогноз, мы доработали модели прогнозирования и создали словарь с праздниками, а также периодами повышенного спроса (Black Friday, Новый год). Так смогли выявить еще одну закономерность – на резкие изменения тренда сильное влияние оказывали акции, запущенные к периодам высокого спроса, но на недельной и годовой сезонности они практически не отражались.

После всех доработок нам удалось построить прогноз по количеству транзакций на каждый день с погрешностью около 8%, а в разрезе месяца свести погрешность до ~2-5%.

На скрине: тестовый прогноз количества транзакций по дням, с учетом двух прогнозируемых моделей

Прогнозирование логистики

Чтобы рассчитать нагрузку на склад и спрогнозировать отправку заказов по городам – мы проработали набор данных из CRM и создали словарь населенных пунктов по областям.

Чтобы облегчить восприятие полученной информации, все данные по прогнозируемым транзакциям, звонкам и заказам мы выгрузили в Power Bi и представили команде Stylus в виде наглядных интерактивных дашбордов.

Полную версию кейса Stylus с подробным описанием всех шагов и инструментов можно просмотреть на сайте Promodo.

1883