
Прогноз с точностью до 98%. Кейс по веб-аналитике
В нише электронной коммерции с помощью инструментов веб-аналитики можно измерить практически все бизнес-процессы: от операционных работ до поведения пользователя на сайте. И если описательная аналитика требует навыков «чтения» цифр и схем, то прогнозная отвечает за интерпретацию этих цифр, отвечая на вопрос: «Что должно произойти?».
Для прогнозирования временных рядов мы использовали скрипты, написанные на Python, машинное обучение (machine learning) и различные модели прогнозирования, а также Power BI для наглядной визуализации полученных данных.
Составление тестового прогноза
Чтобы сделать точный прогноз по каждой из метрик, мы воспользовались набором данных за последние два года из CRM-системы и аккаунта Google Analytics. Сделали тестовые прогнозы по сеансам и транзакциям на 3 месяца и 2 года, отследив все аномальные периоды, которые увеличивали погрешность. Также проанализировали ключевые компоненты: тренд, недельную и годовую сезонность.

На скрине: тестовый прогноз на 2 года
Проанализировав тренды: отследили, что существенный рост продаж у ритейлера начался с ноября 2018 года.
Проанализировав графики недельной и годовой сезонности: смогли выявить период роста и спада количества транзакций и спрогнозировать частотность заказов с погрешностью 10-15%.
Такие показатели нас не устроили в полной мере, поэтому мы решили составить более точный прогноз, чтобы получить данные в разрезе каждого дня.
Точный прогноз с показателями по транзакциям
Чтобы составить более точный прогноз, мы доработали модели прогнозирования и создали словарь с праздниками, а также периодами повышенного спроса (Black Friday, Новый год). Так смогли выявить еще одну закономерность – на резкие изменения тренда сильное влияние оказывали акции, запущенные к периодам высокого спроса, но на недельной и годовой сезонности они практически не отражались.

После всех доработок нам удалось построить прогноз по количеству транзакций на каждый день с погрешностью около 8%, а в разрезе месяца свести погрешность до ~2-5%.

На скрине: тестовый прогноз количества транзакций по дням, с учетом двух прогнозируемых моделей
Прогнозирование логистики
Чтобы рассчитать нагрузку на склад и спрогнозировать отправку заказов по городам – мы проработали набор данных из CRM и создали словарь населенных пунктов по областям.
Чтобы облегчить восприятие полученной информации, все данные по прогнозируемым транзакциям, звонкам и заказам мы выгрузили в Power Bi и представили команде Stylus в виде наглядных интерактивных дашбордов.


Полную версию кейса Stylus с подробным описанием всех шагов и инструментов можно просмотреть на сайте Promodo.