22-24 марта видеосервис MEGOGO провел второй MEGOGO Media Hackathon — MEGOGO Kaggle Challenge. Специалисты по data science и machine learning соревновались в прогнозировании того, что пользователи Megogo будут смотреть в следующем месяце.

Целью хакатона было завязать контакты между разработчиками и медийным бизнесом, а также поспособоствовать развитию украинского сообщества Data Science и Machine Learning. Участвовать в соревновании могли как индивидуальные разработчики, так и команды до 5 человек. Обязательным условием была регистрация на платформе Kaggle, где нужно было создать команду в первые 24 часа после начала хакатона. 

В соревновании приняли участие 81 человек, которые сформировали 42 команды и представили 634 решения. Хакатон стал международным — в нем участвовали не только украинцы, но и представители России, Германии и Швеции. 

Для прогнозирования платформа MEGOGO предоставила доступ к анонимизированным реальным данным об активности пользователей сервиса за 3 месяца — кто, что и когда смотрел и какие фильмы понравились. На основе этих данных разработчики должны были создать высокоточное воспроизводимое решение, способное предсказать, что пользователи MEGOGO будут смотреть в следующем месяце. Допускались работы на любом языке программирования. Все команды и индивидуальные участники могли выбрать по два решения для оценки.

Ход хакатона

Первое место занял Алексей Гранков (команда x0x0w1). Он натренировал рекуррентную нейронную сеть (RNN) на миксе из данных о просмотрах и эмбеддинге по метаданным о фильмах. За 15 минут до финала Алексей усовершенствовал решение, использовав два типа нейросетей. Это и принесло ему победу. X0x0w1 получит $2000.

Замечательный был хакатон. Перечислю ключевые моменты, которые в сумме сделали его таковым. Неординарная задача, предобработанный тренировочный датасет с чистыми данным, не анонимизированная информация по фильмам, налаженное общение между организаторами и участниками, своевременные ответы и разъяснения вопросов, не очень большой набор данных, который позволял участвовать практически всем желающим. Благодаря небольшому объему информации по решению такого рода задач можно было попробовать придумать и реализовать свои идеи, которые в итоге давали весьма неплохой результат. В следующем году хотелось бы увидеть продолжение с большим интервалом времени на конкурс, будем ждать с нетерпением.

Алексей Гранков, команда x0x0w1, первое место

Второй стала команда AfterParty. Участники уступили победу в последние минуты. В решении AfterParty использовали последовательности просмотренных фильмов в качестве входных данных, натренировав комплексный ансамбль из RNN и нейросетей долгой краткосрочной памяти (LSTM). Приз команды — $1000.

Хотим поблагодарить MEGOGO за проведение этого соревнования. Для нас это первый хакатон по рекомендательным системам и уже довольно успешный, хотя все еще есть к чему стремиться. Отдельное спасибо людям, которые готовили данные, отсутствие шафла между пабликом и прайватом в топ 10 — это сильно.

Антон Баздырев, капитан AfterParty, второе место

«Бронзовым» было признано решение команды Netflix. Ее участники провели качественный exploratory data analysis и добавили явное использование данных о недосмотренных сериалах и купленных, но не просмотренных фильмах к классической ALS-модели. Это повысило точность решения. Участники получат $500.

Дякую організаторам Megogo Kaggle Challenge за проведення відмінного змагання. Для багатьох учасників команди це було першим змаганням такого плану. Після цього досвіду, впевнені, що будуть ще і ще. Змагання хоч зайняло всі вихідні, але дало замість більше (і це не про приз, хоча він та ще вишенька на торті). Зібравшись вперше як команда, ми безперервно генерували ідеї, висували гіпотези, намагались викачати з даних побільше «нафти», писали код і з перехрещеними пальцями спостерігали за позиціями на лідерборді, опісля кожної нової здачі. За дві доби ми пережили кілька мозкових штурмів та емоційних штормів. Перепробували купу нових речей на практиці, а також дізнались цікаві факти через працю з даними (подумати не могли, що так багато переглядають «Трое из Простоквашино»). Але основним все ж залишається той заряд бадьорості та творчого підйому, такий потрібний, аби надалі розвиватись у цій магічній галузі машинного навчання.

Антон Тарасов, капитан Netflix, третье место

Первый хакатон MEGOGO провели в Киеве в октябре 2018 года. Решениями-победителями стали мобильное приложение-квиз для киноманов, инструмент для iOS-видеоплеера, и конструктор для создания Stories.


Источник: пресс-релиз.