Технологія «Диско»: як працює рекомендаційна платформа «Яндекса»

Технологія «Диско»: як працює рекомендаційна платформа «Яндекса»

У сервісах «Яндекса» з великими каталогами об'єктів, зокрема, в музичних службах, застосовується особлива рекомендаційна технологія під назвою «Диско». Російська пошукова компанія розповіла, як влаштована ця система.


«Диско» генерує рекомендації виходячи зі смаків і переваг кожного конкретного веб-користувача. Інформацію про них система отримує з декількох джерел. По-перше, це пошукові запити - вони можуть розповісти про поточні інтереси. По-друге, аналізуються дані від платформи «Крипта»: стать, приблизний вік і рід занять. Вони дозволяють не рекомендувати людині те, що їй свідомо не сподобається. Нарешті, по-третє, вивчається інформація від сервісу, для якого складаються рекомендації. Наприклад, у «Маркеті» це відомості про те, які товари переглядав користувач, а в «Музиці» і «Радіо» - які треки він слухав. Само собою, всі дані знеособлені.


У процесі складання рекомендацій «Диско» використовує три різних підходи. Перший спирається на інформацію про об'єкти та зв'язки між ними. Наприклад, про будь-який музичний трек відомо, на якому альбомі він вийшов, хто його виконує і до якого жанру він відноситься, а про будь-який товар - хто його виробник, які його характеристики і до якої категорії товарів він належить. Проаналізувавши зв'язки, можна порадити користувачеві об'єкти, споріднені тому, чим він вже цікавився.

В основі другого підходу лежить інформація про зв'язки між людьми. Завдяки «Крипті» відомі стать, приблизний вік і можливий рід занять кожного користувача. Встановлено, що людей, у яких ці характеристики збігаються, часто цікавлять одні й ті самі об'єкти. Навіть якщо людина користується сервісом вперше і ще не встигла нічого подивитися, послухати або придбати, можна перевірити, що дивляться, слухають або купують люди зі схожими характеристиками - і запропонувати їй ці ж об'єкти.

Третій підхід використовує дані про взаємодії користувачів з об'єктами. Взаємодією можна вважати, наприклад, факт перегляду відеоролика або оцінку «подобається», поставлену музичному треку. Метод дозволяє, спираючись на вже відомі взаємодії, передбачити, як користувачі відреагують на ті чи інші об'єкти - наприклад, яку оцінку вони поставлять фільму, який поки не бачили.

Загалом у «Диско» застосовується кілька сотень рекомендаційних моделей, побудованих на основі описаних підходів. Всі моделі працюють по-різному: одна складає рекомендації з урахуванням музичного жанру, друга - з урахуванням бренду товарів, і так далі.

Рекомендації від різних моделей обробляє система машинного навчання «Матрикснет». Її завдання - скласти поєднання рекомендацій, яке б ідеально відповідало інтересам користувача в даний момент. Для цього до уваги береться безліч факторів. У результаті формується фінальний список рекомендацій, який і бачить користувач. 

Image

Publish modules to the "offcanvas" position.