«Яндекс» представив новий метод машинного навчання CatBoost

«Яндекс» представив новий метод машинного навчання CatBoost

Компанія «Яндекс» розробила новий метод машинного навчання CatBoost. Відповідна бібліотека викладена у відкритий доступ - застосовувати її можуть всі бажаючі.


CatBoost - це спадкоємець методу машинного навчання "Матрикснет", який застосовується майже у всіх сервісах "Яндекса. В основі «Матрикснета» лежить механізм градієнтного бустингу. Його особливість у тому, що він добре підходить для роботи з різнорідними даними. Крім того, градієнтний бустинг дає точні результати навіть там, де даних відносно мало. Цим він відрізняється від нейромереж, які навчаються на величезному масиві однорідних даних.


Але якщо «Матрикснет» навчає моделі на числових даних, то CatBoost враховує і нечислові, наприклад, види хмар або типи будівель. Раніше такі дані доводилося перекладати на мову цифр, що могло змінити їх суть і вплинути на точність роботи моделі. Тепер їх можна використовувати в початковому вигляді.

Стверджується, що CatBoost показує вищу якість навчання, ніж аналогічні методи для роботи з різнорідними даними. Метод вже випробувано в різних сервісах «Яндекса». Так, він застосовувався для поліпшення результатів пошуку, ранжування стрічки рекомендацій і для розрахунку прогнозу погоди.

CatBoost можна застосовувати в різних областях - від банківської сфери до промисловості. Бібліотека підтримує операційні системи Linux, Windows і macOS; вона доступна мовами програмування Python і R. 

Image

Publish modules to the "offcanvas" position.