Европейские учёные ускорили обучение ИИ-рекомендаций в 60 раз благодаря датасету Yambda от «Яндекса»

Российский набор данных с 5 млрд событий из «Яндекс Музыки» помог оптимизировать модель Seater

Исследователи из Амстердамского университета сообщили о значительном ускорении обучения рекомендательных систем — почти в 60 раз. Ключевую роль в эксперименте сыграл открытый датасет Yambda, опубликованный «Яндексом» в 2025 году. Он содержит около 5 млрд обезличенных пользовательских событий сервиса «Яндекс Музыка» и считается одним из крупнейших публичных наборов данных для задач рекомендаций.

Работа велась над моделью Seater, которая формирует иерархический каталог контента по принципу древовидной структуры. Такой подход повышает точность рекомендаций, однако этап подготовки каталога ранее занимал до 20% общего времени обучения.

Учёные предложили два способа оптимизации. Первый ориентирован на максимальное сокращение времени обработки, второй сочетает ускоренную подготовку с дополнительной доработкой структуры. На данных Yambda базовый метод уменьшил время предварительной обработки с 82 минут до 83 секунд без потери качества. Комбинированный вариант обеспечил ускорение в 15 раз и показал рост точности.

По результатам тестирования Seater опередила модели SASRec, BERT4Rec и GRU4Rec на 13–17%. Разработчики отмечают, что масштаб Yambda позволил подтвердить применимость генеративных рекомендательных систем на крупных каталогах. Исходный код обновленной версии Seater опубликован в открытом доступе.

Читайте ещё материалы по теме:

17:54 Новости
ОАК в 11 раз ускорила создание самолётов с помощью ИИ Сбербанка Российские инженеры переложили проектирование лайнеров на искусственный интеллект платформы T-FLEX
14:30 Новости
Нейросеть вышла на тротуар: роботы «Яндекса» начали ездить быстрее благодаря ИИ Система обучалась в симуляторе на виртуальных маршрутах длиной более 4000 лет
12:40 Новости
Код, данные и нейросети: IT-специалистам готовят новый минимум Компании уже перестраивают обучение сотрудников под новые технологические роли
12:11 Новости
ИИ должен понимать шутки, намёки и культурный код РФ — этого хочет большинство опрошенных россиян Многие воспринимают современные нейросети как собеседников со своим стилем общения и характером
10:41 Новости
Телевизор с господдержкой: «Ростелеком» готовит первую партию смарт-ТВ на «Авроре» Устройства получат российскую ОС, ИИ-ассистента и защиту цифрового контента
Источники:
«Яндекс»

Сейчас на главной