Европейские учёные ускорили обучение ИИ-рекомендаций в 60 раз благодаря датасету Yambda от «Яндекса»

Российский набор данных с 5 млрд событий из «Яндекс Музыки» помог оптимизировать модель Seater

Исследователи из Амстердамского университета сообщили о значительном ускорении обучения рекомендательных систем — почти в 60 раз. Ключевую роль в эксперименте сыграл открытый датасет Yambda, опубликованный «Яндексом» в 2025 году. Он содержит около 5 млрд обезличенных пользовательских событий сервиса «Яндекс Музыка» и считается одним из крупнейших публичных наборов данных для задач рекомендаций.

Работа велась над моделью Seater, которая формирует иерархический каталог контента по принципу древовидной структуры. Такой подход повышает точность рекомендаций, однако этап подготовки каталога ранее занимал до 20% общего времени обучения.

Учёные предложили два способа оптимизации. Первый ориентирован на максимальное сокращение времени обработки, второй сочетает ускоренную подготовку с дополнительной доработкой структуры. На данных Yambda базовый метод уменьшил время предварительной обработки с 82 минут до 83 секунд без потери качества. Комбинированный вариант обеспечил ускорение в 15 раз и показал рост точности.

По результатам тестирования Seater опередила модели SASRec, BERT4Rec и GRU4Rec на 13–17%. Разработчики отмечают, что масштаб Yambda позволил подтвердить применимость генеративных рекомендательных систем на крупных каталогах. Исходный код обновленной версии Seater опубликован в открытом доступе.

Читайте ещё материалы по теме:

Источники
«Яндекс»

Сейчас на главной

«Госуслуги» будут уведомлять россиян о новых кредитах — оповещение придёт через 15 минут после оформления
18 мар. 2026 г., 15:17:03

Банки и МФО будут передавать данные в бюро кредитных историй, а те — направлять информацию в личный кабинет заёмщика

Гастрономическая посылка от красноярских шеф-поваров впервые отправится на МКС — её повезёт «Союз МС-29»
18 мар. 2026 г., 14:03:35

Институт гастрономии СФУ и бренд-шеф Bellini создадут авторскую еду для космонавтов к 65-летию полёта Гагарина

АвтоВАЗ выделил коммерческие автомобили в отдельный бизнес — новое направление получило название «Лада Бизнес»
18 мар. 2026 г., 13:08:42

Под зонтичный бренд войдут фургоны Largus, снегоболотоход на базе Niva, спецавтомобили «Промтех» и метановые версии Largus и Vesta

На площадке УАЗ в Ульяновске запустили производство сидений для пикапов Sollers ST6 и ST8 — 40 тысяч комплектов в год
18 мар. 2026 г., 13:01:10

Индустриальный партнёр — «Автодом», все компоненты от пенополиуретана до нагревательных элементов — российские