Исследователи из Высшей школы экономики (ВШЭ) и Института искусственного интеллекта AIRI разработали инновационный метод донастройки нейросетей, который ускоряет процесс адаптации моделей под новые задачи. Технология, получившая название GSOFT, основана на группировке и оптимальном перемешивании данных, что позволяет снизить вычислительные затраты без потери качества.

Сравнение результатов генерации различными методами после 3000 шагов обучения / © Gorbunov, M., Yudin, N., Soboleva, V., Alanov, A., Naumov, A., Rakhuba, M.
Сравнение результатов генерации различными методами после 3000 шагов обучения / © Gorbunov, M., Yudin, N., Soboleva, V., Alanov, A., Naumov, A., Rakhuba, M.

Традиционные подходы к дообучению нейросетей, такие как LoRA или BOFT, требуют значительных ресурсов, особенно при работе с крупными моделями. Российские ученые предложили альтернативу — Group-and-Shuffle (GS) матрицы, которые разбивают данные на группы, обрабатывают их отдельно, а затем комбинируют оптимальным образом.

Мы придумали, как формировать ортогональные матрицы, используя всего две матрицы специального вида, а не пять-шесть, как в прежних подходах. Это экономит ресурсы и время обучения.
Николай Юдин, cтажер-исследователь Научно-учебной лаборатории матричных и тензорных методов в машинном обучении НИУ ВШЭ

Метод GSOFT был протестирован на различных задачах, включая дообучение языковой модели RoBERTa и генерацию изображений. В сравнении с аналогами он показал более высокую точность при меньших затратах памяти и времени. Дополнительный вариант Double GSOFT позволяет настраивать параметры с двух сторон, что повышает гибкость модели.

Мы проверили метод в различных сценариях — от языковых и генеративных моделей до устойчивых сверточных сетей. В каждом из них он работал надежно и при меньших затратах ресурсов. Это подтверждает, что мы можем использовать метод для разных целей.
Айбек Аланов, старший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, руководитель группы «Контролируемый генеративный ИИ» Лаборатории FusionBrain Института AIRI

Исследователи также провели проверку своего метода на свёрточных нейронных сетях, которые обычно применяются для анализа изображений и видео, например, в системах распознавания лиц. Они разработали GS-матрицы, которые можно использовать даже в ситуациях, когда модель должна быть устойчива к помехам и искажениям.

Универсальность подхода позволяет применять его в различных сферах — от улучшения языковых моделей до создания устойчивых систем распознавания образов. Это открывает новые перспективы для разработчиков, которым требуется оперативно адаптировать ИИ-решения под меняющиеся задачи.

Читайте ещё материалы по теме:

Конструктор для взрослых: ПАК-AI меняет подход к цифровизации бизнеса в России

Долой офисную рутину: Smart Engines представила ИИ-агенты для автоматизации создания шаблонов в документах

«Алиса, подпишись на www1.ru»: «Яндекс» дополнит своего голосового помощника ИИ-агентом

Источники
Naked Science

Сейчас на главной

Новейшие импортозамещённые станки с ЧПУ закупил «Калашников»
25 минут назад
Новейшие импортозамещённые станки с ЧПУ закупил «Калашников»

Оборудование произведено в Липецке и проходит пусконаладку

Новости Промышленность АО «ЛОМО» «Калашников» Липецкое станкостроительное предприятие
Олеся Михайлова
Беспилотный самосвал КАМАЗ-65119 начал проходить испытания на гранитном карьере в ДНР
30 минут назад
Беспилотный самосвал КАМАЗ-65119 начал проходить испытания на гранитном карьере в ДНР

Эксперты оценят возможности автономной грузовой системы в реальных условиях

Новости Транспорт КамАЗ
Андрей Рудковский
Россия нарастила поставки стали, несмотря на санкции Европы
1 час назад
Россия нарастила поставки стали, несмотря на санкции Европы

Главным конкурентом остаётся Китай, российские компании держатся за счёт дисконта

Новости Промышленность
Олеся Михайлова
Стало известно, на чём ездит руководство АвтоВАЗа
1 час назад
Стало известно, на чём ездит руководство АвтоВАЗа

У руководителя Lada Sport Владислава Незванкина Vesta с турбомотором, хотя серийно такие машины не выпускаются

Новости Авто АвтоВАЗ «Лада спорт»
Олеся Михайлова
Вертолёты Ка-52М получили 30-мм боеприпасы с дистанционным подрывом для эффективной борьбы с БПЛА
2 часа назад
Вертолёты Ка-52М получили 30-мм боеприпасы с дистанционным подрывом для эффективной борьбы с БПЛА

Новинка от Ростеха уже прошла боевое применение: экипаж «Аллигатора» продемонстрировал кадры объективного контроля

Новости Военная техника
Андрей Рудковский
Неизвестный Boeing 787-8 Dreamliner из США пересёк российскую границу
2 часа назад
Неизвестный Boeing 787-8 Dreamliner из США пересёк российскую границу

Сервис Flightradar зафиксировал загадочный полёт американского самолёта

Новости Авиация
Андрей Рудковский
Проблема ремонта ледокола вынудила Архангельскую верфь срочно менять оборудование
4 часа назад
Проблема ремонта ледокола вынудила Архангельскую верфь срочно менять оборудование

Предприятие модернизировали ради «Авраамия Завенягина» проекта 1191

Новости Транспорт Промышленность
Максим Борисов
Турбовинтовым Ил-114-300 предложили огромный рынок сбыта
4 часа назад
Турбовинтовым Ил-114-300 предложили огромный рынок сбыта

Аналитик Степанов заявил, что самолёт станет востребован в Африке

Новости Авиация
Максим Борисов
Авиабомбы ФАБ-500Т для Су-34 и Су-35С серьёзно модернизировали
4 часа назад
Авиабомбы ФАБ-500Т для Су-34 и Су-35С серьёзно модернизировали

Боеприпасы с УМПК образца 2025 года получили радиовысотомеры

Новости Военная техника
Максим Борисов
Пилоты Су24М и Су-30СМ2 уничтожили командные пункты условного противника бомбами ОФАБ-250-270
4 часа назад
Пилоты Су24М и Су-30СМ2 уничтожили командные пункты условного противника бомбами ОФАБ-250-270

Учебно-тренировочные полёты прошли в Калининградской области

Новости Военная техника Минобороны РФ
Юлия Шелковенко
Новейшие БРЭМ-80 на базе газотурбинного танка Т-80 передали военным
4 часа назад
Новейшие БРЭМ-80 на базе газотурбинного танка Т-80 передали военным

Защищённость экипажа резко увеличили после модернизации

Новости Военная техника ГК «Ростех»
Максим Борисов
Эффект от применения БПЛА сопоставим с артиллерией — Генштаб ВС России
5 часов назад
Эффект от применения БПЛА сопоставим с артиллерией — Генштаб ВС России

Генерал-полковник Рудской: Значительная часть потерь противника приходится на FPV-дроны

Новости Военная техника Генштаб ВС России
Юлия Шелковенко