Учёные Иннополиса ускорили обучение ИИ с помощью моделирования человеческого взгляда

Эксперименты проводились на моделях LLaMa и Mistral с англоязычными текстами

Исследователи из Университета Иннополис придумали, как ускорить обучение больших языковых моделей в 1,5–2 раза. Впервые для этого они использовали данные о том, как человек визуально воспринимает и читает текст, сообщили «Первому техническому» в пресс-службе вуза.

Современные методы согласования ИИ с предпочтениями людей (RLHF) работают медленно и требуют огромных вычислительных мощностей. Проблема в том, что модель наград оценивает весь сгенерированный текст одной общей оценкой, не указывая, что именно в нём хорошо или плохо. Учёные из Иннополиса предложили смотреть на текст глазами человека.

Данные взгляда собирают с помощью айтрекера — устройства, закреплённого на мониторе. Оно отслеживает, на какие части текста человек обращает внимание, в какой последовательности и как долго задерживает взгляд. Учёные провели эксперименты с англоязычными текстами и моделями LLaMa и Mistral, протестировав два подхода. Оба дали ускорение обучения в 1,5–2 раза без потери качества.

Исследование доказывает, что человеческий взгляд — значимый и ранее недооценённый сигнал в обучении ИИ-моделей. Использование данных взгляда позволяет создавать более эффективные и экономичные методы согласования языковых моделей. Это не просто ускоряет процесс, а делает его целенаправленнее, подобно тому, как учитель вместо "двойки" за работу указывает ученику на конкретные фразы, требующие доработки. Кроме того, наша работа показала, что данные взгляда человека могут быть заменены синтетическими, чтобы решить главные проблемы подобных исследований — острую нехватку информации о взгляде и сложность с получением новых данных.
Илья Першин, руководитель Лаборатории искусственного интеллекта в медицине Университета Иннополис

В будущем учёные планируют проверить метод на офлайн-алгоритмах и расширить исследования на другие языки.

Читайте ещё материалы по теме:

06:31 Новости
ИИ в предвыборной агитации разрешили в России — но с важным условием Новые нормы вводят обязательное согласие на применение цифровых образов в избиратльной кампании
06:28 Новости
Астероид Апофис пройдёт рядом с Землёй: в России уже разработали план его изучения Для миссии хотят задействовать «Спектр-РГ» и минимизировать затраты топлива
29 апр 15:56 Новости
Станок-рекордсмен: учёные ИжГТУ ускорили обработку деталей в два раза Инженеры изменили подход к хонингованию
29 апр 15:22 Новости
Керамический монстр для мяса: новую печь на замену мангалу, грилю и коптильне придумали инженеры ВГУИТ Патент на изобретение получили учёные из Воронежа
29 апр 14:58 Новости
Технология будущего: способ находить трещины в металле с точностью до долей миллиметра изобрели в СГУПС Новый метод вихретокового контроля позволяет измерять глубину повреждений даже у близкорасположенных дефектов

Сейчас на главной

Казахстан отдал Китаю советские чертежи турбины для ТЭЦ и обойдётся без России
2 часа назад

Завод в КНР построит силовой агрегат по технической документации Ленинградского металлического завода