«Яндекс переводчик» был обучен на базе собственной нейросети YandexGPT. Сервис стал лучше ориентироваться в профессиональной лексике, распознавать фразеологизмы и понимать контекст. Об этом сообщила пресс-служба компании «Яндекс».
Для генерации эталонных обучающих примеров использовалась модель семейства YandexGPT. Обучение системы сервиса было разбито на несколько этапов.
Модель проанализировала множество текстов на английском и русском языках на этапе предподготовки. Далее пришел черед контролируемой точной настройки (supervised finetuning — SFT)языковой модели для задач перевода. SFT — метод, используемый в машинном обучении для повышения производительности предварительно обученной модели. Сначала модель обучается на большом наборе данных, а затем настраивается на меньшем конкретном наборе данных. Это позволяет модели сохранять общие знания, полученные из большого набора данных, и в то же время адаптироваться к специфическим характеристикам меньшего набора данных.
В заключении специалисты оценили качество ответов YandexGPT, отсортировав их от лучших к худшим.
Для оценки работы использовался метод Side by Side (сравнение 1:1 двух объектов). Пары длинных текстов на русском и английском языках переводились при помощи старой и новой технологии. Новая справилась с задачей на 57% лучше.
Теперь разработчики сервиса обещают, что он будет лучше переводить тексты в узконаправленных тематиках и определять взаимосвязи как внутри предложений, так и между ними.
Напомним, что «Яндекс переводчик» работает с 2018 года, переводя тексты со 100 языков. Сервис также умеет переводить надписи с картинок и фотографий.
Ранее www1.ru сообщал, что «Яндекс» запустил нейросеть YandexGPT 3 Lite.
Читать материалы по теме:
Сейчас на главной
Баканов анонсировал масштабное сотрудничество России и Индии в космической сфере
Предприятия ОПК выпускают значительный объём вооружений
Космонавты Сергей Рыжиков, Алексей Зубрицкий и астронавт NASA Джонатан Ким завершат миссию 9 декабря
Экипаж экпедиции МКС-74 адаптируется к невесомости и готовится к более чем 40 научным экспериментам
Глава государства оценил сотрудничество российских и индийских оружейников
Поезда будут курсировать по укороченным маршрутам с увеличенными интервалами
На вооружении ВС Индии стоит основной боевой танк Т-90
Ограничения введены из-за использования сервиса для преступной деятельности
Самолет со сменной конфигурацией салона будет использоваться для пассажирских и грузовых перевозок
Советский тяжёлый транспортник установил мировой рекорд в историческом полярном перелёте — без ориентиров, над четырьмя океанами и ледяной пустыней
Новый самолёт от ЦАГИ готов перевозить до 180 тонн на 7 000 км — и делать это эффективнее конкурентов
Эксперты предупреждают о фишинговых сообщениях с требованием оплатить задолженность