MERA Code: первый открытый бенчмарк для оценки русскоязычных ИИ-моделей в программировании

Новое российское ПО поможет оценить эффективность языковых моделей

Альянс в сфере искусственного интеллекта представил MERA Code — первый открытый бенчмарк для тестирования русскоязычных ИИ-моделей в программировании. Разработанный при участии ведущих технологических компаний и университетов, включая Сбер, Т-Банк, MWS AI (МТС Web Services), Ростелеком, Университет Иннополис, ИТМО, Сколтех, Центральный университет и «Сибирские нейросети», инструмент призван решить проблему отсутствия единого стандарта оценки эффективности ИИ в генерации кода.

Бенчмарк предлагает прозрачную методику оценки больших языковых моделей (LLM) с учётом специфики русского языка. В отличие от зарубежных аналогов, он включает 11 задач в трёх форматах: text2code (генерация кода по описанию), code2text (документирование кода) и code2code (оптимизация и исправление). Тестирование поддерживает 8 языков программирования: Python, Java, C#, JavaScript, Go, C, C++ и Scala.

Важное отличие — изолированная среда выполнения, где код не просто анализируется, а запускается, что повышает объективность оценки. Платформа открыта для всех: разработчики могут сравнивать модели через рейтинговую систему, а исследователи — использовать фреймворк для собственных тестов.

MERA Code поможет:

  • Разработчикам — выбирать оптимальные ИИ-инструменты для работы.
  • Исследователям — сравнивать модели в единых условиях.
  • Компаниям — принимать решения на основе прозрачных данных.

Это уже вторая ветка бенчмарка MERA после презентации на AI Journey 2023. В июне 2025 года появилась отраслевая версия MERA Industrial, а теперь — специализированное решение для программистов.

Читайте ещё материалы по теме:

«Мы строим облако, где всё под контролем»: Astra Cloud и YADRO создают альтернативу западным платформам

Новые ограничения для иностранного ПО: Россия усиливает меры по импортозамещению в IT-сфере

Telegram останется на российском рынке, а WhatsApp может столкнуться с ограничениями — депутат Горелкин

18:17 Новости
РСХБ адаптирует мобильное приложение для старшего поколения: упрощённый интерфейс и онлайн-перевод пенсии Банк внедряет специальный режим с крупным шрифтом, финансовыми подсказками и дистанционным оформлением выплат
17:47 Новости
Ипортозаместили Figma: Ростелеком запустил тестирование редактора «Спектр» Сервис уже внесён в реестр отечественного ПО и ориентирован на госсектор
17:37 Новости
Листать, вдохновляться, покупать: «Яндекс» добавил кнопку «в 1 клик» к постам брендов и блогеров Теперь оформить заказ можно сразу из поста — без поиска и лишних переходов
17:28 Новости
2ГИС подключился к светофорам в Петербурге: рынок навигаторов оживился Инфраструктура города начинает работать внутри приложений
15:40 Новости
64 ядра и своя система: российский процессор «Иртыш C664» будет работать на отечественной ОС Линейка чипов на 16, 32 и 64 ядра получит специализированное ПО для работы в критически важных сферах

Сейчас на главной

РСХБ адаптирует мобильное приложение для старшего поколения: упрощённый интерфейс и онлайн-перевод пенсии
20 апр. 2026 г., 18:17:00

Банк внедряет специальный режим с крупным шрифтом, финансовыми подсказками и дистанционным оформлением выплат