MERA Code: первый открытый бенчмарк для оценки русскоязычных ИИ-моделей в программировании

Альянс в сфере искусственного интеллекта представил MERA Code — первый открытый бенчмарк для тестирования русскоязычных ИИ-моделей в программировании. Разработанный при участии ведущих технологических компаний и университетов, включая Сбер, Т-Банк, MWS AI (МТС Web Services), Ростелеком, Университет Иннополис, ИТМО, Сколтех, Центральный университет и «Сибирские нейросети», инструмент призван решить проблему отсутствия единого стандарта оценки эффективности ИИ в генерации кода.

Источник изображения: сгенерировано нейросетью Copilot

Бенчмарк предлагает прозрачную методику оценки больших языковых моделей (LLM) с учётом специфики русского языка. В отличие от зарубежных аналогов, он включает 11 задач в трёх форматах: text2code (генерация кода по описанию), code2text (документирование кода) и code2code (оптимизация и исправление). Тестирование поддерживает 8 языков программирования: Python, Java, C#, JavaScript, Go, C, C++ и Scala.

Важное отличие — изолированная среда выполнения, где код не просто анализируется, а запускается, что повышает объективность оценки. Платформа открыта для всех: разработчики могут сравнивать модели через рейтинговую систему, а исследователи — использовать фреймворк для собственных тестов.

MERA Code поможет:

Разработчикам — выбирать оптимальные ИИ-инструменты для работы.
Исследователям — сравнивать модели в единых условиях.
Компаниям — принимать решения на основе прозрачных данных.

Это уже вторая ветка бенчмарка MERA после презентации на AI Journey 2023. В июне 2025 года появилась отраслевая версия MERA Industrial, а теперь — специализированное решение для программистов.

Читайте ещё материалы по теме:

«Мы строим облако, где всё под контролем»: Astra Cloud и YADRO создают альтернативу западным платформам

Новые ограничения для иностранного ПО: Россия усиливает меры по импортозамещению в IT-сфере

Telegram останется на российском рынке, а WhatsApp может столкнуться с ограничениями — депутат Горелкин