«Норникель» представил MetalGPT-1 — специализированную языковую модель для металлургического и горнодобывающего сектора. Компания называет разработку первым открытым решением подобного масштаба в отрасли.
MetalGPT-1 содержит 32 млрд параметров и обучена на 10 ГБ профессиональных материалов, что сопоставимо с половиной объёма англоязычной Википедии.
Ключевым преимуществом модели в «Норникеле» называют уникальное качество тренировочного корпуса: в него вошло более 1 млн документов, недоступных в открытом доступе. Среди них — технологические регламенты, внутренние инструкции предприятий, проектно-конструкторская документация, патенты, отчёты НИОКР и специализированная научно-техническая литература. Все данные прошли многоступенчатую очистку и обязательную анонимизацию.
Кроме того, разработчики сформировали около 500 тыс. пар «вопрос–ответ» и инструктивных примеров, отражающих реальные задачи производства и научных исследований.
MetalGPT-1 открывает линейку отраслевых LLM с открытым исходным кодом, над которой «Норникель» планирует развивать собственную экосистему промышленных ИИ-решений.