Институт востоковедения РАН и Яндекс создали систему ИИ для ускоренного анализа восточных источников

Система обрабатывает более 1,5 млн документов на четырёх вариантах китайского языка

Институт востоковедения РАН совместно с Яндексом создал искусственный интеллект, способный обрабатывать тысячи первоисточников на восточных языках ежедневно. Новый AI-ассистент анализирует научные тексты, выделяет ключевые факты и формирует краткие аналитические выжимки, включая материалы китайских СМИ.

Система уже работает с более чем 1,5 миллионами документов и охватывает четыре варианта китайского языка — континентальный, тайваньский, гонконгский и сингапурский.

По словам директора Института Аликбера Аликберова, проект является частью масштабной цифровой трансформации учреждения. «Партнёрство с Яндексом позволяет существенно расширить объём и глубину анализа материалов, сохраняя фундаментальность академического подхода», — отметил он.

Старший научный сотрудник Александр Костыркин отметил, что время обработки информации с помощью ИИ-ассистента сокращается с нескольких часов до 10–15 минут на одну исследовательскую задачу, что даёт возможность ежедневно анализировать сотни источников.

ИИ-ассистент создан на платформе Yandex AI Studio с использованием генеративных моделей и технологий Yandex Cloud. Система работает по принципу RAG-архитектуры: языковая модель формирует ответы на основе данных из собственной базы и дополнительных источников. Векторизация и семантический поиск позволяют находить информацию по смыслу, а модель FRED-T5-Summarizer сжимает тексты в краткие выжимки, формируя понятные русскоязычные ответы.

Особое внимание уделено мониторингу китайских СМИ. Ранее система переводила тексты через английский, но с появлением крупных моделей Qwen возможна прямая работа с китайскими источниками. Сейчас ведётся подключение 235-миллиардной модели Qwen3, что позволяет исследователям получать более точные данные без посредничества англоязычных источников.

Читайте ещё материалы:

Источники
ТАСС Yandex Cloud

Сейчас на главной