Инструмент для выявления происхождения текстов, написанных ИИ, создан в университете ИТМО

Алгоритм успешно различил авторство в 94% случаев

Учёные Университета ИТМО в Санкт-Петербурге разработали инструмент на основе искусственного интеллекта, который с точностью до 94% определяет, написан ли текст человеком или ИИ. Система также способна редактировать тексты, снижая их «машинное происхождение», и уже доступна в демоверсии.

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста
Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста, выявляя, создан ли он человеком, ИИ или же перефразирован ИИ. Алгоритм успешно различил авторство в 94% случаев при тестировании на 5,5 тысячах русскоязычных текстов. Для текстов, перефразированных ИИ, точность составила 80%. Система использует две большие языковые модели, которые сравнивают насколько текст «удивительный» или «неожиданный» для них, а также анализирует лингвистические признаки: длину слов, структуру предложений, лексическое разнообразие и читаемость.

Для обучения классификатора учёные создали корпус из более чем 4 тысяч текстов на русском языке, включая научные статьи, эссе, новости, перефразированные тексты и материалы, сгенерированные ИИ, такими как ChatGPT и Gemini. Дополнительно разработан «обфускатор» — инструмент, который редактирует текст, устраняя следы ИИ, сохраняя смысл и читаемость. Он может использоваться для проверки устойчивости детекторов или подготовки текстов к публикации.

Демоверсия инструмента доступна на платформе Hugging Face Spaces, где любой пользователь может протестировать свой текст. В будущем учёные планируют внедрить сервис в ИТМО для проверки студенческих работ и развивать проект с привлечением новых исследователей. Инструмент может применяться в образовании, медиа и бизнесе для маркировки ИИ-контента и проверки документов.

Читайте ещё материалы по теме:

Нейросетевой фреймворк ForecaState для защиты промышленности от кибератак создали в СПб ФИЦ РАН

В Госдуме определились с понятием «искусственный интеллект»

Учителям в помощь!: «Знание» запустило курс о том, как обнаружить ИИ в домашних заданиях

13:31 Новости
Tsarevna, «Берсерк» и «Командиры бездорожья»: 30 отечественных игр представят в Москве Посетители «Кей-поп Киберсубботы» смогут протестировать хорроры, стратегии и славянское фэнтези до официального релиза
11:55 Новости
Max будут использовать для организации дистанта в школах и техникумах Правительство внесло изменения в правила электронного обучения
11:43 Новости
Сбер запустил ИИ-серверы в лизинг: GigaChat Enterprise получили на 36 месяцев без стартовых затрат Первый договор оформил «СберЛизинг» — девелопер развернёт цифрового помощника для продаж недвижимости
11:19 Новости
ChatGPT в России отключают: эксперты советуют переходить на отечественный ИИ Пользователям рекомендуют заранее мигрировать на платформы вроде GigaChat и ЯндексGPT
09:32 Новости
Сервер пятого поколения и ShokinGPT: Ростех покажет на ЦИПР-2026 более 30 разработок Новинки помогут повысить производительность труда

Сейчас на главной

Tsarevna, «Берсерк» и «Командиры бездорожья»: 30 отечественных игр представят в Москве
4 часа назад

Посетители «Кей-поп Киберсубботы» смогут протестировать хорроры, стратегии и славянское фэнтези до официального релиза