Инструмент для выявления происхождения текстов, написанных ИИ, создан в университете ИТМО

Алгоритм успешно различил авторство в 94% случаев

Учёные Университета ИТМО в Санкт-Петербурге разработали инструмент на основе искусственного интеллекта, который с точностью до 94% определяет, написан ли текст человеком или ИИ. Система также способна редактировать тексты, снижая их «машинное происхождение», и уже доступна в демоверсии.

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста, выявляя, создан ли он человеком, ИИ или же перефразирован ИИ. Алгоритм успешно различил авторство в 94% случаев при тестировании на 5,5 тысячах русскоязычных текстов. Для текстов, перефразированных ИИ, точность составила 80%. Система использует две большие языковые модели, которые сравнивают насколько текст «удивительный» или «неожиданный» для них, а также анализирует лингвистические признаки: длину слов, структуру предложений, лексическое разнообразие и читаемость.

Для обучения классификатора учёные создали корпус из более чем 4 тысяч текстов на русском языке, включая научные статьи, эссе, новости, перефразированные тексты и материалы, сгенерированные ИИ, такими как ChatGPT и Gemini. Дополнительно разработан «обфускатор» — инструмент, который редактирует текст, устраняя следы ИИ, сохраняя смысл и читаемость. Он может использоваться для проверки устойчивости детекторов или подготовки текстов к публикации.

Демоверсия инструмента доступна на платформе Hugging Face Spaces, где любой пользователь может протестировать свой текст. В будущем учёные планируют внедрить сервис в ИТМО для проверки студенческих работ и развивать проект с привлечением новых исследователей. Инструмент может применяться в образовании, медиа и бизнесе для маркировки ИИ-контента и проверки документов.

Читайте ещё материалы по теме:

Нейросетевой фреймворк ForecaState для защиты промышленности от кибератак создали в СПб ФИЦ РАН

В Госдуме определились с понятием «искусственный интеллект»

Учителям в помощь!: «Знание» запустило курс о том, как обнаружить ИИ в домашних заданиях