Инструмент для выявления происхождения текстов, написанных ИИ, создан в университете ИТМО

Алгоритм успешно различил авторство в 94% случаев

Учёные Университета ИТМО в Санкт-Петербурге разработали инструмент на основе искусственного интеллекта, который с точностью до 94% определяет, написан ли текст человеком или ИИ. Система также способна редактировать тексты, снижая их «машинное происхождение», и уже доступна в демоверсии.

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста
Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста

Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста, выявляя, создан ли он человеком, ИИ или же перефразирован ИИ. Алгоритм успешно различил авторство в 94% случаев при тестировании на 5,5 тысячах русскоязычных текстов. Для текстов, перефразированных ИИ, точность составила 80%. Система использует две большие языковые модели, которые сравнивают насколько текст «удивительный» или «неожиданный» для них, а также анализирует лингвистические признаки: длину слов, структуру предложений, лексическое разнообразие и читаемость.

Для обучения классификатора учёные создали корпус из более чем 4 тысяч текстов на русском языке, включая научные статьи, эссе, новости, перефразированные тексты и материалы, сгенерированные ИИ, такими как ChatGPT и Gemini. Дополнительно разработан «обфускатор» — инструмент, который редактирует текст, устраняя следы ИИ, сохраняя смысл и читаемость. Он может использоваться для проверки устойчивости детекторов или подготовки текстов к публикации.

Демоверсия инструмента доступна на платформе Hugging Face Spaces, где любой пользователь может протестировать свой текст. В будущем учёные планируют внедрить сервис в ИТМО для проверки студенческих работ и развивать проект с привлечением новых исследователей. Инструмент может применяться в образовании, медиа и бизнесе для маркировки ИИ-контента и проверки документов.

Читайте ещё материалы по теме:

Нейросетевой фреймворк ForecaState для защиты промышленности от кибератак создали в СПб ФИЦ РАН

В Госдуме определились с понятием «искусственный интеллект»

Учителям в помощь!: «Знание» запустило курс о том, как обнаружить ИИ в домашних заданиях

09:41 Новости
«Госуслуги» стали приёмной комиссией: заявления в вузы и колледжи принимают онлайн Портал помогает отслеживать этапы поступления в личном кабинете
07:05 Новости
GG WB не случилось: Wildberries поставила игровые планы на паузу Выход на рынок гейминга оценивали в 2,5 миллиарда рублей, но риск оказался слишком высоким
06:59 Новости
Киберполигон для развития ИИ предложили создать в Челябинске Цифровую инфраструктуру могут разместить на базе межуниверситетского кампуса «Южный Урал»
06:16 Новости
Закон об ИИ«потерял зубы»: маркировку отменили, а авторские права и ответственность отложили Господдержку получат только «суверенные» и «национальные» разработки
21 июн 15:35 Новости
Mash: Российские хакеры взломали 50 тысяч камер в Европе и поставили ИИ следить за каждым шагом Группировка NoName057(16) проводит операцию «Разбитый байт» до 1 июля

Сейчас на главной