Учёные Университета ИТМО в Санкт-Петербурге разработали инструмент на основе искусственного интеллекта, который с точностью до 94% определяет, написан ли текст человеком или ИИ. Система также способна редактировать тексты, снижая их «машинное происхождение», и уже доступна в демоверсии.
Новый инструмент, созданный в лаборатории компьютерных технологий ИТМО, анализирует стиль и содержание текста, выявляя, создан ли он человеком, ИИ или же перефразирован ИИ. Алгоритм успешно различил авторство в 94% случаев при тестировании на 5,5 тысячах русскоязычных текстов. Для текстов, перефразированных ИИ, точность составила 80%. Система использует две большие языковые модели, которые сравнивают насколько текст «удивительный» или «неожиданный» для них, а также анализирует лингвистические признаки: длину слов, структуру предложений, лексическое разнообразие и читаемость.
Для обучения классификатора учёные создали корпус из более чем 4 тысяч текстов на русском языке, включая научные статьи, эссе, новости, перефразированные тексты и материалы, сгенерированные ИИ, такими как ChatGPT и Gemini. Дополнительно разработан «обфускатор» — инструмент, который редактирует текст, устраняя следы ИИ, сохраняя смысл и читаемость. Он может использоваться для проверки устойчивости детекторов или подготовки текстов к публикации.
Демоверсия инструмента доступна на платформе Hugging Face Spaces, где любой пользователь может протестировать свой текст. В будущем учёные планируют внедрить сервис в ИТМО для проверки студенческих работ и развивать проект с привлечением новых исследователей. Инструмент может применяться в образовании, медиа и бизнесе для маркировки ИИ-контента и проверки документов.
Читайте ещё материалы по теме:
Нейросетевой фреймворк ForecaState для защиты промышленности от кибератак создали в СПб ФИЦ РАН
В Госдуме определились с понятием «искусственный интеллект»
Учителям в помощь!: «Знание» запустило курс о том, как обнаружить ИИ в домашних заданиях
Сейчас на главной
Новая защита не повреждает корпус лёгкой бронетехники и не создаёт вторичных поражающих факторов
Пользователи уже получили 10 млн уведомлений от МФЦ
А также было отражено 3,5 миллиона фишинговых атак
Кумулятивная струя разбивается о металл до того, как коснётся брони
Специалисты использовали лазерное сканирование и фотограмметрию для точного воспроизведения
Подготовку к запуску обсерватории планируется завершить к 2030 году
Технология моделирования улучшает безопасность и скорость движения
Замкнутый цикл абразива повысит рентабельность литья
Новая разработка поможет сократить отходы и превратить пластик в полезные изделия
Для Индии проект боевого истребителя имеет стратегическое значение
Машины будут продаваться только через интернет
НПО машиностроения увеличило объёмы выпуска ключевой продукции в 2025 году