Herramienta para detectar el origen de textos escritos por IA, creada en la Universidad ITMO

Científicos de la Universidad ITMO en San Petersburgo han desarrollado una herramienta basada en inteligencia artificial que determina con una precisión de hasta el 94% si un texto ha sido escrito por una persona o por una IA. El sistema también es capaz de editar textos, reduciendo su "origen artificial", y ya está disponible en una versión de demostración.

La nueva herramienta, creada en el laboratorio de tecnologías informáticas de ITMO, analiza el estilo y el contenido del texto, detectando si ha sido creado por una persona, una IA o si ha sido parafraseado por una IA. El algoritmo distinguió con éxito la autoría en el 94% de los casos al probarse en 5,5 mil textos en ruso. Para los textos parafraseados por la IA, la precisión fue del 80%. El sistema utiliza dos grandes modelos lingüísticos que comparan cuán "sorprendente" o "inesperado" es el texto para ellos, y también analiza características lingüísticas: la longitud de las palabras, la estructura de las oraciones, la diversidad léxica y la legibilidad.

Para entrenar al clasificador, los científicos crearon un corpus de más de 4 mil textos en ruso, incluyendo artículos científicos, ensayos, noticias, textos parafraseados y materiales generados por IA, como ChatGPT y Gemini. Adicionalmente, se desarrolló un "obfuscador", una herramienta que edita el texto, eliminando rastros de IA, preservando el significado y la legibilidad. Puede utilizarse para verificar la resistencia de los detectores o para preparar textos para su publicación.

La versión de demostración de la herramienta está disponible en la plataforma Hugging Face Spaces, donde cualquier usuario puede probar su texto. En el futuro, los científicos planean implementar el servicio en ITMO para verificar los trabajos de los estudiantes y desarrollar el proyecto con la participación de nuevos investigadores. La herramienta puede aplicarse en la educación, los medios y los negocios para marcar el contenido de IA y verificar documentos.

Lea más materiales sobre el tema:

Marco de red neuronal ForecaState para proteger la industria de los ciberataques creado en el Centro Científico de San Petersburgo de la Academia de Ciencias de Rusia

La Duma Estatal ha definido el concepto de "inteligencia artificial"

¡Ayuda para los profesores!: "Znanie" ha lanzado un curso sobre cómo detectar la IA en las tareas domésticas