Científicos de la Universidad Estatal de Novosibirsk (NSU) en colaboración con colegas de Kazajistán han desarrollado un algoritmo que permite encontrar información destructiva en la Red. La búsqueda se realiza en ruso y kazajo.
El análisis de las palabras kazajas se realiza basándose en las características morfológicas del idioma. El algoritmo analiza las palabras, determina su forma inicial o forma otras formas basándose en ella. Este enfoque es importante para el análisis semántico de grandes textos o la búsqueda en la Red.
Realizamos un análisis de noticias en el segmento kazajo de Internet en kazajo y ruso, recopilando un extenso conjunto de datos. En particular, investigamos información destructiva y aprendimos a identificarla por una serie de características.
El científico explicó que una de las características de la información destructiva es el llamado a la acción. Además, los especialistas clasificaron la información según la veracidad de los datos y las conclusiones extraídas por los autores de las publicaciones.
En la investigación se utilizó un corpus de medios de comunicación kazajos. Incluía más de 4 millones de publicaciones de 36 fuentes. También se utilizaron más de 2 millones de textos de medios de comunicación rusos.
La información destructiva se determinó mediante métodos de aprendizaje automático e inteligencia artificial basados en criterios como la ausencia de hechos verificables, la politización, el llamado a la acción, la tonalidad negativa y la manipulación.
Científicos de la NSU, junto con empleados de la Universidad Nacional Técnica de Kazajistán K. I. Satpáyev, continúan sus investigaciones. Están desarrollando una ontología en el campo del procesamiento del lenguaje natural en tres idiomas. Permitirá entrenar grandes modelos lingüísticos.
Lea también sobre el tema:
La red neuronal GigaChat aprenderá el idioma udmurto
En la MTUCI enseñarán a la red neuronal a leer códigos de barras dañados
Desarrollan en Moscú una red neuronal para crear guiones de series y películas