Científicos de MTUSI crean un servicio para la búsqueda automática de contenido malicioso en Internet

El sistema combina tres circuitos de análisis: léxico, morfológico y de red neuronal

Especialistas de la Universidad Técnica de Comunicaciones e Informática de Moscú (MTUSI) han desarrollado un servicio que detecta automáticamente información potencialmente peligrosa, poco fiable e indeseable en publicaciones en línea. Según informó RIA Novosti en el servicio de prensa de la universidad, se basa en tecnologías de aprendizaje automático y métodos modernos de procesamiento de datos textuales.

La arquitectura del sistema tiene tres circuitos. El primer nivel es la búsqueda por diccionario, que compara el texto con palabras clave y realiza un filtrado básico. El segundo es el análisis morfológico con lematización, que permite tener en cuenta diferentes formas de palabras sin necesidad de incluir todas las variantes posibles en el diccionario. El tercer circuito, el inteligente, se implementa en un modelo preentrenado basado en transformadores, que garantiza una alta precisión de clasificación y es capaz de captar el contexto, no solo palabras desencadenantes.

La ventaja del desarrollo es que combina métodos lingüísticos clásicos con un enfoque de red neuronal. Un simple filtro de diccionario pasará por alto el contenido malicioso si el autor reformula la frase, mientras que el modelo transformador analiza la semántica y es capaz de reconocer el significado peligroso incluso de forma velada. Los investigadores ya han implementado los módulos clave del sistema: autenticación y autorización de usuarios, trabajo con el diccionario, registro y componentes analíticos.

Los planes incluyen una mayor mejora de los modelos de aprendizaje automático, la expansión del diccionario y el aumento de la precisión de la clasificación.

De hecho, MTUSI no está creando una herramienta de moderación única, sino una plataforma de autoaprendizaje que se adaptará a las nuevas amenazas. A diferencia de los filtros estáticos, que los atacantes tarde o temprano eluden, un sistema con un modelo transformador es capaz de evolucionar junto con el panorama de amenazas.

Leer más sobre este tema: