Sber desarrolla un algoritmo eficaz para el procesamiento de textos en procesos empresariales

GigaEmbeddings es adecuado para la búsqueda inteligente en e-commerce, la creación de chatbots con funciones ampliadas, el análisis de las consultas de los clientes y la generación de recomendaciones

Investigadores de Sber han desarrollado GigaEmbeddings, un modelo que mejora el trabajo con textos en ruso. Se basa en GigaChat-3B y utiliza un aprendizaje de tres etapas: preparación preliminar, ajuste preciso y aprendizaje multitarea. La arquitectura está optimizada, lo que ha reducido los parámetros de la red neuronal en un 25% sin disminuir la calidad.

Hasta ahora, las empresas carecían de herramientas eficaces para analizar textos en ruso. Las soluciones existentes requerían grandes capacidades o no eran buenas para la búsqueda y la clasificación. GigaEmbeddings resuelve estos problemas. El modelo es adecuado para la búsqueda inteligente en e-commerce, la creación de chatbots con funciones ampliadas, el análisis de las consultas de los clientes y la generación de recomendaciones.

Hoy estamos cubriendo una necesidad crítica del mercado de soluciones NLP de calidad para el idioma ruso. Nuestra plataforma integral permite a las empresas optimizar radicalmente todos los procesos de trabajo con textos, desde la búsqueda básica y los algoritmos de recomendación hasta los sistemas RAG avanzados en los chatbots. [...] Las empresas finalmente obtienen una solución única: ya no necesitan recopilar la funcionalidad por partes de productos extranjeros.
Fiódor Minkin, director técnico de GigaChat Sberbank

El modelo está disponible en GitVerse y HuggingFace. Los desarrolladores esperan que se convierta en un estándar para el sector financiero, el retail y los servicios gubernamentales.

Lea más materiales sobre el tema:

Se ha desarrollado en la Universidad Electrotécnica de San Petersburgo «LETI» una plataforma para la implantación segura de la IA en estructuras estatales y corporaciones

El sistema operativo de Sber, SberOS, ahora es compatible con la arquitectura abierta RISC-V, lo que amplía las oportunidades de sustitución de importaciones

El sistema de ensamblaje de software ruso de «NTC IT ROSA» ha entrado en el registro del Ministerio de Desarrollo Digital

Ahora en la página principal