Investigadores de Sber han desarrollado GigaEmbeddings, un modelo que mejora el trabajo con textos en ruso. Se basa en GigaChat-3B y utiliza un aprendizaje de tres etapas: preparación preliminar, ajuste preciso y aprendizaje multitarea. La arquitectura está optimizada, lo que ha reducido los parámetros de la red neuronal en un 25% sin disminuir la calidad.
Hasta ahora, las empresas carecían de herramientas eficaces para analizar textos en ruso. Las soluciones existentes requerían grandes capacidades o no eran buenas para la búsqueda y la clasificación. GigaEmbeddings resuelve estos problemas. El modelo es adecuado para la búsqueda inteligente en e-commerce, la creación de chatbots con funciones ampliadas, el análisis de las consultas de los clientes y la generación de recomendaciones.
Hoy estamos cubriendo una necesidad crítica del mercado de soluciones NLP de calidad para el idioma ruso. Nuestra plataforma integral permite a las empresas optimizar radicalmente todos los procesos de trabajo con textos, desde la búsqueda básica y los algoritmos de recomendación hasta los sistemas RAG avanzados en los chatbots. [...] Las empresas finalmente obtienen una solución única: ya no necesitan recopilar la funcionalidad por partes de productos extranjeros.
El modelo está disponible en GitVerse y HuggingFace. Los desarrolladores esperan que se convierta en un estándar para el sector financiero, el retail y los servicios gubernamentales.