Sber ha abierto el acceso a la modelo de lenguaje experimental GFusion, creada por Daniil Tikhonov, un ex pasante del equipo de modelos fundamentales. A diferencia de las redes neuronales habituales, no escribe la respuesta estrictamente de izquierda a derecha, sino que primero recopila un borrador y luego mejora gradualmente las partes individuales.

Este enfoque se llama difusivo, de manera similar a cómo las redes neuronales crean imágenes y videos. Un modelo de lenguaje ordinario tendría que reescribir la continuación de la respuesta si cometió un error al principio. GFusion puede volver al fragmento deseado y corregirlo sin empezar de nuevo.

Gracias a la generación paralela, el modelo, según las pruebas de Sber, funciona hasta un 45% más rápido que GigaChat 3, en el que fue entrenado. Los desarrolladores creen que este principio puede ser útil donde la velocidad es importante: en el autocompletado de código, agentes de IA y servicios con un retraso mínimo.

Los modelos de difusión estructuran mejor las respuestas y pueden generar texto de forma no secuencial, eligiendo de forma independiente el orden de escritura.
Daniil Tikhonov, ingeniero de aprendizaje automático de Sber, autor del proyecto

Junto con GFusion, la compañía lanzó herramientas para entrenar modelos similares. Deberían reducir la necesidad de tarjetas de video y acelerar los experimentos de los desarrolladores. El equipo también agregó soporte para su arquitectura en SGLang, una popular herramienta de código abierto para ejecutar modelos de lenguaje.

Leer más sobre este tema: