El "Traductor de Yandex" fue entrenado en base a su propia red neuronal YandexGPT. El servicio ha mejorado en la orientación en la léxica profesional, el reconocimiento de frases hechas y la comprensión del contexto. Así lo informó el servicio de prensa de la compañía "Yandex".
Para la generación de ejemplos de entrenamiento de referencia se utilizó un modelo de la familia YandexGPT. El entrenamiento del sistema de servicio se dividió en varias etapas.
El modelo analizó una multitud de textos en inglés y ruso en la etapa de preparación. Luego llegó el turno del ajuste fino controlado (supervised finetuning — SFT) del modelo de lenguaje para las tareas de traducción. SFT es un método utilizado en el aprendizaje automático para mejorar el rendimiento de un modelo pre-entrenado. Primero, el modelo se entrena en un gran conjunto de datos y luego se ajusta en un conjunto de datos específico más pequeño. Esto permite que el modelo conserve el conocimiento general obtenido del gran conjunto de datos y, al mismo tiempo, se adapte a las características específicas del conjunto de datos más pequeño.
En conclusión, los especialistas evaluaron la calidad de las respuestas de YandexGPT, clasificándolas de mejor a peor.
Para evaluar el trabajo se utilizó el método Side by Side (comparación 1:1 de dos objetos). Pares de textos largos en ruso e inglés se tradujeron con la ayuda de la tecnología antigua y nueva. La nueva hizo frente a la tarea un 57% mejor.
Ahora los desarrolladores del servicio prometen que traducirá mejor los textos en temáticas estrechas y determinará las interrelaciones tanto dentro de las oraciones como entre ellas.
Recordemos que el "Traductor de Yandex" funciona desde 2018, traduciendo textos de 100 idiomas. El servicio también sabe traducir inscripciones de imágenes y fotografías.
Anteriormente www1.ru informó que "Yandex" lanzó la red neuronal YandexGPT 3 Lite.