Los programadores de Yandex han publicado métodos nuevos para comprimir modelos de lenguaje en acceso abierto. Su implementación permitirá a las empresas reducir los costos computacionales del uso de redes neuronales hasta en ocho veces y, por lo tanto, ahorrar dinero. La solución de Yandex Research ayudará a aquellas empresas que ejecutan redes neuronales en sus propias instalaciones.
Normalmente, un modelo de lenguaje requiere una gran cantidad de potentes procesadores gráficos para funcionar rápidamente. Los especialistas de Yandex han creado una solución que reduce la potencia computacional necesaria. También incluye un sistema para corregir errores que se producen al comprimir un modelo de lenguaje grande.
La compañía afirma que la solución presentada conserva el 95% de la calidad de las respuestas de la red neuronal. El código publicado está disponible en GitHub.
Lea también sobre este tema:
Una red neuronal de Yandex puede volver a contar videos en un idioma extranjero
Una red neuronal entrenada para reconocer rostros desde ángulos incómodos
Se supo lo que piensan los rusos sobre la inteligencia artificial