Yandex ha desarrollado un modelo de red neuronal para control por voz de aproximadamente 200 KB. Según Dmitry Solodukha, jefe de activación por voz, esto es menos que el tamaño de una foto en un smartphone.
La tecnología está diseñada para dispositivos portátiles: auriculares, relojes inteligentes y otros gadgets donde el bajo consumo de energía, la respuesta rápida y el funcionamiento sin una carga constante en el procesador son importantes. En tales dispositivos, el sistema debe escuchar constantemente el sonido ambiental localmente, pero sin agotar la batería ni crear retrasos.
Para ello, los ingenieros de Yandex aplicaron un esquema de dos etapas. Primero, un modelo ligero determina si hay voz en el flujo de audio. Solo después de eso se activa la red neuronal principal, que es responsable del reconocimiento de comandos. Este enfoque reduce la carga en el dispositivo.
Además, los desarrolladores redujeron el número de parámetros del modelo aproximadamente 10 veces gracias a una nueva arquitectura. También se planea utilizar chips con NPU (neuroprocesadores) para tales soluciones, que aceleran los cálculos de IA y consumen menos energía que las CPU normales.
El nuevo modelo podría formar parte de la futura línea de dispositivos de IA portátiles de Yandex. Se espera que los primeros de estos gadgets sean los auriculares Yandex Drops con Alice AI y la función "Mi memoria".
Leer más sobre este tema:
- Yandex lanza un colgante de IA antes que Apple: "Alisa AI" se convierte en una guía portátil en los museos de Moscow
- Yandex desafía a GPT: una nueva red neuronal para empresas resuelve tareas cinco veces más baratas que sus análogos occidentales
- Recomendaciones con intuición: "Yandex Music" enseñó a "Mi Ola" a adivinar el momento