El Centro Federal de Investigación de San Petersburgo de la Academia de Ciencias de Rusia (SPb FIC RAS) informó que los científicos de la institución capacitaron a una red neuronal para leer los labios a través de un teléfono inteligente. Esto debería facilitar el uso de comandos de voz en condiciones muy ruidosas.
«Hemos desarrollado una aplicación para teléfonos inteligentes que reconoce el habla y lee los labios del usuario, analizando la señal de video de la cámara del dispositivo. El programa combina y analiza información de dos fuentes para mejorar la precisión del reconocimiento. Los experimentos demostraron que este tipo de sistema híbrido reconoce los comandos de una persona de manera mucho más efectiva en condiciones difíciles y ruidosas», dijo Denis Ivanko, investigador científico principal del laboratorio de interfaces multimodales y de voz del SPb FIC RAS.