VK Video ha внедрил nuevos algoritmos de inteligencia artificial para mejorar el reconocimiento de voz y la generación automática de subtítulos. La precisión del reconocimiento de voz ha aumentado en un 25%, y ahora las redes neuronales reconocen miles de palabras nuevas, incluyendo memes populares, nombres propios, acrónimos y términos especializados.
Los subtítulos automáticos se crean utilizando el aprendizaje automático, lo que permite no solo transformar el habla en texto, sino también colocar correctamente los signos de puntuación y sincronizar el texto con el video. El sistema pasa por varias etapas de procesamiento: elimina los ruidos extraños, transforma el habla en texto, y luego los modelos de puntuación y desnormalización lo convierten en un formato fácil de leer.
En un futuro próximo, la IA también podrá separar el habla de diferentes oradores, lo que hará que los subtítulos sean aún más fáciles de entender. Esta función se está volviendo cada vez más popular entre los usuarios de VK Video, especialmente entre las personas con discapacidad auditiva y aquellos que ven videos en condiciones en las que no pueden encender el sonido.
En el último mes, la proporción de usuarios que utilizan subtítulos en la versión web de VK Video ha aumentado en un 28%, y actualmente el 11% de toda la audiencia de la plataforma utiliza esta función.
Leer materiales sobre el tema:
El espectador controla al blogger: VK Video fue el primero en Rusia en lanzar contenido interactivo
VK Video tiene una actualización para tabletas en Android
VK lanzó oficialmente la plataforma «VK Video»: ver videos es posible incluso sin registrarse