Desarrollaron en la NSU un servicio de IA para crear audiolibros

Investigadores de la Universidad Estatal de Novosibirsk (NSU) lanzaron un servicio para la creación automática de versiones en audio de libros del fondo digitalizado de la biblioteca de la universidad. El proyecto fue creado sobre la base de desarrollos del Centro de Investigación en Inteligencia Artificial (Centro de IA) de la NSU, informaron en el servicio de prensa de la institución educativa.

GigaChat

El texto se extrae de un archivo pdf, pasa por procesamiento y es narrado por una red neuronal. En la universidad planean convertir a formato de audio unas 7 mil publicaciones de la biblioteca electrónica.

Para el uso masivo es importante que la solución no requiere muchos recursos: para un libro se necesita aproximadamente media hora de tiempo de procesador, y se trata de un procesador de 16 núcleos, incluso sin tarjeta gráfica.

Evgeny Pavlovsky, investigador principal del Centro de Inteligencia Artificial de la NSU

El servicio de IA está construido sobre la base del framework "Kappa" (desarrollo del Centro de IA de la NSU). Con su ayuda se pueden gestionar datasets (conjuntos de datos) y modelos de IA. El framework verifica la corrección del funcionamiento de los modelos y reduce el riesgo de errores.

En el marco del modo piloto se sonorizaron 100 libros. El equipo del proyecto espera recibir retroalimentación de la biblioteca universitaria y de los oyentes.

Los desarrolladores consideran que es posible convertir a formato de audio unas 7 mil publicaciones en un mes. Sin embargo, la verificación del resultado requerirá no menos de un año. En el futuro planean escalar su proyecto a otras bibliotecas electrónicas.

Desarrollaron en la NSU un servicio de IA para crear audiolibros

La red neuronal pone voz a textos de la biblioteca electrónica de la universidad

Lea también materiales sobre el tema: