Investigadores de la Universidad Estatal de Novosibirsk (NSU) lanzaron un servicio para la creación automática de versiones en audio de libros del fondo digitalizado de la biblioteca de la universidad. El proyecto fue creado sobre la base de desarrollos del Centro de Investigación en Inteligencia Artificial (Centro de IA) de la NSU, informaron en el servicio de prensa de la institución educativa.
El texto se extrae de un archivo pdf, pasa por procesamiento y es narrado por una red neuronal. En la universidad planean convertir a formato de audio unas 7 mil publicaciones de la biblioteca electrónica.
Para el uso masivo es importante que la solución no requiere muchos recursos: para un libro se necesita aproximadamente media hora de tiempo de procesador, y se trata de un procesador de 16 núcleos, incluso sin tarjeta gráfica.
El servicio de IA está construido sobre la base del framework "Kappa" (desarrollo del Centro de IA de la NSU). Con su ayuda se pueden gestionar datasets (conjuntos de datos) y modelos de IA. El framework verifica la corrección del funcionamiento de los modelos y reduce el riesgo de errores.
En el marco del modo piloto se sonorizaron 100 libros. El equipo del proyecto espera recibir retroalimentación de la biblioteca universitaria y de los oyentes.
Los desarrolladores consideran que es posible convertir a formato de audio unas 7 mil publicaciones en un mes. Sin embargo, la verificación del resultado requerirá no menos de un año. En el futuro planean escalar su proyecto a otras bibliotecas electrónicas.
Lea también materiales sobre el tema:
- Los superconductores serán encontrados por la inteligencia artificial: científicos rusos desarrollaron un nuevo enfoque
- Inteligencia artificial vs inteligencia inmadura: los escolares rusos comenzarán a aprender a trabajar con redes neuronales
- Neuroinvestigador en guardia: el SKR implementa activamente inteligencia artificial para acelerar el trabajo