Исследователи Новосибирского государственного университета (НГУ) запустили сервис по автоматическому созданию аудиоверсий книг из оцифрованного фонда библиотеки вуза. Проект создан на базе разработок Исследовательского центра искусственного интеллекта (Центра ИИ) НГУ, рассказали в пресс-службе образовательного учреждения.
Текст извлекается из pdf-файла, проходит обработку и озвучивается нейросетью. В вузе планируют перевести в аудиоформат порядка 7 тыс. изданий из электронной библиотеки.
Для массового использования важно, что решение не является ресурсоемким: на одну книгу уходит примерно полчаса процессорного времени, причем речь о 16-ядерном процессоре, даже без видеокарты.
ИИ-сервис построен на базе фреймворка «Каппа» (разработка Центра ИИ НГУ). С его помощью можно управлять датасетами (набор данных) и ИИ-моделями. Фреймворк проверяет корректность работы моделей и снижает риск ошибок.
В рамках пилотного режима были озучены 100 книг. Команда проекта ждёт обратную связь от университетской библиотеки и слушателей.
Разработчики полагают, что перевести в аудиоформат порядка 7 тыс. книг можно за месяц. Однако на проверку результата потребуется не менее года. В будущем они планируют масштабировать свой проект на другие электронные библиотеки.