ИИ-сервис для создания аудиокниг разработали в НГУ

Нейросеть озвучивает тексты из электронной библиотеки вуза

Исследователи Новосибирского государственного университета (НГУ) запустили сервис по автоматическому созданию аудиоверсий книг из оцифрованного фонда библиотеки вуза. Проект создан на базе разработок Исследовательского центра искусственного интеллекта (Центра ИИ) НГУ, рассказали в пресс-службе образовательного учреждения.

Текст извлекается из pdf-файла, проходит обработку и озвучивается нейросетью. В вузе планируют перевести в аудиоформат порядка 7 тыс. изданий из электронной библиотеки.

  Для массового использования важно, что решение не является ресурсоемким: на одну книгу уходит примерно полчаса процессорного времени, причем речь о 16-ядерном процессоре, даже без видеокарты.
Евгений Павловский, ведущий научный сотрудник Центра искусственного интеллекта НГУ

ИИ-сервис построен на базе фреймворка «Каппа» (разработка Центра ИИ НГУ). С его помощью можно управлять датасетами (набор данных) и ИИ-моделями. Фреймворк проверяет корректность работы моделей и снижает риск ошибок.

В рамках пилотного режима были озучены 100 книг. Команда проекта ждёт обратную связь от университетской библиотеки и слушателей.

Разработчики полагают, что перевести в аудиоформат порядка 7 тыс. книг можно за месяц. Однако на проверку результата потребуется не менее года. В будущем они планируют масштабировать свой проект на другие электронные библиотеки.

Читайте ещё материалы по теме: