Исследователи Новосибирского государственного университета (НГУ) запустили сервис по автоматическому созданию аудиоверсий книг из оцифрованного фонда библиотеки вуза. Проект создан на базе разработок Исследовательского центра искусственного интеллекта (Центра ИИ) НГУ, рассказали в пресс-службе образовательного учреждения.

Текст извлекается из pdf-файла, проходит обработку и озвучивается нейросетью. В вузе планируют перевести в аудиоформат порядка 7 тыс. изданий из электронной библиотеки.

  Для массового использования важно, что решение не является ресурсоемким: на одну книгу уходит примерно полчаса процессорного времени, причем речь о 16-ядерном процессоре, даже без видеокарты.
Евгений Павловский, ведущий научный сотрудник Центра искусственного интеллекта НГУ

ИИ-сервис построен на базе фреймворка «Каппа» (разработка Центра ИИ НГУ). С его помощью можно управлять датасетами (набор данных) и ИИ-моделями. Фреймворк проверяет корректность работы моделей и снижает риск ошибок.

В рамках пилотного режима были озучены 100 книг. Команда проекта ждёт обратную связь от университетской библиотеки и слушателей.

Разработчики полагают, что перевести в аудиоформат порядка 7 тыс. книг можно за месяц. Однако на проверку результата потребуется не менее года. В будущем они планируют масштабировать свой проект на другие электронные библиотеки.

Читайте ещё материалы по теме:

Источники
НГУ

Сейчас на главной