VK Видео внедрил новые алгоритмы искусственного интеллекта для улучшения распознавания речи и автоматической генерации субтитров. Точность распознавания речи возросла на 25%, и теперь нейросети распознают тысячи новых слов, включая популярные мемы, имена собственные, акронимы и специализированные термины.
Автоматические субтитры создаются с использованием машинного обучения, что позволяет не только преобразовывать речь в текст, но и правильно расставлять знаки препинания и синхронизировать текст с видео. Система проходит несколько этапов обработки: удаляет посторонние шумы, преобразует речь в текст, а затем модели пунктуации и денормализации превращают его в удобный для чтения формат.
В ближайшем будущем ИИ также сможет разделять речь разных спикеров, что сделает субтитры ещё более удобными для восприятия. Эта функция становится всё более популярной среди пользователей VK Видео, особенно среди людей с нарушениями слуха и тех, кто смотрит видео в условиях, где не может включить звук.
За последний месяц доля пользователей, использующих субтитры в веб-версии VK Видео, выросла на 28%, и сейчас этой функцией пользуются 11% всей аудитории платформы.
Читать материалы по теме:
Зритель управляет блогером: VK Видео первой в России запустила интерактивный контент
У VK Видео появилось обновление для планшетов на Android
VK официально запустила платформу «VK Видео»: смотреть видео можно и без регистрации