VK Видео улучшает распознавание речи: точность возросла на 25%, субтитры стали ещё умнее

Нейросети VK Видео распознают тысячи новых слов, включая мемы и акронимы

VK Видео внедрил новые алгоритмы искусственного интеллекта для улучшения распознавания речи и автоматической генерации субтитров. Точность распознавания речи возросла на 25%, и теперь нейросети распознают тысячи новых слов, включая популярные мемы, имена собственные, акронимы и специализированные термины.

Автоматические субтитры создаются с использованием машинного обучения, что позволяет не только преобразовывать речь в текст, но и правильно расставлять знаки препинания и синхронизировать текст с видео. Система проходит несколько этапов обработки: удаляет посторонние шумы, преобразует речь в текст, а затем модели пунктуации и денормализации превращают его в удобный для чтения формат.

В ближайшем будущем ИИ также сможет разделять речь разных спикеров, что сделает субтитры ещё более удобными для восприятия. Эта функция становится всё более популярной среди пользователей VK Видео, особенно среди людей с нарушениями слуха и тех, кто смотрит видео в условиях, где не может включить звук.

За последний месяц доля пользователей, использующих субтитры в веб-версии VK Видео, выросла на 28%, и сейчас этой функцией пользуются 11% всей аудитории платформы.

Читать материалы по теме:

Зритель управляет блогером: VK Видео первой в России запустила интерактивный контент

У VK Видео появилось обновление для планшетов на Android

VK официально запустила платформу «VK Видео»: смотреть видео можно и без регистрации

Этот сайт использует куки