Новые алгоритмы ИИ «VK Видео» сделали субтитры точнее на четверть
На 25 % выросла точность анализа и расшифровки речи в сервисе «VK Видео». Платформа запустила новые алгоритмы искусственного интеллекта, призванные выполнять автоматическое распознавание речи и создавать субтитры в клипах, шоу, роликах и другом видеоматериале. Качество субтитров повысилось, в том числе и потому, что нейросети быстро учатся, осваивая тысячи новых слов, среди которых немало профессиональных терминов, имен собственных, мемов и акронимов (аббревиатур).
Генерируются автоматические субтитры с помощью ML-моделей – они создают текст, расставляя в нем знаки препинания и синхронизируя его с видео. Аудиопоток обрабатывается в несколько этапов, что повышает точность распознавания. Нейросеть очищает видео от посторонних шумов, распознает речь и превращает услышанное в текст.
Далее вступают в дело модели пунктуации и денормализации: они переделывают набор распознанных слов в грамотный и хорошо воспринимаемый текст. Затем ИИ синхронизирует его с аудиодорожкой.
Скоро искусственный интеллект научится разделять на отдельные реплики речь разных спикеров, что также будет способствовать улучшению качества субтитров.
Технология субтитров популярна у тех, кто пользуется «VK Видео». Среди них есть люди с нарушением слуха, а также те, кто смотрит видео без звука по определенным причинам. За последний месяц доля тех, кто использует функцию в веб-версии, выросла на 28 %. Тем самым из числа всей аудитории «VK Видео» субтитры включают 11 % людей.
Источник: CNews
Читайте также:
Лингвисты разобрались, как субтитры влияют на понимание видео на иностранном языке
Фото из открытых источников При изучении иностранного языка часто применяют метод развития...
ИИ улучшает мониторинг болезни Паркинсона
Фото из открытых источников Ученые из University of Florida разработали технологию обработки видео...
В РФ разработан нейроимплант, позволяющий незрячим читать текст
Фото из открытых источников Согласно сообщению ТАСС, в России разработан новый нейроимплант под...
NEJM: мозговой имплант вернул речь больному БАС
Фото из открытых источников Интерфейсы мозг-компьютер предоставляют возможность коммуникации для...
Ютуб не работает 17 октября: зафиксированы сбои в работе сервиса
Ютуб новости видео Самые частые проблемы: Сайт (913%) Видео (7%) Вход (0%) Почему не работает Ютуб...
Названы 20 сервисов для работы с текстом в 2024 году
Фото из открытых источников Создание качественных текстов требует объемной работы. Копирайтеры,...
Основные правила написания SEO-текстов
Оптимизация текста — это включение и повторение ключевых слов на странице сайта. СЕО оптимизация...
Arena объявила о сотрудничестве с AMD
Компания Arena, разработчик специализированных базовых моделей искусственного интеллекта, объявила...
Как сделать эффективную видеопрезентацию для интернет-магазина
Как сделать эффективную видеопрезентацию для интернет-магазина Видеопрезентация – это мощный...
Ютуб не работает: зафиксированы сбои в работе сервиса
Ютуб новости видео Самые частые проблемы: Сайт (83%) Видео (12%) Вход (3%) Почему не работает Ютуб...
Таргетированная реклама в TikTok
Площадка с короткими видео крайне быстро набрала огромную популярность как у подростков, так и у...
ArXiv: создан ИИ-переводчик с собачьего лая на человеческий язык
Фото из открытых источников Новый инструмент искусственного интеллекта от ученых из University of...