ИИ «VK Видео» расширил словарный запас для точных субтитров
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews
Читайте также:
Новые алгоритмы ИИ «VK Видео» сделали субтитры точнее на четверть
На 25 % выросла точность анализа и расшифровки речи в сервисе «VK Видео». Платформа запустила...
Лингвисты разобрались, как субтитры влияют на понимание видео на иностранном языке
Фото из открытых источников При изучении иностранного языка часто применяют метод развития...
Основные правила написания SEO-текстов
Оптимизация текста — это включение и повторение ключевых слов на странице сайта. СЕО оптимизация...
В РФ разработан нейроимплант, позволяющий незрячим читать текст
Фото из открытых источников Согласно сообщению ТАСС, в России разработан новый нейроимплант под...
NEJM: мозговой имплант вернул речь больному БАС
Фото из открытых источников Интерфейсы мозг-компьютер предоставляют возможность коммуникации для...
Названы 20 сервисов для работы с текстом в 2024 году
Фото из открытых источников Создание качественных текстов требует объемной работы. Копирайтеры,...
Найденный 2500-летний тибетский текст в точности описывает коронавирус и его эпидемию
Текст возрастом 2500 лет, найденный в Тибете, описывает легочное заболевание и его возбудителя....
ИИ улучшает мониторинг болезни Паркинсона
Фото из открытых источников Ученые из University of Florida разработали технологию обработки видео...
Найден новый способ превратить текст в таблицу в «Р7-Офис»
Стало известно, как в текстовом редакторе «Р7-Офис» превратить текст в таблицу. Для преобразования...
Впервые в истории: текст «Тотального диктанта» экранизировали
Москва, 11.04.2021, 11:18:04, редакция ПРОНЕДРА.РУ, автор Светлана Леварова.Москва, 11.04.2021,...
Хабаровские ученые создали нейросеть для прогноза урожайности с/х культур
Фото из открытых источников В Хабаровске группа исследователей разработала инновационную нейросеть...
В России разработана нейросеть ReBased для ускоренной обработки длинных текстов
Фото из открытых источников Группа исследователей из лаборатории T-Bank AI Research достигла...