27 февраля 2024, 13:10   726

ВТБ: к 2027 году каждое третье онлайн-совещание будет расшифровываться при помощи ИИ-алгоритмов

В режиме записи будут преобразовываться из речи в текст более 95 % всех онлайн-встреч, в которых принимают участие свыше трех человек. В режиме реального времени, при помощи алгоритмов искусственного интеллекта онлайн-совещания будут преобразовываться в текстовую расшифровку, прогнозируют аналитики ВТБ.

ВТБ: к 2027 году каждое третье онлайн-совещание будет расшифровываться при помощи ИИ-алгоритмов

«Сейчас из всех онлайн-совещаний в реальном времени расшифровывается не более 1 % онлайн-конференций и до 10 % в записи. Всю аудиторию сервисов видеоконференцсвязи (ВКС) мы оцениваем в 20 млн пользователей в РФ. Из них регулярно функцией преобразования речи в текст пользуется порядка 1 % аудитории. К 2027 году, мы прогнозируем, этот показатель вырастет до 10 % всех пользователей сервисов видеоконференций. Он может вырасти и до 20 % — но в случае развития не только сервисов транскрибации, но в целом сегмента цифровых ассистентов», — отмечает Вадим Кулик, заместитель президента – председателя правления банка ВТБ.

Инструмент преобразования речи в текст (speech-to-text) работает на базе алгоритмов искусственного интеллекта и сегодня доступен сотрудникам ВТБ при использовании видеохостинга DION Видео, элемента платформы унифицированных коммуникаций DION, которая используется в банке с 2022 года.

Все, что говорят участники видеовстречи, алгоритм преобразовывает в разбитые на реплики письменные сообщения. Для реализации этого решения использовались модели, созданные ИТ-специалистами департамента анализа данных и моделирования банка ВТБ. Эти модели постоянно совершенствуются. Например, сейчас на их основе тестируется функция саммаризации, когда пользователи могут получить краткое изложение прошедшей онлайн-конференции. А в дальнейшем появится функция автопротоколирования — автоматически генерируемого по итогам онлайн-встречи перечня поручений.

Вадим Кулик также отметил, что развитие алгоритмов генеративных моделей, их апробация в используемых в банке сервисах — это то, на что ВТБ сейчас активно смотрит. В целом направлению искусственного интеллекта уделено отдельное внимание в стратегии развития банка до 2026 года. Кроме того, ВТБ ведет большую работу по совершенствованию внутренних сервисов, которыми пользуются сотрудники. Это также является одним из элементов стратегии.

Сегодня в ВТБ выстроена единая внутренняя платформа для безопасных коммуникаций, в ее основе — решение от российской UC-платформы DION. Один из ее ключевых компонентов — видеохостинг DION Видео. Именно для этого решения была реализована интеграция инструмента speech-to-text.

По оценке аналитиков ВТБ, компания со штатом в 10 тыс. человек может сэкономить до 7,5 тыс. часов в год, если вместо расшифровки онлайн-совещаний вручную будут использоваться нейросетевые алгоритмы.

ВТБ видит большой потенциал в использовании генеративных моделей для развития вспомогательных сервисов: голосовых помощников, цифровых ассистентов и др. Банк планирует и дальше изучать возможности их внедрения в своей инфраструктуре, тем более, что и сами генеративные модели будут работать все результативнее при меньшем объеме затрачиваемых ресурсов.

DION Видео — UGC (user generated content)-платформа по работе с аудио- и видеоконтентом: позволяет создавать, хранить, редактировать файлы, а также обмениваться ими между пользователями и комментировать. DION Видео составляет часть платформы корпоративных коммуникаций DION, внедренной в банке (продукт технологического партнера банка, холдинга Т1).
Все новости компаний