426067, г. Ижевск, ул. им. Татьяны Барамзиной, 34
Версия для незрячих
  1. УдмФИЦ УрО РАН
  2. Пресс-центр
  3. Новости
  4. Новости
  5. Ученые УдмФИЦ УрО РАН разработали синтезатор удмуртской речи

Ученые УдмФИЦ УрО РАН разработали синтезатор удмуртской речи

Ноябрь 9, 2021

Специалистами Удмуртского федерального исследовательского центра Уральского отделения Российской академии наук (УдмФИЦ УрО РАН) разработан синтезатор удмуртской речи, позволяющий преобразовывать любой печатный текст на удмуртском языке в стандартный звуковой файл, который можно прослушать на компьютере, телефоне, смартфоне или любом другом подобном цифровом устройстве.

Эта работа стала результатом взаимодействия ученых двух научных подразделений УдмФИЦ УрО РАН: лингвистов Удмуртского института истории, языка и литературы и специалистов в области искусственного интеллекта Лаборатории машинного обучения и обработки «больших» данных производственных киберсистем.

Деятельность в данном направлении стала возможной благодаря разработанному учеными УдмФИЦ УрО РАН в 2019 году Национальному корпусу удмуртского языка, создающему условия для широкого использования удмуртского компьютерных технологий (распознаватели и синтезаторы речи, навигаторы, автоматические переводчики и т.д.).

Синтезатор удмуртской речи разработан на основе глубокой нейронной сети Tacotron. Для бучения нейросети были задействованы мощные ресурсы вычислительного кластера ИММ УрО РАН (Екатеринбург) и использованы специально подготовленные тексты, озвученные Светланой Пикулевой –профессиональной ведущей радио «Моя Удмуртия». Таким образом, удмуртская речь, сгенерированная синтезатором, воспроизводится сегодня голосом известной радиоведущей.

– Пока мы говорим только о первой версии синтезатора, – рассказывает младший научный сотрудник Лаборатории машинного обучения и обработки «больших» данных производственных киберсистем УдмФИЦ УрО РАН Григорий Григорьев. – Данная нейронная сеть проста и хорошо обучаема. Она выдает приемлемый результат, но возможно пока еще не такой совершенный и естественный. Например, по синтезированным нейронной сетью предложениям на удмуртском языке можно определить, что говорит не человек, а программа. В дальнейшем мы планируем использовать более совершенную нейронную сеть следующего поколения, которая сможет генерировать искусственный голос, неотличимый от голоса реального человека. В настоящее время ведется работа по интеграции обученной нейронной сети синтезатора удмуртской речи и сайта Национального корпуса удмуртского языка. Уже вскоре синтезатор должен появиться в открытом доступе.

– Мы надеемся, что данная разработка будет полезна и востребована не только в качестве самостоятельного приложения, но и как составная часть автоматических переводчиков с удмуртского языка, навигаторов, обучающих систем, голосовых помощников, – говорит заведующий лабораторией машинного обучения УдмФИЦ УрО РАН, доктор физико-математических наук Виктор Трубицын.

Уже сегодня синтезатор речи может быть полезен для слабовидящих людей, которые благодаря ему смогут слушать книги. Его можно использовать для обучения детей чтению на правильном литературном удмуртском языке.

В планах специалистов УдмФИЦ УрО РАН создание переводчика на основе нейросетей, программы речевого ввода, интеграция Национального корпуса удмуртского языка с интернет-переводчиками.

– Появление синтезатора речи – еще один шаг в развитии Национального корпуса удмуртского языка, – говорит руководитель Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН Игорь Леонидович Поздеев. – Безусловно, работа в этом направлении будет продолжена.

#Годнауки,#УдмФИЦУрОРАН,#МинобрнаукиРФ