Выделение речевой активности на фоне шумов при помощи компактной сверточной нейронной сети

Г. С. Вашкевич; И. С. Азаров

doi:10.37661/1816-0301-2020-17-2-36-43

Выделение речевой активности на фоне шумов при помощи компактной сверточной нейронной сети

Г. С. Вашкевич, И. С. Азаров

https://doi.org/10.37661/1816-0301-2020-17-2-36-43

Полный текст:

PDF (Rus) |

сгенерировать QR код

Аннотация

Исследуется задача выделения речевой активности из зашумленного звукового сигнала. Предлагается компактная модель сверточной нейронной сети, которая имеет всего 385 параметров. Модель нетребовательна к вычислительным ресурсам, что позволяет использовать ее в рамках концепции Интернета вещей для портативных устройств с низким энергопотреблением. В то же время эта модель обеспечивает высокую точность определения речевой активности на уровне лучших современных аналогов. Указанные полезные свойства достигаются путем применения специального сверточного слоя, учитывающего гармоническую структуру вокализованной речи и устраняющего избыточность модели за счет инвариантности к изменениям частоты основного тона. В рамках экспериментов производительность модели оценивалась в различных шумовых условиях для разных соотношений сигнала и шума. Результаты экспериментов показали, что предложенная модель обеспечивает более высокую точность определения речевой активности по сравнению с моделью, представленной компанией Google в фреймворке WebRTC.

Ключевые слова

детектор речевой активности, гармонический сигнал, сверточная нейронная сеть, частота основного тона, обработка речи

Для цитирования:

Вашкевич Г.С., Азаров И.С. Выделение речевой активности на фоне шумов при помощи компактной сверточной нейронной сети. Информатика. 2020;17(2):36-43. https://doi.org/10.37661/1816-0301-2020-17-2-36-43

For citation:

Vashkevich R.S., Azarov E.S. Voice activity detection in noisy conditions using tiny convolutional neural network. Informatics. 2020;17(2):36-43. (In Russ.) https://doi.org/10.37661/1816-0301-2020-17-2-36-43

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)

Информатика

Выделение речевой активности на фоне шумов при помощи компактной сверточной нейронной сети

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Логин
Пароль
	Запомнить меня

Войти

Информатика

Выделение речевой активности на фоне шумов при помощи компактной сверточной нейронной сети

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов