Preview

Информатика

Расширенный поиск

ПРИМЕНЕНИЕ МГНОВЕННОГО ГАРМОНИЧЕСКОГО АНАЛИЗА ДЛЯ АНТРОПОМОРФИЧЕСКОЙ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ

Аннотация

Рассматривается способ параметрического описания звукового сигнала, основанный на антропоморфической интерпретации его частотных составляющих. Для получения параметров модели предлагается использовать мгновенный гармонический анализ вместо дискретного преобразования Фурье. В работе оценивается точность полученного описания. Приводятся экспериментальные результаты, показывающие, что реконструкция сигнала в большой степени зависит от средств получения частотно-временного описания, причем предложенный способ обеспечивает более высокое качество реконструкции сигнала по сравнению с известными методами.

Об авторах

Д. С. Лихачев
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


И. С. Азаров
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


А. А. Петровский
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


Список литературы

1. Morgan, N. Does ASR have a PHD, or is it just piled higher and deeper? / N. Morgan [Electronic resource]. – Mode of access : http://superlectures.com/icassp2011/lecture.php?id=206&lang=en. – Date of access : 21.10.2011.

2. A Perceptual Model for Sinusoidal Audio Coding Based on Spectral Integration / S. van de Par [et. al.] // EURASIP Journal on Applied Signal Processing. – 2005. – Vol. 2005, № 9. – P. 1292–1304.

3. Ravindran, S. A Physiologically Inspired Method for Audio Classification / S. Ravindran,

4. K. Chlemmer, D.V. Anderson // EURASIP Journal on Applied Signal Processing. – 2005. –

5. Vol. 2005, № 9. – P. 1374–1381.

6. Feldbauer, C. Anthropomorphic Coding of Speech and Audio: A Model Inversion Approach / C. Feldbauer, G. Kubin, W.B. Kleijn // EURASIP Journal on Applied Signal Processing. – 2005. – Vol. 2005, № 9. – P. 1334–1349.

7. Ghitza, O. Auditory Models and Human Performance in Tasks Related to Speech Coding and Speech Recognition / O. Ghitza // IEEE Transactions on Speech and Audio Processing. – 1994. – Vol. 2, № 1. – P. 115–132.

8. Ivanov, A.V. Analysis of the IHC Adaptation for the Anthropomorphic Speech Processing

9. Systems / A.V. Ivanov, A.A. Petrovsky // EURASIP Journal on Applied Signal Processing. – 2005. – Vol. 2005, № 9. – P. 1323–1333.

10. Лихачев, Д.С. Анализ и синтез устройств кодирования речевого сигнала на основе ан

11. тропоморфической обработки и синусоидальных моделей / Д.С. Лихачев, А.А. Петровский // Доклады БГУИР. – 2006. – № 3 (15). – C. 35–43.

12. Слуховая система / Я.А. Альтман [и др.] ; под общ. ред. Я.А. Альтмана. – Л. : Наука,

13. – 620 с.

14. Likhachov, D.S. Improved auditory-based speech coding using psychoacoustic model based on a cochlear filter bank and an average localized synchrony detection / D.S. Likhachov, A.A. Petrovsky // Computer information systems and industrial management applications ; eds. K. Saeed, R. Mosdorf, Z. Sosnowski. – Poland : Bialystok, 2003. – P. 11–19.

15. Лихачев, Д.С. Компрессия речевого сигнала на основе синусоидальной модели с ан-

16. тропоморфической обработкой / Д.С. Лихачев, А.А. Петровский // Анализаторы речевых и звуковых сигналов: методы, алгоритмы и практика (с MATLAB-примерами) ; под ред. д.т.н. профессора А.А. Петровского. – Минск : Бестпринт, 2009. – С. 211–233.

17. Азаров, И.С. Вычисление мгновенных гармонических параметров речевого сигнала / И.С. Азаров, А.А. Петровский // Речевые технологии. – 2008. – № 1 (1). – C. 67–77

18. Ghitza, O. Adequacy of auditory models to predict internal human representation of speech sounds / O. Ghitza // J. Acoust. Soc. Am. – 1993. – Vol. 93, № 4. – P. 2160–2171.

19. An anthropomorphic speech processing based on the cochlear model and its application for coding task / A.A. Petrovsky [et al.] // International scientific journal of computing. – 2004. – Vol. 3, № 1. – P. 75–83.

20. Wan, W.G. A two-dimentional non-linear cochlear model for speech processing: response to pure tones / W.G. Wan, A.A. Petrovsky, C.X. Fan // 6th Intern. Fase-Congress. – Zurich, Switzerland, 1992. – P. 233–236.

21. Wan, W.G. A new solution for cochlear macromechanics / W.G. Wan, C.X. Fan // Acustica. –

22. – Vol. 75. – P. 79–82.

23. Greenwood, D.D. A cochlear frequency-position function for several species-29 years later / D.D. Greenwood // J. Acoust. Soc. Am. – 1990. – Vol. 87, № 6. – P. 2592–2605.

24. Petrovsky, A.A. A digital cochlear model as a base of anthropomorphic speech processing / A.A. Petrovsky, D.S. Likhachov // Neural networks and artificial intelligence : proc. of the 3d Intern. Conf., Belarus, Minsk, November 12–14, 2003. – Minsk, 2003. – P. 126–131.

25. Лихачев, Д.С. Антропоморфический анализ на основе дискретного преобразования

26. Фурье с неравномерной частотной шкалой / Д.С. Лихачев // Известия Белорусской инженерной академии. – 2005. – № 1 (19)/2. – С. 177–180.

27. McAulay, R.J. Low-rate speech coding based on the sinusoidal model / R.J. McAulay,

28. T.F. Quatieri // Advances in Speech Signal Processing ; eds. S. Furui, M.M. Sondhi. – N.Y. : Marcel Dekker, 1992. – P. 165–208.

29. McAulay, R.J. Speech analysis/synthesis based on a sinusoidal representation / R.J. McAulay, T.F. Quatieri // IEEE Trans. on Acoust., Speech and Signal Processing. – 1986. – Vol. ASSP-34. – P. 744–754.

30. Азаров, И.С. Непрерывное и дискретное гармонические преобразования для декомпозиции речевого сигнала на периодическую и шумовую компоненты / И.С. Азаров, А.А. Петровский // Доклады БГУИР. – 2008. – № 4 (34). – C. 92–105.

31. Petrovsky, A. Combining advanced sinusoidal and waveform matching models for parametric audio/speech coding / A. Petrovsky, E. Azarov, A. Petrovsky // EUSIPCO 2009 : proc. of the 17th European Signal Processing Conf. – Glasgow, 2009. – P. 436–440.

32. ITU-T Recommendation P.862, PESQ an objective method for end-to-end speech quality

33. assessment of narrowband telephone networks and speech codecs, February 2001.

34. Yang, W. Enhanced Modified Bark Spectral Distortion (EMBSD): an Objective Speech

35. Quality Measure Based on Audible Distortion and Cognition Model (PhD Thesis) / W. Yang [Electronic resource]. – Mode of access : http://www.temple.edu/speech_lab/wonhos_dissertation.pdf. –

36. Date of access : 21.10.2011.


Рецензия

Для цитирования:


Лихачев Д.С., Азаров И.С., Петровский А.А. ПРИМЕНЕНИЕ МГНОВЕННОГО ГАРМОНИЧЕСКОГО АНАЛИЗА ДЛЯ АНТРОПОМОРФИЧЕСКОЙ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ. Информатика. 2011;(4(32)):59-70.

Просмотров: 557


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)