References

inform

Информатика

Informatics

1816-03012617-6963

UIIP NASB

inform-597

Research Article

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ

SIGNAL, IMAGE, SPEECH, TEXT PROCESSING AND PATTERN RECOGNITION

СИСТЕМА АУДИОВИЗУАЛЬНОГО СИНТЕЗА РУССКОЙ РЕЧИ

Лобанов

Б. М.

Цирульник

Л. И.

Железны

М.

Крноул

З.

Ронжин

А.

Карпов

А.

Объединенный институт проблем информатики НАН БеларусиBelarusUniversity of West Bohemia in PilsenCzech RepublicСанкт-Петербургский институт информатики и автоматизации РАНRussian Federation

2008

09112018

04(20)6778

2018

Лобанов Б.М., Цирульник Л.И., Железны М., Крноул З., Ронжин А., Карпов А.

Данная работа распространяется под лицензией Creative Commons Attribution 4.0.

This work is licensed under a Creative Commons Attribution 4.0 License.

https://inf.grid.by/jour/article/view/597

Описываются имитационная и компиляционная модели аудиовизуального синтеза русской речи и созданный на их основе аудиовизуальный синтезатор речи. Рассматриваются преимущества и недостатки каждой из моделей, а также особенности их построения для русской речи.

References1

Issues in Visual and Audio-Visual Speech Processing. – Cambridge : MIT Press, 2004. – 478 p.

Tekalp, A.M. Face and 2-D Mesh Animation in MPEG-4 / A.M. Tekalp, J. Ostermann // Signal Processing: Image Communication, Special Issue on MPEG-4. – 2000. – Vol. 15. – P. 387–421.

Animated Talking Head with Personalized 3D Head Model / L.S. Chen [et al.] // IEEE First Workshop on Multimedia Signal Processing. – 1997. – P. 274–279.

Video Rewrite: Driving Visual Speech with Audio / C. Bregler [et al.] // Proc. of 24 Int. conf. on Computer Graphics and Interactive Techniques «DIGGRAPH97». – Los Angeles, USA, 1997. – P. 353–360.

Cosatto, E. Photo-Realistic Talking-Heads from Image Samples / E. Cosatto, H.P. Graf // IEEE Transactions on Multimedia. – Sept. 2000. – Vol. 2. – P. 152–163.

Лобанов, Б.М. Компьютерное клонирование персонального голоса и речи / Б.М. Лобанов // Новости искусственного интеллекта. – 2002. – № 5(55). – С. 35–39.

Lobanov, B. TTS-Synthesizer as a Computer Means for Personal Voice Cloning (On the example of Russian) / B. Lobanov, H. Karnevskaya // Phonetics and its Applications. – Stuttgart : Steiner, 2002. – P. 445–452.

Лобанов, Б.М. Персональные особенности синтагматического членения речи телеведущего Ю. Сенкевича / Б.М. Лобанов, Л.И. Цирульник // Тр. Междунар. конф. «Диалог-2004». – М. : Наука, 2004. – C. 419–423.

Lobanov, B. Phonetic-Acoustical Problems of Personal Voice Cloning by TTS / B. Lobanov, L. Tsirulnik // Proc. of 9th Int. conf. «Speech and Computer» (SPECOM’2004). – SPb. : Anatolia, 2004. – P. 17–21.

Embodied Conversational Agents / Eds. : J. Cassell, J. Sullivan, S. Prevost, E. Churchill. – Cambridge : MIT Press, 2000. – 420 p.

Лобанов, Б.М. Микроволновой синтез речи по тексту / Б.М. Лобанов // Анализ и синтез речи : сб. науч. тр. – Минск : Ин-т техн. кибернетики АН БССР, 1991. – С. 21-38.

Lobanov, B. МW-Speech Synthesis from Text / B. Lobanov // Proc. of the XII International Congress of Phonetic Sciences ICPhS’91. – Aix-en-Provense, France, 1991. – P. 128–132.

Lobanov, B. Development of Multi-Voice and Multi-Language TTS Synthesizer (languages: Belarussian, Polish, Russian) / B. Lobanov, L. Tsirulnik // Proc. of 11th Int. conf. «Speech and Computer» (SPECOM’2006). – SPb. : Anatolia, 2006. – P. 274–283.

Лобанов, Б.М. Компьютерный синтез и клонирование речи / Б.М. Лобанов, Л.И. Цирульник. – Минск : Белорусская наука, 2008. – 344 с.

Porter, Th. Compositing Digital Images / Th. Porter, T. Duff // Computer Graphics. – July 1984. – № 18(3). – P. 253–259.

Design, Implementation and Evaluation of the Czech Realistic Audio-Visual Speech Synthesis / M. Železný [et al.] // Signal Processing. – 2006. – № 86. – V. 12. – P. 3657–3673.

Krňoul Z. Innovations in Czech Audio-Visual Speech Synthesis for Precise Articulation / Z. Krňoul, M. Železný // Proc. of the workshop on Audio-Visual Speech Processing. – 2007. – P. 172–175.

The authors declare that there are no conflicts of interest present.