Preview

Информатика

Расширенный поиск

СИСТЕМА АУДИОВИЗУАЛЬНОГО СИНТЕЗА РУССКОЙ РЕЧИ

Полный текст:

Аннотация

Описываются имитационная и компиляционная модели аудиовизуального синтеза русской речи и созданный на их основе аудиовизуальный синтезатор речи. Рассматриваются преимущества и недостатки каждой из моделей, а также особенности их построения для русской речи.

Об авторах

Б. М. Лобанов
Объединенный институт проблем информатики НАН Беларуси
Беларусь


Л. И. Цирульник
Объединенный институт проблем информатики НАН Беларуси
Беларусь


М. Железны
University of West Bohemia in Pilsen
Чехия


З. Крноул
University of West Bohemia in Pilsen
Чехия


А. Ронжин
Санкт-Петербургский институт информатики и автоматизации РАН
Россия


А. Карпов
Санкт-Петербургский институт информатики и автоматизации РАН
Россия


Список литературы

1. Issues in Visual and Audio-Visual Speech Processing. – Cambridge : MIT Press, 2004. – 478 p.

2. Tekalp, A.M. Face and 2-D Mesh Animation in MPEG-4 / A.M. Tekalp, J. Ostermann // Signal Processing: Image Communication, Special Issue on MPEG-4. – 2000. – Vol. 15. – P. 387–421.

3. Animated Talking Head with Personalized 3D Head Model / L.S. Chen [et al.] // IEEE First Workshop on Multimedia Signal Processing. – 1997. – P. 274–279.

4. Video Rewrite: Driving Visual Speech with Audio / C. Bregler [et al.] // Proc. of 24 Int. conf. on Computer Graphics and Interactive Techniques «DIGGRAPH97». – Los Angeles, USA, 1997. – P. 353–360.

5. Cosatto, E. Photo-Realistic Talking-Heads from Image Samples / E. Cosatto, H.P. Graf // IEEE Transactions on Multimedia. – Sept. 2000. – Vol. 2. – P. 152–163.

6. Лобанов, Б.М. Компьютерное клонирование персонального голоса и речи / Б.М. Лобанов // Новости искусственного интеллекта. – 2002. – № 5(55). – С. 35–39.

7. Lobanov, B. TTS-Synthesizer as a Computer Means for Personal Voice Cloning (On the example of Russian) / B. Lobanov, H. Karnevskaya // Phonetics and its Applications. – Stuttgart : Steiner, 2002. – P. 445–452.

8. Лобанов, Б.М. Персональные особенности синтагматического членения речи телеведущего Ю. Сенкевича / Б.М. Лобанов, Л.И. Цирульник // Тр. Междунар. конф. «Диалог-2004». – М. : Наука, 2004. – C. 419–423.

9. Lobanov, B. Phonetic-Acoustical Problems of Personal Voice Cloning by TTS / B. Lobanov, L. Tsirulnik // Proc. of 9th Int. conf. «Speech and Computer» (SPECOM’2004). – SPb. : Anatolia, 2004. – P. 17–21.

10. Embodied Conversational Agents / Eds. : J. Cassell, J. Sullivan, S. Prevost, E. Churchill. – Cambridge : MIT Press, 2000. – 420 p.

11. Лобанов, Б.М. Микроволновой синтез речи по тексту / Б.М. Лобанов // Анализ и синтез речи : сб. науч. тр. – Минск : Ин-т техн. кибернетики АН БССР, 1991. – С. 21-38.

12. Lobanov, B. МW-Speech Synthesis from Text / B. Lobanov // Proc. of the XII International Congress of Phonetic Sciences ICPhS’91. – Aix-en-Provense, France, 1991. – P. 128–132.

13. Lobanov, B. Development of Multi-Voice and Multi-Language TTS Synthesizer (languages: Belarussian, Polish, Russian) / B. Lobanov, L. Tsirulnik // Proc. of 11th Int. conf. «Speech and Computer» (SPECOM’2006). – SPb. : Anatolia, 2006. – P. 274–283.

14. Лобанов, Б.М. Компьютерный синтез и клонирование речи / Б.М. Лобанов, Л.И. Цирульник. – Минск : Белорусская наука, 2008. – 344 с.

15. Porter, Th. Compositing Digital Images / Th. Porter, T. Duff // Computer Graphics. – July 1984. – № 18(3). – P. 253–259.

16. Design, Implementation and Evaluation of the Czech Realistic Audio-Visual Speech Synthesis / M. Železný [et al.] // Signal Processing. – 2006. – № 86. – V. 12. – P. 3657–3673.

17. Krňoul Z. Innovations in Czech Audio-Visual Speech Synthesis for Precise Articulation / Z. Krňoul, M. Železný // Proc. of the workshop on Audio-Visual Speech Processing. – 2007. – P. 172–175.


Для цитирования:


Лобанов Б.М., Цирульник Л.И., Железны М., Крноул З., Ронжин А., Карпов А. СИСТЕМА АУДИОВИЗУАЛЬНОГО СИНТЕЗА РУССКОЙ РЕЧИ. Информатика. 2008;(4(20)):67-78.

For citation:


., ., ., ., ., . . Informatics. 2008;(4(20)):67-78. (In Russ.)

Просмотров: 51


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)