Preview

Информатика

Расширенный поиск

Фанетычная мінімізацыя корпуса тэкстаў на беларускай мове для навучання сістэмы сінтэзу маўлення

Аннотация

Большасць сучасных сістэм сінтэзу маўлення базіруюць сваю працу на корпусным метадзе. Корпусны метад, у адрозненні ад папулярнага раней кампіляцыйнага, выкарыстоўвае базу дадзеных натуральнага маўлення, якая складаецца не з асобных спецыяльна выбраных элементаў кампіляцыі, а ўяўляе сабой корпус фанаграм натуральнага маўлення. Для дасягнення высокай якасці сінтэзаванага маўлення пры такім падыходзе патрабуюцца вялікія аб’ѐмы тэкставай і адпаведнай гукавой інфармацыі, што з’яўляецца істотнай праблемай для так званых нерэсурсных моў, да якіх адносіцца і беларуская. У такім выпадку, як правіла, прымяняецца фанетычная мінімізацыя – адмысловы адбор тэкстаў, у выніку якога аб’ѐм тэкставага корпуса максімальна змяншаецца, але пры гэтым захоўваецца фанетычная паўната. У артыкуле разглядаюцца звесткі пра сутнасць і спосаб працы корпуснага метаду генерацыі гукавога сігналу ў сістэмах сінтэзу маўлення, прыводзіцца падрабязны агляд падыходаў да фарміравання тэкставых і маўленчых карпусоў, неабходных для генерацыі маўлення корпусным метадам. Другая палова працы прысвечана апісанню распрацаванага алгарытму фанетычнай мінімізацыі корпуса тэкстаў на беларускай мове, а таксама тэхнічных і лінгвістычных рэсурсаў, выкарыстаных для яго рэалізацыі. Прыводзяцца апісанні распрацаванага праграмнага прататыпа і шэрагу праведзеных аўтарам эксперыментаў па фанетычнай мінімізацыі.

Об авторе

С. I. Лысы
Аб’яднаны інстытут праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі, Мінск
Беларусь
малодшы навуковы супрацоўнік


Список литературы

1. Safarik, R. Unified approach to development of ASR systems for east slavic languages / R. Safarik,

2. J. Nouza; ed. N. Camelin, Y. Estève, C. Martín-Vide // Proc. of 5th Intern. Conf. «Statistical Language and Speech Processing» (SLSP’2017), Le Mans, France, 23–25 Oct. 2017. – Springer, 2017. – P. 193–203.

3. Гецэвіч, Ю. С. Аўтаматызаваная апрацоўка сімвальных выразаў у тэкстах для сістэмы сінтэзу беларускага маўлення / Ю. С. Гецэвіч // Информатика. – 2011. – № 4(32). – С. 82–93.

4. Лысы, С. І. Генерацыя нацыянальнай транскрыпцыі тэкстаў на беларускай мове / С. І. Лысы, Ю. С. Гецэвіч // Информатика. – 2017. – № 2(54). – C. 84–92.

5. Hunt, A. Unit selection in a concatenative speech synthesis system using a large speech database / A. Hunt, A. Black // Proc. of IEEE Intern. Conf. «Acoustic, Speech and Signal Processing» (ICASSP’96), Atlanta, USA, 7–10 May 1996. – Atlanta, 1996. – Vol. 1. – P. 373–376.

6. Лобанов, Б. М. Компьютерный синтез и клонирование речи / Б. М. Лобанов, Л. И. Цирульник // Минск : Беларус. навука, 2008. – 344 с.

7. Segment selection in the L&H Realspeak laboratory TTS system / G. Coorman [et. al.] // Proc. of 6th Intern. Conf. «Spoken Language Processing» (ICSLP’2000), Beijing, China, 16–20 Oct. 2000. – Beijing, 2000. – Vol. 2. – P. 395–398.

8. Godfrey, J. Language Resources / J. Godfrey, A. Zampolli // Survey of the State of the Art in Human Language Technology. – Cambrige University Press, 1996. – Ch. 12. – P. 357–384.

9. Zinovieva, N. Phonetically sufficient allophonic database for concatenation synthesis of russian speech / N. Zinovieva // Proc. of the 13th Section «Intern. Congress of Phonetic Sciences» (ICPhS’95), Stockholm, Sweden, 13–19 Aug. 1995. – Stockholm, 1995. – Vol. 2. – P. 358–361.

10. Fotinea, S.-E. Constructing a segment database for greek time domain speech synthesis / S.-E. Fotinea, G. Tambouratzis, G. Carayannis // Proc. of 7th European Conf. «Speech Communication and Technology» (EUROSPEECH’2001), Aalborg, Denmark, 3–7 Sept. 2001. – Aalborg, 2001. – Vol. 3. – P. 2075–2078.

11. Lambert, T. A database design for a TTS synthesis system using lexical diphones / T. Lambert, A. Breen // Proc. of 9th European Conf. «Speech Communication and Technology» (InterSpeech’2004), Jeju Island, Korea, 4–8 Oct. 2004. – Jeju Island, 2004. – P. 1381–1384.

12. Lyudovyk, T. Speech databases used for concatenative speech synthesis / T. Lyudovyk, M. Sazhok // Proc. of 7th All-Ukrainian Intern. Conf. on Signal/Image Processing and Pattern Recognition (UkrObraz’2004). – Kyjiv, 2004. – P. 111–114.

13. Закревский, А. Д. Основы логического проектирования / А. Д. Закревский, Ю. В. Поттосин, Л. Д. Черемисинова. – Минск : ОИПИ НАН Беларуси, 2004. – Кн. 1. Комбинаторные алгоритмы дискретной математики. – 226 с.

14. Introduction to Algorithms / T. H. Cormen [et. al.]. – 3rd ed. – Cambridge : The MIT Press, 2009. – 1292 p.

15. Hue, X. Genetic algorithms for optimization / X. Hue. – Edinburgh : Edinburgh Parallel Computing Centre Press, 1997. – 276 p.

16. Matoušek, J. ARTIC: A new Czech text-to-speech system using statistical approach to speech segment database construction / J. Matoušek, J. Psutka // Proc. of the 6th Intern. Conf. on Spoken Language Processing (ICSLP’2000), Beijing, China, 16–20 Oct. 2000. – Beijing, 2000. – Vol. 4. – P. 612–615.

17. Barbot, N. Comparing performance of different set-covering strategies for linguistic content optimization in speech corpora / N. Barbot, O. Boeffard, A. Delhay // Proc. of the Intern. Conf. on Language Resources and Evaluation (LREC’12). – Istanbul, 2012. – P. 969–974.

18. Development of syllable-based text to speech synthesis system in Bengali / N. P. Narendra [et. al.]. // Intern. J. of Speech Technology. – 2011. – No. 14(3). – P. 167–181.

19. Kayte, S. A review of unit selection speech synthesis / S. Kayte, M. Mundada, C. Kayte // Intern. J. of Advanced Research in Computer Science and Software Engineering. – 2015. – No. 5(10). – P. 475–479.

20. Corpus and voices for catalan speech synthesis / A. Bonafonte [et. al.] // Proc. of the Intern. Conf. on Language Resources and Evaluation (LREC’2008), Marrakech, Morocco, 26 May–1 June 2008. – Marrakech, 2008. – P. 3325–3329.

21. Casademont, E. G. Building synthetic voices in the META-NET framework / E. G. Casademont, A. Bonafonte, M. Moreno // Proc. of the 8th Intern. Conf. on Language Resources and Evaluation (LREC’12), Istanbul, Turkey, 21–27 May 2012. – Istanbul, 2012. – P. 3322–3326.


Рецензия

Для цитирования:


Лысы С.I. Фанетычная мінімізацыя корпуса тэкстаў на беларускай мове для навучання сістэмы сінтэзу маўлення. Информатика. 2019;16(1):75-85.

For citation:


Lysy S.I. Phonetic minimization of the text corpus in Belarusian for the speech synthesis system training. Informatics. 2019;16(1):75-85. (In Russ.)

Просмотров: 692


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)