Preview

Informatics

Advanced search

SOME EXAMPLES OF APPLIED SYSTEMS WITH SPEECH INTERFACE

Abstract

Three examples of applied systems with a speech interface are considered in the article. The first two of these provide the end user with the opportunity to ask verbally the question and to hear the response from the system, creating an addition to the traditional I / O via the keyboard and computer screen. The third example, the «IntonTrainer» system, provides the user with the possibility of voice interaction and is designed for in-depth self-learning of the intonation of oral speech.

About the Authors

V. A. Zhitko
Объединенный институт проблем информатики НАН Беларуси
Belarus


B. M. Lobanov
Объединенный институт проблем информатики НАН Беларуси
Belarus


References

1. Szyperski, C. Component Software: Beyond Object-Oriented Programming / C. Szyperski. – N. Y. : Addison-Wesley, 1998. – 411 р.

2. Cheesman, J. UML Components: A Simple Process for Specifying Component-Based Software / J. Cheesman, J. Daniels. – Boston : Addison-Wesley, 2000. – 208 р.

3. Wang, A. Ju. An Component-Oriented Programming / A. Ju. Wang, K. Qian. – 1st ed. – N. Y. : Addison-Wesley, 2005. – 336 р.

4. Brown, A.W. The current state of CBSE / A.W. Brown, K.C. Wallnau // IEEE Software, sept. 1998. – Los Alamitos, CA, USA, 1998. – Vol. 15, iss. 5. – Р. 37–46.

5. Гецевич, Ю.С. Система синтеза белорусской речи по тексту / Ю.С. Гецевич, Б.М. Лобанов // Речевые технологии. – 2010. – № 1. – С. 91–100.

6. Лобанов, Б.М. Компьютерный синтез и клонирование речи / Б.М. Лобанов, Л.И. Цирульник. – Минск : Бел. наука, 2008. – 344 с.

7. Google Cloud Speech API [Electronic resource]. – 2016. – Mode of access: https://cloud.google.com/speech/docs. – Date of access : 20.05.2017.

8. Google Cloud Translation API [Electronic resource]. – 2016. – Mode of access: https://cloud.google.com/translate/docs. – Date of access : 20.05.2017.

9. Житко, В.А. Микросервисный подход к проектированию речевых интерфейсов / В.А. Житко, Б.М. Лобанов // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS–2016) : мат. VI Междунар. науч.-техн. конф. (Минск, 18–20 февр. 2016 г.); под ред. В.В. Голенкова. – Минск : БГУИР, 2016. – C. 383–388.

10. CMU Sphinx Speech Recognition Toolkit [Electronic resource]. – 2016. – Mode of access: https://sourceforge.net/projects/cmusphinx. – Date of access : 20.05.2017.

11. Житко, В.А. Справочная система с речевым интерфейсом / В.А. Житко, Ю.С. Гецевич, Б.М. Лобанов // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS–2013) : мат. III Междунар. науч.-техн. конф. (Минск, 21–23 февр. 2013 г.) / редкол. : В.В. Голенков (отв. ред.) [и др.]. – Минск : БГУИР, 2013. – С. 505–510.

12. Lobanov, B.M. Automatic Recognition of Sounds Combination in Running Speech Signal / B.M. Lobanov, G.S. Slucker, A.P. Tizik // Автоматическое распознавание и синтез речи : сб. науч. тр. – Минск : Ин-т техн. кибернетики НАН Беларуси, 2000. – С. 78–88.

13. Lobanov, B.M. Comparison of Melodic Portraits of English and Russian Dialogic Phrases / B.M. Lobanov // Компьютерная лингвистика и интеллектуальные технологии : по мат. ежегодной Междунар. конф. «Диалог» (Москва, 1–4 июня 2016 г.). – М. : РГГУ, 2016. – Вып. 15(22).– C. 382–392.

14. Speech Signal Processing Toolkit (SPTK) [Electronic resource]. – 2016. – Mode of access: https://sourceforge.net/projects/sp-tk. – Date of access : 20.05.2017.

15. Lobanov, B.M. A prototype of the computer system for speech intonation training / B.M. Lobanov, V.A. Zhitko // Open Semantic Technologies for Intelligent Systems (OSTIS–2017): мат. VI Междунар. науч.-техн. конф. (Минск, 18–20 февр. 2017 г.) ; под ред. В.В. Голенкова. – Минск : БГУИР, 2017. – C. 383–388.


Review

For citations:


Zhitko V.A., Lobanov B.M. SOME EXAMPLES OF APPLIED SYSTEMS WITH SPEECH INTERFACE. Informatics. 2017;(3(55)):72-81. (In Russ.)

Views: 764


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)