АЛГОРИТМ СИНТАКСИЧЕСКОГО АНАЛИЗА ТЕКСТА ДЛЯ ОБРАБОТКИ БОЛЬШИХ ОБЪЕМОВ ДАННЫХ
Аннотация
Описывается эффективный алгоритм реализации синтаксического анализа естественного языка. Представленный алгоритм используется в промышленной системе инженерии знаний и применяется для анализа английского, японского, французского и немецкого языков. Эффективность алгоритма объясняется линейной зависимостью времени его работы от длины предложения.
Список литературы
1. Connexor natural language [Electronic resource]. − 2006. − Mode of access: http://www.conexor.fi.
2. The Tagged LOB Corpus: Users’ manual / S. Johansson [et. al.]. − The Norwegian Computing Centre for the Humanities. − Norway: Bergen University, 1986.
3. Grishman, R. Computational linguistics. An introduction / R. Grishman. − United Kingdom: Cambridge University Press, 1986.
4. Link grammar parser [Electronic resource]. − 2006. − Mode of access: http://www.link.cs. cmu.edu/ link/submit-sentence-4.html.
5. Cheusov, A.V. The word-based regular expressions in computational linguistics / A.V. Cheusov // Proc. of the 7th International conference, Pattern Recognition and Information. – Minsk, 2003. − Vol. 1. − P. 208–213.
6. Mikheev, A. Automatic rule induction for unknown-word guessing / A. Mikheev // Computational Linguistics. – 1997. − Vol. 23, № 3. − P. 405–423.
7. IEEE Std 1003.1−2001. Standard for Information Technology – Portable Operating System Interface (POSIX) System Interfaces, Issue 6, 2001.
8. Postanogov, D. Effective implementation of word-based regular expressions notation in natural language processing / D. Postanogov // Proc. of the seventh International conference, Pattern recognition and information processing. – Minsk, 2003.
9. Брауэр, В. Введение в теорию конечных автоматов / В. Брауэр. − М.: Радио и связь, 1987.
10. Friedl, J. Mastering Regular Expressions / J. Friedl. − O’Reilly & Associates, Inc., 1997.
11. Jurafsky, D. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition / D. Juravsky, J. Martin. − New Jersey: Prentice Hall PTR, 2000.
12. Invention Machine [Electronic resource]. − 2006. − Mode of access: http://www.inven-tion-machine.com.
Рецензия
Для цитирования:
Чеусов А.В. АЛГОРИТМ СИНТАКСИЧЕСКОГО АНАЛИЗА ТЕКСТА ДЛЯ ОБРАБОТКИ БОЛЬШИХ ОБЪЕМОВ ДАННЫХ. Информатика. 2007;(1(13)):98-105.