Применение модели освоения языка к решению задачи обработки малых языков

Д. И. Качков

doi:10.37661/1816-0301-2022-19-1-96-110

Применение модели освоения языка к решению задачи обработки малых языков

Д. И. Качков

https://doi.org/10.37661/1816-0301-2022-19-1-96-110

Полный текст:

PDF (Rus) |

сгенерировать QR код

Аннотация

Решается задача построения компьютерной модели малого языка. Ее актуальность обусловлена необходимостью устранения информационного неравенства между носителями различных языков, востребованностью новых инструментов для исследования малоизученных языков и инновационных подходов к моделированию языка в условиях дефицита ресурсов, необходимостью поддержки и развития языков малых народов.

При решении задачи обработки малых языков на этапе описания проблемной ситуации преследуются три основные цели: обоснование проблемы моделирования языка в условиях дефицита ресурсов как особой задачи в сфере моделирования естественных языков, обзор литературы по соответствующей теме и разработка концепции модели усвоения языка с относительно малым числом доступных ресурсов. Используются методы компьютерного моделирования с применением нейронных сетей, обучение с частичным привлечением учителя и обучение с подкреплением.

В работе приведен обзор литературы, посвященной моделированию изучения лексики, морфологии и грамматики родного языка ребенком. На основании современных представлений о ходе изучения языка предложена архитектура системы обработки малого языка, которая при обучении опирается на компьютерное моделирование онтогенеза. Выделены основные компоненты системы и принципы их взаимодействия. В основе системы лежит модуль, построенный на базе современных диалоговых языковых моделей и обученный на каком-либо крупном языке, например английском. При обучении используется промежуточный слой, который представляет высказывания в некотором абстрактном виде, например, в символах формальной семантики. Соотношение между формальной записью высказываний и их переводом на целевой малый язык изучается методом моделирования процесса усвоения лексики и грамматики языка ребенком. Отдельный компонент имитирует неязыковой контекст, в котором происходит изучение языка.

В статье исследуется задача моделирования малых языков. Дано подробное обоснование актуальности моделирования малых языков: показана социальная значимость этой проблемы, польза ее решения для лингвистики, этнографии, этнологии и культурной антропологии. Отмечена неэффективность подходов, применяемых к крупным языкам, в условиях дефицита ресурсов. Предложена модель изучения языка с помощью имитации онтогенеза, которая опирается как на полученные результаты в области компьютерного моделирования, так и на данные психолингвистики.

Ключевые слова

информационные технологии, языковые модели, обработка малого языка, усвоение языка, обучение с подкреплением, нейронные сети, архитектура Transformer

Для цитирования:

Качков Д.И. Применение модели освоения языка к решению задачи обработки малых языков. Информатика. 2022;19(1):96-110. https://doi.org/10.37661/1816-0301-2022-19-1-96-110

For citation:

Kachkou D.I. Applying the language acquisition model to the solution small language processing tasks. Informatics. 2022;19(1):96-110. (In Russ.) https://doi.org/10.37661/1816-0301-2022-19-1-96-110

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)

Информатика

Применение модели освоения языка к решению задачи обработки малых языков

Полный текст:

Аннотация

Ключевые слова

Об авторе

Список литературы

Дополнительные файлы

Рецензия

Для цитирования:

For citation:

Логин
Пароль
	Запомнить меня

Войти

Информатика

Применение модели освоения языка к решению задачи обработки малых языков

Полный текст:

Аннотация

Ключевые слова

Об авторе

Список литературы

Дополнительные файлы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов