Мадэль аўтаматызаванай ідэнтыфікацыі амографаў для беларускай мовы

Ю. С. Гецэвіч; Я. С. Зяноўка; Д. І. Латышэвіч; А. А. Бакуновіч; А. Я. Драгун; М. А. Казлова

doi:10.37661/1816-0301-2023-20-4-87-100

Мадэль аўтаматызаванай ідэнтыфікацыі амографаў для беларускай мовы

Ю. С. Гецэвіч, Я. С. Зяноўка, Д. І. Латышэвіч, А. А. Бакуновіч, А. Я. Драгун, М. А. Казлова

https://doi.org/10.37661/1816-0301-2023-20-4-87-100

Полный текст:

PDF (Bel)

сгенерировать QR код

Аннотация

Мэты. Мэтай працы з’яўляецца апісанне прататыпнай сістэмы для аўтаматызаванага здымання аманіміі ў электронных тэкстах на беларускай і рускай мовах. Гэта звязана з актуальнай праблемай аўтаматычнай апрацоўкі тэкстаў на марфалагічным узроўні, працэс якой ускладняецца флектыўнасцю беларускай мовы з разнастайнай і багатай сістэмай марфалагічных характарыстык часцін мовы.

Метады. У працы выкарыстоўваюцца правілавыя метады ідэнтыфікацыі амаграфіі і метады, заснаваныя на ведах.

Вынікі. Прапанаваны метады і падыходы для праектавання сістэм аўтаматычнага вызначэння амографаў. Падрабязна прадстаўлены метад, заснаваны на ведах, на аснове якога распрацаваны пакрокавы алгарытм ідэнтыфікацыі амографаў і рэалізаваны эфектыўны і хуткадзейны прататып для іх здымання на рускай і беларускай мовах.

Заключэнне. Прадстаўлены працоўны прататып пошуку амографаў, які з’яўляецца першым рэсурсам па здыманні шматзначнасці для беларускай мовы ў адкрытым доступе.

Ключевые слова

аманімія, здыманне аманіміі, шматзначнасць, аўтаматычная апрацоўка электронных тэкстаў, беларуская мова, слоўнік

Об авторах

Ю. С. Гецэвіч

Аб’яднаны інстытут праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі
Беларусь

Гецэвіч Юрась Станіслававіч, кандыдат тэхнічных навук, дацэнт, загадчык лабараторыі распазнавання і сінтэзу маўлення