Том 21, № 2 (2024)

Основы функционирования семантического портала ядерных знаний BelNET

С. Н. Сытова, В. В. Гавриловец, А. П. Дунец, А. Н. Коваленко, С. В. Черепица

PDF (Rus)

7-23 580

Цели. Рассмотрена возможность использования семантических технологий для развития и совершенствования системы управления контентом научно-образовательного портала eLab-Science и созданного на ее основе белорусского портала ядерных знаний BelNET (Belarusian Nuclear Education and Training Portal, https://belnet.by/).

Методы. Разработаны оригинальные алгоритмы автоматической систематизации – размещения записей контента в таксономии портала на основе семантических технологий и формирования списка ключевых слов. Использованы такие понятия семантических технологий, как таксономия (иерархическая структура портала), тезаурус, глоссарий.

Результаты. Разработанные алгоритмы реализованы и протестированы с использованием инструмента полнотекстового поиска и оригинального белорусского глоссария по ядерной и радиационной безопасности.

Заключение. Описанные принципы организации и алгоритмы на базе семантических технологий,
лежащие в основе функционирования системы управления контентом научно-образовательного портала eLab-Science и созданного на ее базе белорусского портала ядерных знаний BelNET, позволяют эффективно реализовывать размещение записей контента в таксономии портала, а также автоматически формировать набор ключевых слов создаваемого ресурса.

Применение моделей копул в анализе акций фондового рынка

А. М. Кендысь, Н. Н. Труш

PDF (Rus)

24-35 545

Аннотация

Цели. Целью исследования является применение моделей копул для анализа акций российского фондового рынка и описания изменения зависимости между акциями до и во время коронавирусной инфекции (COVID-19).

Методы. Приводится алгоритм использования копул и функций языка программирования R при его реализации. Для описания динамики финансовых рядов используется модель ARMA-GJR-GARCH
(ARMA-Glosten-Jagannathan-Runkle-GARCH, модель авторегрессии – скользящего среднего Глостен – Джаганнатан – Ранкл с обобщенной авторегрессионной условной гетероскедастичностью). Осуществляется подбор оптимальных семейств и параметров моделей копул. Проверяется адекватность полученных моделей и анализируются результаты исследования взаимосвязи между данными рядами.

Результаты. Разработан алгоритм для относительно нового подхода использования копул в связке с моделью ARMA-GJR-GARCH. Подход применен для исследования влияния коронавируса в контексте российской экономики. Выявлено, что в период COVID-19 зависимость между различными акциями фондового рынка возрастает. Показано, что эффект волатильности финансовых рядов увеличивается после вспышки пандемии.

Заключение. Алгоритм исследования с помощью моделей копул в связке с моделью ARMA-GJR-GARCH показал свою целесообразность. Данный подход можно использовать и с применением других моделей GARCH-типа для исследования финансов и других сфер.

Дооперационное прогнозирование T-стадии рака желудка на базе моделей порядковой регрессии

О. В. Красько, М. Ю. Ревтович, А. И. Потейко

PDF (Rus)

36-53 622

Аннотация

Цели. Исследование порядковых регрессий, представленных набором бинарных логистических регрессий, и их применение в клинической практике при Т-стадировании рака желудка.

Методы. Использовались методы статистических моделей порядковой регрессии, оценки эффективности модели и анализа выживаемости.

Результаты. Основные модели порядковой регрессии были изучены и применены к клиническим данным рака желудка. К известным прогностическим критериям по классификации TNM в многофакторной регрессионной модели добавлены некоторые клинические предикторы, результаты представляются перспективными для персонализированного подхода при планировании объема лечения для повышения его эффективности.

Заключение. Проведенное исследование показало, что комплексное использование порядковых моделей наряду с мультиномиальными дает дополнительную информацию, которая помогает понять поведение латентной переменной в сложных процессах онкологических заболеваний. Клиническая часть исследования создает предпосылки к дифференцированному подходу к предоперационному планированию объема лечения пациентов с одинаковой Т-стадией на основе результатов моделирования.

Меры различия, основанные на применении расстояния Хэмминга, для генерирования управляемых вероятностных тестов

В. Н. Ярмолик, В. В. Петровская, Н. А. Шевченко

PDF (Rus)

54-72 877

Аннотация

Цели. Решается задача построения мер различия, основанных на применении расстояния Хэмминга, для генерирования управляемых вероятностных двоичных тестовых наборов. Целью настоящей статьи является развитие методов определения расстояния Хэмминга для нахождения различия между тестовыми наборами при их совпадении по оценкам других мер различия.
Методы. На базе расстояния Хэмминга, используемого в теории и практике формирования управляемых вероятностных тестов, предлагаются новые меры различия для сравнения двух двоичных n-разрядных тестовых наборов. Основой предлагаемых мер различия является формирование множества расстояний Хэмминга для исходных наборов, представляемых в виде последовательностей символов различных алфавитов.
Результаты. Показывается неразличимость пар двоичных тестовых наборов при использовании меры различия, основанной на применении расстояния Хэмминга. В этом случае отличающиеся пары наборов могут иметь совпадающие значения расстояния Хэмминга. Для построения новых мер различия исходные двоичные тестовые наборы представляются в виде последовательностей, состоящих из символов, принадлежащих различным алфавитам. Предлагаются различные стратегии применения новых мер различия, основанных на использовании одного из трех правил, при генерировании управляемых вероятностных тестов. Показано, что во всех трех случаях новых мер различия информативными являются только несколько первых их компонент, как правило, не более двух или трех. Соответственно, вычислительная сложность для всех трех вариантов сравнима и не превышает 3n операций сравнения. Проведенные экспериментальные исследования подтверждают эффективность предложенных мер различия и их невысокую вычислительную сложность.
Заключение. Предложенные меры различия расширяют возможности генерирования тестовых наборов при формировании управляемых вероятностных тестов. Показывается, что тестовые наборы, неразличимые при использовании в качестве меры различия расстояния Хэмминга, имеют отличающиеся значения предложенных мер различия. Это позволяет более точно классифицировать формируемые случайным образом наборы, которые являются кандидатами в тестовые наборы.

Сравнительный анализ производительности одноплатных компьютеров для разработки микроархитектурного вычислительного комплекса обнаружения возгораний

Д. А. Павленко

PDF (Rus)

73-85 563

Аннотация

Цели. Целью работы является выбор базовой вычислительной микроплатформы бортового микроархитектурного вычислительного комплекса для обнаружения аномальных ситуаций на территории Республики Беларусь из космоса на основе методов искусственного интеллекта.
Методы. Для выбора вычислительного комплекса используется метод сравнительного анализа. К выбранному оборудованию применяется серия тестов производительности и проводится сопоставительный анализ (бенчмаркинг). Сравнительный и сопоставительный анализы осуществляются в соответствии с требованиями технического задания на текущий проект.
Результаты. Проведены сравнительный анализ и тестирование производительности одноплатных компьютеров Raspberry Pi4 ModelB и Cool Pi4 ModelB, а также ИИ-ускорителя Google Coral USB Accelerator с Google Edge TPU. Сравнительный анализ показал, что Raspberry Pi4 ModelB и Cool Pi4 ModelB полностью соответствуют требованиям технического задания на разработку бортового микроархитектурного вычислительного комплекса обнаружения аномальных ситуаций. При этом Cool Pi4 ModelB хорошо справляется с нейросетевыми вычислениями, но в четыре раза медленнее, чем Google Coral USB Accelerator. Нейросетевые вычисления на Raspberry Pi4 ModelB в 22 раза медленнее, чем аналогичные вычисления на Google Coral USB Accelerator. Cool Pi4 ModelB опережает Raspberry Pi4 ModelB примерно в два-три раза при решении задач копирования и сжатия данных и почти в шесть раз при нейросетевых вычислениях.
Заключение. Несмотря на то что Raspberry Pi4 ModelB подходит под требования технического задания в качестве вычислительной основы, при разработке бортового микроархитектурного вычислительного комплекса обнаружения аномальных ситуаций стоит использовать более мощные альтернативы со встроенным ускорителем нейронных сетей (например, Radxa Rock5 ModelA) либо с дополнительным внешним ИИ-ускорителем (например, сочетание Cool Pi4 ModelB и Google Coral USB Accelerator). Использование Raspberry Pi4 ModelB с дополнительным ИИ-ускорителем также приемлемо и увеличит скорость вычислений в десятки раз. ИИ-ускорители обеспечивают самые быстрые нейросетевые вычисления, но есть нюансы, связанные с новизной технологий, которые будут исследоваться при дальнейшей разработке.

Интерактивная сегментация изображений на основе их кластеризации

Б. А. Залесский

PDF (Rus)

86-93 583

Аннотация

Цели. Рассматривается задача сегментации цветных изображений без использования предварительного обучения. Она возникает, например, когда необходимо выполнить сегментацию изображений с неизвестными заранее семантическими и цветовыми свойствами непосредственно после их получения или когда набор изображений, предназначенных для сегментации, слишком мал, а также при выполнении предварительного «разведочного» анализа изображений. В таких случаях невозможно использование мощных нейросетевых и других средств сегментации, требующих глубокого обучения.
Методы. Предлагается алгоритм интерактивной сегментации изображений, основанный на анализе цветов областей, выделенных в интерактивном режиме. Вначале в интерактивном режиме выделяются весьма приближенно области изображения, принадлежащие объектам, а затем – принадлежащие фону. На следующем шаге множество цветов выделенных областей объектов и множество цветов выделенных областей фона кластеризуются по отдельности одним из алгоритмов кластеризации, например k-сред- них, нечетких c-средних, или предложенным автором алгоритмом многоуровневой кластеризации. После этого из множества центров кластеров, описывающих объект, и множества кластеров, описывающих фон, удаляются неинформативные элементы. Преобразованные множества центров кластеров объектов и фона используются для сегментации изображения.
Результаты. Построенный алгоритм позволяет выделить на цветном изображении требуемые объекты в случае, когда их цвет отличается от цвета фона. Интерактивное выделение областей объектов и областей фона не требует аккуратности и больших усилий и обычно занимает от нескольких десятков секунд до минуты. Для выделения достаточно использовать прямоугольные области, лежащие целиком внутри изображений объектов, и прямоугольные области, лежащие целиком внутри фона. Приводятся пример интерактивного выделения областей и результаты сегментирования цветных изображений.
Заключение. Проведенные эксперименты показали эффективность предложенного подхода сегментирования цветных изображений. Его можно применять в случаях, когда заранее неизвестны семантические и цветовые свойства изображений, и в случаях, когда использование более мощных методов глубокого обучения, включая нейронные сети, слишком затратно или невозможно.

Верификация динамической подписи человека по ограниченному числу образцов

В. В. Старовойтов

PDF (Rus)

94-106 651

Аннотация

Цели. Целью исследования является разработка нового метода оценки подлинности подписи одного человека, выполненной на планшете стилусом, при наличии ограниченного числа образцов подписей этого человека.
Методы. Показано, как строить индивидуальный образ динамических подписей произвольного человека, который описывается точками в многомерном признаковом пространстве и предназначен для последующих проверок подлинности подписей данного человека. Образ строится по 5<N<20 образцам подлинных подписей человека. Он представляет собой выпуклую фигуру в многомерном признаковом пространстве и описывает индивидуальные признаки выполнения подписи конкретным человеком.
Результаты. Динамика исполнения подписи представлена тремя дискретными параметрическими функциями: координатами стилуса X, Y и его давлением на планшет P, зарегистрированными через фиксированные промежутки времени. В процессе исследований отобран ряд вычисляемых по ним вторичных функций-признаков. Поскольку эти массивы данных имеют разную длину, для их сравнения используется алгоритм динамической трансформации временно́й шкалы. Результатами данного преобразования являются расстояния между динамическими признаками двух подписей, которые служат координатами точки в признаковом пространстве, описывающей сходство этих подписей. Множество таких точек описывает сходство всех пар подлинных подписей человека, предъявленных для верификации, в многомерном признаковом пространстве. Выпуклая оболочка облака этих точек используется как образ подписи конкретного человека. Подлинные подписи любого человека всегда отличаются друг от друга, существенные отличия между ними могут исказить результат верификации.
Заключение. Экспериментальные исследования по формированию индивидуальных образов подписей 498 человек из базы динамических подписей DeepSignDB показали точность верификации порядка 98 % при анализе 24 900 подписей. Из них половина подлинные, половина поддельные.

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Информатика

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

БИОИНФОРМАТИКА

ЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ

Войти

Информатика

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

БИОИНФОРМАТИКА

ЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ

Использование куки-файлов