Preview

Информатика

Расширенный поиск
Том 19, № 1 (2022)
Скачать выпуск PDF

ЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ 

7-18 118
Аннотация

Ц е л и . Рассматривается задача синтеза комбинационных схем в базисе двухвходовых логических элементов, в качестве которых выступают элементы И, ИЛИ, И-НЕ и ИЛИ-НЕ. Целью работы является исследование возможности применения алгебраической декомпозиции булевых функций  (в  англоязычной литературе bi-decomposition) для синтеза комбинационных схем.

М е т о д ы . Используемый метод алгебраической декомпозиции сводится к поиску в графе двухблочного взвешенного покрытия полными двудольными подграфами (бикликами).

Р е з у л ь т а т ы . Исходная булева функция задается двумя троичными матрицами, одна из которых представляет собой область булева пространства аргументов, где функция имеет значение 1, а другая – область булева пространства, где функция имеет значение 0. Рассматривается граф ортогональности строк троичных матриц, представляющих заданную булеву функцию. Описан способ получения двухблочного взвешенного покрытия бикликами графа ортогональности cтрок троичных матриц. Всем бикликам из получаемого покрытия в качестве веса определенным образом приписывается некоторое множество переменных, представляющих собой аргументы заданной функции. Каждая из этих биклик определяет булеву функцию, аргументами которой являются приписанные к биклике переменные. Полученные таким образом функции составляют разложение исходной функции.

З а к л ю ч е н и е . Процесс синтеза комбинационной схемы заключается в последовательном применении алгебраической декомпозиции к получаемым функциям. Предлагаемый метод позволяет строить схемы с малой задержкой.

ЗАЩИТА ИНФОРМАЦИИ И НАДЕЖНОСТЬ СИСТЕМ 

19-31 119
Аннотация

Ц е л и .   Своевременное  обнаружение  сетевой  разведки  позволяет  снизить  риски  информационной безопасности организаций. Исследование проводилось с целью разработки программного модуля обнаружения признаков сетевой разведки с использованием методов машинного обучения.

М е т о д ы . Основными методами детектирования признаков сетевой разведки являлись: анализ открытых датасетов соответствующего назначения; формирование метрик, характерных для сетевой разведки; разработка набора данных разведки на основе определенных метрик. Исследовалась эффективность методов машинного обучения для задачи классификации.

Р е з у л ь т а т ы . Спроектированы топология и тестовый сегмент в корпоративной сети РУП «Белтелеком» для создания датасета. Для детектирования и анализа событий разработано средство мониторинга, результаты работы которого использовались в качестве основы для нового датасета.

Реализация метода дерева принятия решений в виде программного кода позволила увеличить скорость работы модуля приблизительно в два раза (0,147 мс). Практические испытания разработанного модуля показали факт сработки на все типы сканирования сетей с помощью утилит Nmap и Masscan.

З а к л ю ч е н и е .  Анализ датасета методом главных компонент показал наличие  пограничной области между событиями легального трафика и трафика сетевой разведки, что положительно сказалось на обучении  модели.  Изучены  и  протестированы  наиболее  перспективные  методы  машинного  обучения с использованием различных гиперпараметров. Наилучшие результаты показал метод дерева принятия решений с параметрами criterion = gini и splitter = random и скоростью работы 0,333 мс.

32-49 98
Аннотация

Ц е л и. Решается задача построения нового класса физически неклонируемых функций (ФНФ), обеспечивающих управление задержкой распространения сигнала через элементы, которые расположены на пути его распространения. Актуальность такого исследования связана с активным развитием физической криптографии. В работе преследуются следующие цели: построение базовых элементов ФНФ и их модификаций, разработка методики построения управляемых кольцевых осцилляторов на базе элементов XOR и управляемых кольцевых осцилляторов, основанных на многовходовом переключении сигнала.

М е то д ы . Используются методы синтеза и анализа цифровых устройств, в том числе на программируемых логических интегральных схемах, основы булевой алгебры и схемотехники.

Р е з у л ь т а т ы .  Показано, что комбинированные ФНФ, основанные на RS-триггерах, реализуют идею управления задержкой сигнала за счет выбора пути, который представляет собой последовательно подключенные элементы, выбранные в соответствии с запросом ФНФ. Разработана методика построения ФНФ с управляемой задержкой через каждый элемент пути. Исследованы особенности и свойства ФНФ с управляемой задержкой сигналов типа кольцевого осциллятора и показаны возможные решения для случая двухразрядных входных запросов. Предложен базовый элемент и его модификации для построения новых структур ФНФ, основанных на управлении задержкой распространения сигнала. Показано, что задержка сигнала через базовый элемент, представляющий собой многовходовый элемент XOR, зависит не только от количества входов, на которые подается активный входной сигнал, но и от фиксированного значения 0 либо 1 на остальных его входах. Приведена новая структура ФНФ – управляемый кольцевой осциллятор, рассматриваются его реализации для случая управления за счет задания количества входов, на которых изменяется активный входной сигнал.

З а к л ю ч е н и е . Предложенный подход к построению физически неклонируемых функций, основанный на управлении задержкой сигналов через логические элементы, показал свою работоспособность и перспективность. Экспериментально подтвержден эффект влияния на задержки распространения сигналов через логический элемент количества его входов, на которых изменяются входные сигналы, приводящие к изменению выходного сигнала. Перспективным представляется дальнейшее развитие идей построения управляемых кольцевых осцилляторов и осцилляторов с многовходовым переключением сигнала, а также создания новых структур ФНФ типа арбитр.

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ 

50-58 87
Аннотация

Ц е л и . В радиолокационных системах сопровождения движущихся объектов часто возникают перерывы в измерении координат. Наиболее полно в непрерывном времени эта проблема решена в теории систем со случайной структурой в рамках статистической байесовской теории фильтрации при наличии полной априорной статистической информации. Такой подход приводит к сложным алгоритмам, трудно реализуемым на практике. Целью исследования являлась разработка алгоритма фильтрации в условиях перерывов информации на основе применения расширенного метода наименьших квадратов.

М е т о д ы .  Используются методы  теории  оценивания, в  частности  расширенный метод  наименьших квадратов, позволяющий находить сравнительно простые алгоритмы при минимальных объемах априорных знаний о характеристиках воздействий.

Р е з у л ь т а т ы . Разработан алгоритм фильтрации радиолокационных сигналов, в основе которого лежат измерения моментов перерывов и экстраполяция измеряемых координат на интервалах отсутствия информации. Полученный алгоритм является нелинейным, и за счет этого в фильтре могут возникать срывы сопровождения. Результаты работы алгоритма продемонстрированы на модельном примере, выполнена оценка точности фильтрации и условий срыва слежения.

З а к л ю ч е н и е . Разработанный алгоритм фильтрации позволяет определять моменты наступления перерывов и осуществлять экстраполяцию оценок полезной информации. Сравнительная простота алгоритма делает его пригодным для практического использования.

БИОИНФОРМАТИКА 

59-71 110
Аннотация

Ц е л и. Объемы данных, генерируемые современными методами высокопроизводительного секвенирования, таковы, что их анализ выполняется преимущественно в автоматическом режиме. В частности, использование вновь расшифрованных геномных последовательностей возможно только после аннотации функциональных элементов генома, которая, как правило, выполняется автоматическими конвейерами. Такие конвейеры аннотации успешно справляются с идентификацией генов, но ни один из них не аннотирует регуляторные элементы, без которых нельзя понять, когда и как гены могут экспрессироваться. Информация о регуляторных элементах бактерий собрана в нескольких специализированных базах данных (RegulonDB, CollecTF, Prodoric2 и др.), однако только часть этой информации можно использовать для аннотации регуляторных элементов и только у очень ограниченного круга бактерий. Ранее авторами был предложен четкий формальный критерий для применения регуляторной информации к любым бактериальным геномам. Таким критерием стал CR-тег – последовательность аминокислотных остатков транскрипционного регулятора, специфически контактирующих с азотистыми основаниями регуляторного элемента в геномной ДНК. Связанная с CR-тегом математическая модель регуляторного элемента (мотив) может быть корректно применена для аннотации подобных элементов в любых геномах, кодирующих транскрипционный регулятор с идентичным CR-тегом. Накопление связанных с CR-тегами мотивов поставило вопрос об их упорядоченном хранении для удобства последующего применения при аннотации геномных последовательностей. Поскольку ни одна из известных баз данных не использует концепцию CR-тегов, потребовалась разработка новой базы данных. Таким образом, целью работы является создание базы данных с информацией о бактериальных транскрипционных факторах и распознаваемых ими последовательностях ДНК, пригодной для аннотации регуляторных последовательностей в бактериальных геномах.

М е то д ы .  Инфологическое моделирование предметной области производилось с помощью методологии IDEF1X. Разработка базы данных выполнялась посредством СУБД Microsoft SQL Server. Кроссплатформенное приложение по импорту данных в базу данных написано на языке C++ с использованием технологии Qt.

Р е з у л ь т а т ы . В результате проведенного исследования предметной области была разработана и реализована в СУБД Microsoft SQL Server реляционная модель данных, позволяющая целостное хранение информации  о  накопленных  мотивах  регуляции  транскрипции  у  бактерий,  включая  и  информацию о публикациях, подтверждающих корректность этих мотивов. Для автоматизации процесса ввода накопленных данных разработано кроссплатформенное приложение для импорта структурированных данных о транскрипционных факторах.

З а к л ю ч е н и е .  Основным отличием разработанной базы данных является использование концепции CR-тега. Записи математических моделей регуляторных элементов (мотивов) в базе данных связаны с CR-тегом и поэтому могут быть корректно применены для аннотации подобных элементов в любых геномах, кодирующих транскрипционный регулятор с идентичным CR-тегом. Разработанная база данных обеспечит структурированное и целостное хранение данных, а также их быстрый поиск при использовании в конвейере автоматической аннотации регуляторных элементов в бактериальных геномных последовательностях.

ПАРАЛЛЕЛЬНЫЕ АРХИТЕКТУРЫ И ВЫЧИСЛЕНИЯ 

72-87 83
Аннотация

Ц е л и . Решается задача эффективной организации выполнения последовательных вычислительных процессов в векторном режиме с учетом возможностей современных высокопроизводительных векторно-конвейерных ЭВМ. Актуальность рассматриваемой задачи обусловлена тем, что такие процессы, возникающие при циклической обработке данных и в итерационных алгоритмах, являются наиболее сложными для распараллеливания. При решении задачи ставились три цели: построение математической модели,  учитывающей основные  архитектурные  и  вычислительные особенности  современных  векторно-конвейерных ЭВМ; расчет оптимального суммарного времени выполнения векторных операций; оценка временного выигрыша по сравнению с последовательным режимом обработки данных.

М е т о д ы . Для реализации поставленных целей и доказательства основных и вспомогательных утверждений применялся оригинальный метод, включающий установление справедливости индуктивных предположений в рассматриваемых случаях, а также иллюстративный метод теории расписаний, использующий диаграммы Ганта.

Р е з у л ь т а т ы . Предложена векторная модель реализации последовательных вычислений, учитывающая основные особенности векторно-конвейерных ЭВМ. Определено оптимальное суммарное время выполнения последовательных вычислений в векторном режиме и получена нижняя оценка временного выигрыша по сравнению с последовательным режимом их выполнения.

З а к л ю ч е н и е . Установлено, что при обработке в последовательном режиме скалярных входных данных векторными операциями с длиной конвейера k возможно ускорение не менее чем в nN (nk+N) раз, где N – размер входа, n – число векторных и соответствующих им скалярных операций. Оценка временного ускорения при векторизации вычислений приводится в сравнении с последовательным режимом их выполнения.

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ 

88-95 116
Аннотация

В статье представляется методология разработки программного обеспечения на основе модели распределенных объектно-ориентированных стохастических гибридных систем. Предлагается ориентироваться на создание математической модели для рассматриваемой системы вместе с ее спецификацией на всех этапах разработки целевого программного обеспечения.

Выделяются такие этапы разработки, как построение предварительной математической модели посредством составления ее спецификации, выбор и спецификация метрик системы, статистический анализ модели, апробация в условиях, приближенных к реальным, анализ с применением аналитических методов и реализация. Предлагаются формализм для описания рассматриваемой системы и подход к ее анализу, согласно результатам которого спецификация модели и соответствующая ей математическая модель модифицируются посредством выполнения этапов разработки. Такой подход позволяет получить на выходе не только готовое программное обеспечение, но и математическую модель с изученными свойствами, реализацией которой является данное программное обеспечение.

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ 

96-110 99
Аннотация

Решается задача построения компьютерной модели малого языка. Ее актуальность обусловлена необходимостью устранения информационного неравенства между носителями различных языков, востребованностью новых инструментов для исследования малоизученных языков и инновационных подходов к моделированию языка в условиях дефицита ресурсов, необходимостью поддержки и развития языков малых народов.

При решении задачи обработки малых языков на этапе описания проблемной ситуации преследуются три основные цели: обоснование проблемы моделирования языка в условиях дефицита ресурсов как особой задачи в сфере моделирования естественных языков, обзор литературы по соответствующей теме и разработка концепции модели усвоения языка с относительно малым числом доступных ресурсов. Используются методы компьютерного моделирования с применением нейронных сетей, обучение с частичным привлечением учителя и обучение с подкреплением.

В  работе  приведен обзор  литературы, посвященной моделированию  изучения  лексики,  морфологии и грамматики родного языка ребенком. На основании современных представлений о ходе изучения языка предложена архитектура системы обработки малого языка, которая при обучении опирается на компьютерное моделирование онтогенеза. Выделены основные компоненты системы и принципы их взаимодействия. В основе системы лежит модуль, построенный на базе современных диалоговых языковых моделей  и  обученный на  каком-либо крупном языке,  например английском. При обучении используется промежуточный слой, который представляет высказывания в некотором абстрактном виде, например, в символах формальной семантики. Соотношение между формальной записью высказываний и их переводом на целевой малый язык изучается методом моделирования процесса усвоения лексики и грамматики языка ребенком. Отдельный компонент имитирует неязыковой контекст, в котором происходит изучение языка.

В статье исследуется задача моделирования малых языков. Дано подробное обоснование актуальности моделирования малых языков: показана социальная значимость этой проблемы, польза ее решения для лингвистики, этнографии, этнологии и культурной антропологии. Отмечена неэффективность подходов, применяемых к крупным языкам, в условиях дефицита ресурсов. Предложена модель изучения языка с помощью имитации онтогенеза, которая опирается как на полученные результаты в области компьютерного моделирования, так и на данные психолингвистики.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)