Preview

Информатика

Расширенный поиск
Том 17, № 1 (2020)
Скачать выпуск PDF

БИОИНФОРМАТИКА 

7-17 2421
Аннотация
Методами глубокого обучения разработан генеративный состязательный автоэнкодер для рационального дизайна потенциальных ингибиторов проникновения ВИЧ-1, способных блокировать участок белка gp120 оболочки вируса, критический для его связывания с клеточным рецептором CD4. Были выполнены исследования, включающие создание архитектуры автоэнкодера, формирование молекулярной библиотеки потенциальных лигандов белка gp120 ВИЧ-1 для обучения нейронной сети, молекулярный докинг лигандов с белком gp120 и расчет свободной энергии связывания, генерацию молекулярных дескрипторов химических соединений обучающего набора данных, обучение нейронной сети, оценку результатов обучения и работы автоэнкодера.  Рассмотрены результаты тестирования автоэнкодера на широком наборе соединений из молекулярной библиотеки ZINC. Показано, что совместное использование нейронной сети с виртуальным скринингом баз данных химических соединений формирует продуктивную платформу для идентификации базовых структур, перспективных для создания новых противовирусных препаратов, ингибирующих ранние стадии развития ВИЧ-инфекции.

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ 

18-28 909
Аннотация
Трехмерная реконструкция по результатам видеоэндоскопических обследований является перспективным направлением для поддержки медицинской диагностики и планирования терапии широкого спектра патологий. Тем не менее значительную сложность представляет оценка результатов такой реконструкции и проверка соответствия полученной трехмерной модели исходной сцене. В качестве решения этой проблемы предлагается использовать моделирующую среду для эмуляции процесса получения исходных видеоэндоскопических данных по сгенерированной сцене. Рассматривается задача трехмерного моделирования пищевода с использованием среды Autodesk 3ds Max и движка визуализации Arnold, а также задача процедурной генерации текстур для модели. Описывается генерация по подобию с использованием пространственно-периодических генеративно-состязательных моделей на основе сверточных нейронных сетей. Для сравнения результата реконструкции со сценой, сгенерированной при помощи предложенной моделирующей среды, вводится критерий оптимальности, с помощью которого сравниваются отдельные этапы алгоритма трехмерной реконструкции при оптимизации по методу связок.
29-38 675
Аннотация
Анализируется многолинейная система массового обслуживания с повторными попытками и разнородными приборами. Запросы поступают в систему в соответствии с марковским процессом прибытия. Прибывающие первичные запросы и запросы, которые повторяют попытки попасть на обслуживание с орбиты, занимают свободный прибор с самой высокой скоростью обслуживания, если таковой имеется. В противном случае, если все приборы заняты,  запросы переходят на орбиту  бесконечной емкости, с которой осуществляют повторные попытки попасть на обслуживание. Общая интенсивность потока повторных попыток бесконечно возрастает с увеличением числа запросов на орбите. Время обслуживания запроса имеет экспоненциальное распределение с интенсивностью, зависящей от номера прибора. Поведение системы описывается многомерной цепью Маркова с непрерывным временем, которая принадлежит классу асимптотически квазитеплицевых цепей Маркова. Это позволяет вывести простое и прозрачное условие эргодичности и вычислить стационарное распределение вероятностей состояний цепи. Представленные численные результаты иллюстрируют динамику некоторых показателей эффективности системы и важность учета корреляции в процессе поступления запросов.
39-46 709
Аннотация

Рассматривается локальное вейвлет-преобразование c сингулярным базисным вейвлетом. С помощью последовательности локальных вейвлет-преобразований решается задача непараметрической аппроксимации функции. Традиционно считается, что вейвлет должен иметь среднее значение, равное нулю. Ранее автором рассматривались сингулярные вейвлеты, для которых среднее значение не равно нулю. Например, в качестве вейвлета использовались дельтообразные функции, которые участвуют в оценках Парзена – Розенблатта и Надарая – Ватсона. Для сингулярных вейвлетов была построена последовательность вейвлет-преобразований для всей числовой оси и конечного интервала. В работе предлагается последовательность локальных вейвлет-преобразований, дается определение локального вейвлет-преобразования и доказываются теоремы, которые формулируют его свойства. Для подтверждения эффективности алгоритма приводится пример аппроксимации функции с помощью суммы дискретных локальных вейвлет-преобразований.

ЗАЩИТА ИНФОРМАЦИИ И НАДЕЖНОСТЬ СИСТЕМ 

102-108 833
Аннотация

Рассматриваются основные варианты формирования общего секрета с использованием cинхронизируемых искусственных нейронных сетей и возможные модели поведения криптоаналитика. Для решения задачи повышения конфиденциальности формируемого общего секрета, если он будет использоваться в качестве криптографического ключа, предлагается применять смешивание некоторого числа результатов отдельных синхронизаций (свертку). В качестве функции смешивания рассматривается свертка векторов весовых коэффициентов сетей побитовым сложением по модулю 2 всех результатов отдельных синхронизаций. Показывается, что вероятность успеха криптоаналитика уменьшается экспоненциально с увеличением количества слагаемых в свертке и может быть выбрана сколь угодно малой. При этом закон распределения сформированного ключа после свертки близок к равномерному, а равномерность возрастает с увеличением количества слагаемых в свертке.

109-118 1052
Аннотация

Описан алгоритм хеширования данных, основанный на методе хеширования SHA-3 (Secure Hash Algorithm-3). Для увеличения производительности при сохранении безопасности хеширования в алгоритме использованы хаотические отображения. Проведено тестирование исходного и модифицированного алгоритмов на устойчивость к коллизиям, которое показало малую вероятность коллизий. Сделан статистический анализ выходных последовательностей, а также производительности алгоритмов. Проведено тестирование алгоритма с помощью набора статистических тестов SP 800-22, которое показало, что двоичная последовательность, генерируемая предложенным алгоритмом, близка к случайной. Протестирована также производительность алгоритма: скорость хеширования модифицированного алгоритма увеличилась на 60 % по сравнению со скоростью хеширования обычного SHA-3.

ЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ 

47-62 958
Аннотация

Показывается актуальность тестирования современных вычислительных систем, и в первую очередь их запоминающих устройств. Исследования основаны на применении универсального метода генерирования адресных последовательностей с заданными свойствами для многократных маршевых тестов оперативных запоминающих устройств. В качестве математической модели используется модификация экономичного способа Антонова и Салеева для формирования последовательностей Соболя. Для указанной модели приводится структурная схема ее аппаратурной реализации, основу которой составляет запоминающее устройство для хранения направляющих чисел. Множество этих чисел образует порождающую матрицу. Отмечается, что вид порождающей матрицы определяет основные свойства генерируемых последовательностей. Получены математические выражения, позволяющие оценить предельные значения переключательной активности самой последовательности и определенных ее разрядов. Предлагаются методики синтеза генераторов адресной последовательности с заданной переключательной активностью как отдельных ее разрядов, так и последовательности в целом. Рассматриваются примеры использования предлагаемых методик. Обосновывается применимость изложенных результатов для синтеза генераторов тестовых последовательностей с заданной переключательной активностью при тестировании запоминающих устройств и формировании управляемых вероятностных тестовых последовательностей. Приводятся результаты практической реализации генераторов адресных последовательностей и оцениваются их основные характеристики. 

63-77 687
Аннотация
Одним из направлений логической оптимизации многоуровневых представлений систем булевых функций являются методы, основанные на выделении подсистем функций, которые имеют одинаковые части в областях определения функций выделенных подсистем. Такие подсистемы называются связанными. Связанность функций приводит к появлению большого числа одинаковых структурных частей (конъюнкций, алгебраических выражений, подфункций и др.) в оптимизированных формах представления функций, по которым строятся в дальнейшем комбинационные логические схемы. Чем сильнее связаны функции выделенной подсистемы, тем скорее можно ожидать, что в представлениях функций данной подсистемы будет больше одинаковых подвыражений и синтезированные логические схемы будут иметь меньшую сложность.  Описываются программно реализованные алгоритмы выделения подсистем связанных функций из BDD-представления системы булевых функций на основе введенных численных оценок связанности BDD-представлений функций. Связанность заключается в наличии одинаковых частей в областях единичных значений функций системы либо одинаковых уравнений в BDD-представлениях. Такие представления являются компактными формами задания функций и получаются в результате разложения Шеннона функций исходной системы (и получающихся в результате разложения подфункций) по всем своим переменным. Проведенные эксперименты показывают эффективность применения предложенных алгоритмов и программ при синтезе логических схем из библиотечных логических элементов.

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ 

78-86 1140
Аннотация
Приведены результаты анализа двух способов описания голосового сигнала для решения задачи выявления заболеваний гортани. Сравнивались параметры голоса, определяемые клинической системой lingWaves, и параметры, получаемые в результате мел-частотного кепстрального анализа голоса. Для определения пригодности данных параметров при решении задачи выявления заболеваний гортани на их основе строился классификатор с использованием вероятностной модели – логистической регрессии. Для обучения классификатора была записана база голосов 60 человек, 30 из которых составляли контрольную группу, а другие 30 имели различные заболевания гортани (узелки голосовых складок, паралич гортани или функциональную дисфонию). Показано, что точность классификатора на основе мелчастотных кепстральных параметров (83,8 %) выше, чем точность классификатора на основе параметров, полученных в системе lingWaves (60,4 %).
87-101 1309
Аннотация

Приведены данные аналитического и экспериментального анализов 17 функций, используемых для оценки результатов бинарной классификации произвольных данных. Результаты классификации представлены матрицами ошибок размером 2×2. Исследованы поведение и свойства основных функций, вычисляемых по элементам этих матриц. Анализируются варианты классификации со сбалансированными и несбалансированными классами данных. Показано, что между отдельными функциями существуют линейные зависимости. Многие функции инвариантны к транспонированию матриц ошибок, что позволяет вычислять оценки, не уточняя порядок записи данных в эти матрицы.

Доказано, что все классические функции (Sensitivity, Specificity, Precision, Accuracy, F1, F2, GM, индекс Жаккара) чувствительны к дисбалансу классифицируемых данных и искажают оценки при ошибках классификации объектов меньшего класса. Чувствительность к дисбалансу имеется у коэффициента корреляции Мэтьюса и каппы Коэна. Экспериментально показано, что такие функции, как энтропия ошибки (confusion entropy), степень разделимости (discriminatory power) и диагностическое отношение шансов (diagnostic odds ratio), не стоит использовать для анализа результатов бинарной классификации несбалансированных классов. Две последние функции инвариантны к дисбалансу классифицируемых данных, но плохо оценивают результаты с примерно равным суммарным процентом ошибок классификации. Доказано, что площадь под ROC-кривой (AUC) и индекс Юдена, вычисляемые по матрице ошибок бинарной классификации, линейно зависимы и являются наиболее подходящими оценочными функциями для сравнения результатов бинарной классификации как сбалансированных, так и несбалансированных данных.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)