БИОИНФОРМАТИКА
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рассматривается локальное вейвлет-преобразование c сингулярным базисным вейвлетом. С помощью последовательности локальных вейвлет-преобразований решается задача непараметрической аппроксимации функции. Традиционно считается, что вейвлет должен иметь среднее значение, равное нулю. Ранее автором рассматривались сингулярные вейвлеты, для которых среднее значение не равно нулю. Например, в качестве вейвлета использовались дельтообразные функции, которые участвуют в оценках Парзена – Розенблатта и Надарая – Ватсона. Для сингулярных вейвлетов была построена последовательность вейвлет-преобразований для всей числовой оси и конечного интервала. В работе предлагается последовательность локальных вейвлет-преобразований, дается определение локального вейвлет-преобразования и доказываются теоремы, которые формулируют его свойства. Для подтверждения эффективности алгоритма приводится пример аппроксимации функции с помощью суммы дискретных локальных вейвлет-преобразований.
ЗАЩИТА ИНФОРМАЦИИ И НАДЕЖНОСТЬ СИСТЕМ
Рассматриваются основные варианты формирования общего секрета с использованием cинхронизируемых искусственных нейронных сетей и возможные модели поведения криптоаналитика. Для решения задачи повышения конфиденциальности формируемого общего секрета, если он будет использоваться в качестве криптографического ключа, предлагается применять смешивание некоторого числа результатов отдельных синхронизаций (свертку). В качестве функции смешивания рассматривается свертка векторов весовых коэффициентов сетей побитовым сложением по модулю 2 всех результатов отдельных синхронизаций. Показывается, что вероятность успеха криптоаналитика уменьшается экспоненциально с увеличением количества слагаемых в свертке и может быть выбрана сколь угодно малой. При этом закон распределения сформированного ключа после свертки близок к равномерному, а равномерность возрастает с увеличением количества слагаемых в свертке.
Описан алгоритм хеширования данных, основанный на методе хеширования SHA-3 (Secure Hash Algorithm-3). Для увеличения производительности при сохранении безопасности хеширования в алгоритме использованы хаотические отображения. Проведено тестирование исходного и модифицированного алгоритмов на устойчивость к коллизиям, которое показало малую вероятность коллизий. Сделан статистический анализ выходных последовательностей, а также производительности алгоритмов. Проведено тестирование алгоритма с помощью набора статистических тестов SP 800-22, которое показало, что двоичная последовательность, генерируемая предложенным алгоритмом, близка к случайной. Протестирована также производительность алгоритма: скорость хеширования модифицированного алгоритма увеличилась на 60 % по сравнению со скоростью хеширования обычного SHA-3.
ЛОГИЧЕСКОЕ ПРОЕКТИРОВАНИЕ
Показывается актуальность тестирования современных вычислительных систем, и в первую очередь их запоминающих устройств. Исследования основаны на применении универсального метода генерирования адресных последовательностей с заданными свойствами для многократных маршевых тестов оперативных запоминающих устройств. В качестве математической модели используется модификация экономичного способа Антонова и Салеева для формирования последовательностей Соболя. Для указанной модели приводится структурная схема ее аппаратурной реализации, основу которой составляет запоминающее устройство для хранения направляющих чисел. Множество этих чисел образует порождающую матрицу. Отмечается, что вид порождающей матрицы определяет основные свойства генерируемых последовательностей. Получены математические выражения, позволяющие оценить предельные значения переключательной активности самой последовательности и определенных ее разрядов. Предлагаются методики синтеза генераторов адресной последовательности с заданной переключательной активностью как отдельных ее разрядов, так и последовательности в целом. Рассматриваются примеры использования предлагаемых методик. Обосновывается применимость изложенных результатов для синтеза генераторов тестовых последовательностей с заданной переключательной активностью при тестировании запоминающих устройств и формировании управляемых вероятностных тестовых последовательностей. Приводятся результаты практической реализации генераторов адресных последовательностей и оцениваются их основные характеристики.
ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ
Приведены данные аналитического и экспериментального анализов 17 функций, используемых для оценки результатов бинарной классификации произвольных данных. Результаты классификации представлены матрицами ошибок размером 2×2. Исследованы поведение и свойства основных функций, вычисляемых по элементам этих матриц. Анализируются варианты классификации со сбалансированными и несбалансированными классами данных. Показано, что между отдельными функциями существуют линейные зависимости. Многие функции инвариантны к транспонированию матриц ошибок, что позволяет вычислять оценки, не уточняя порядок записи данных в эти матрицы.
Доказано, что все классические функции (Sensitivity, Specificity, Precision, Accuracy, F1, F2, GM, индекс Жаккара) чувствительны к дисбалансу классифицируемых данных и искажают оценки при ошибках классификации объектов меньшего класса. Чувствительность к дисбалансу имеется у коэффициента корреляции Мэтьюса и каппы Коэна. Экспериментально показано, что такие функции, как энтропия ошибки (confusion entropy), степень разделимости (discriminatory power) и диагностическое отношение шансов (diagnostic odds ratio), не стоит использовать для анализа результатов бинарной классификации несбалансированных классов. Две последние функции инвариантны к дисбалансу классифицируемых данных, но плохо оценивают результаты с примерно равным суммарным процентом ошибок классификации. Доказано, что площадь под ROC-кривой (AUC) и индекс Юдена, вычисляемые по матрице ошибок бинарной классификации, линейно зависимы и являются наиболее подходящими оценочными функциями для сравнения результатов бинарной классификации как сбалансированных, так и несбалансированных данных.
ISSN 2617-6963 (Online)