Мера различия для тестовых наборов при генерировании управляемых вероятностных тестов
https://doi.org/10.37661/1816-0301-2022-19-4-7-26
Аннотация
Цели. Решается задача построения характеристик различия тестовых наборов, представляющих собой наборы символов, включая двоичные наборы. Обосновывается ее актуальность для генерирования управляемых вероятностных тестов и сложность нахождения мер различия для символьных тестов. Показывается ограниченность применения расстояния Хэмминга и Дамерау – Левенштейна для получения меры различия тестовых наборов.
Методы. На основе характеристики интервала, применяемого в теории строя цепи последовательных событий, определяется новая мера различия двух символьных тестовых наборов. В качестве меры различия рассчитывается расстояние AD(Ti, Tk) между тестовыми наборами Ti и Tk, использующее характеристику интервала и основанное на определении независимых пар одинаковых (тождественных) символов, принадлежащих двум наборам, и вычислении интервалов между ними.
Результаты . Показывается комбинаторный характер вычисления предложенной меры различия для символьных тестовых наборов произвольного алфавита и размерности. Приводится пример вычисления данной меры для различных видов тестовых наборов, в том числе таких, как адресные тестовые наборы. Показываются возможные ее модификации и определяются некоторые свойства и ограничения. Рассматривается применение данной меры различия для случая многократного тестирования запоминающих устройств на основе адресных последовательностей pA с четным p повторением адресов. Для случая p = 2 приводятся математические соотношения вычисления интервалов и расстояния AD(Ti, Tk) для последовательностей адресов 2A, используемых для управляемого вероятностного тестирования запоминающих устройств. Основное внимание уделяется двоичным тестовым наборам, для которых задача вычисления данной метрики различия сводится к классической задаче о назначениях с использованием венгерского алгоритма. Вычислительная сложность венгерского алгоритма оценивается соотношением O(n4). Как альтернатива венгерскому алгоритму предлагается алгоритм вычисления рассматриваемой меры, сложность которого существенно меньше и имеет оценку O(n2). Проведенные экспериментальные исследования подтверждают эффективность рассмотренного алгоритма.
Заключение. Предложенная мера различия расширяет возможности генерирования тестовых последовательностей при генерировании управляемых вероятностных тестов. Показано, что тестовые наборы, неразличимые при использовании в качестве меры различия расстояния Хэмминга, имеют различные значения AD(Ti, Tk), позволяющие более точно классифицировать формируемые случайным образом наборы, которые являются кандидатами в тестовые наборы.
Ключевые слова
Для цитирования:
Ярмолик В.Н., Петровская В.В., Мрозек И. Мера различия для тестовых наборов при генерировании управляемых вероятностных тестов. Информатика. 2022;19(4):7-26. https://doi.org/10.37661/1816-0301-2022-19-4-7-26
For citation:
Yarmolik V.N., Petrovskaya V.V., Mrozek I. A measure of the difference between test sets for generating controlled random tests. Informatics. 2022;19(4):7-26. (In Russ.) https://doi.org/10.37661/1816-0301-2022-19-4-7-26