Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Осис Я.Я. Гельфандбейн Я. А. и др.ДИАГНОСТИРОВАНИЕ на граф - моделях на примерах авиационной и автомобильной техники 1991.docx
Скачиваний:
2
Добавлен:
27.11.2025
Размер:
603.77 Кб
Скачать

8.2. Допустимые таблицы, различающая мера, вес признака

Уже отмечалось, что перед решением задачи распознавания

образа распознающая ЭВМ должна быть соответственно ≪обучена

. Для этого в свою очередь необходима обучающая статистика

(обучающая последовательность). Рассмотренные ранее таблицы

Тх и Т° могут служить обучающей последовательностью при

выполнении следующих условий:

столбцы а, (а также и р,) таблиц должны быть признаками

заранее выбранных и обоснованных диагностических параметров;

объекты, представляемые строками таблицы Г1, верифицированы,

т. е. доказана их достоверная принадлежность к классу 1

(соответственно для строк таблицы Т° доказана их достоверная

принадлежность к классу 0) ;

строки таблицы 7м не встречаются в таблице Т°, и наоборот.

Это означает, что рассматриваемые таблицы могут играть

роль эталонных реализаций классов.

Число объектов п\ и п0 в таблицах 7ми Т° может быть различным.

Характерно, что применяемый нами алгебраический

алгоритм способен работать при очень малой статистике.

Обратимся к некоторым формальным положениям. Объединяя

Г1 и г в одну таблицу Т, можно ввести понятие допустимой

и допустимой в узком смысле таблицы.

212

Пусть дано множество М объектов распознавания, относительно

которых производится классификация. Множество М

может быть представлено в виде множества подмножеств М\

М°, Mg, ..., М‘\ g = 1, ..., t, которые в задаче распознавания

образов обычно и называют классами. Элементы множества М

называют эталонами (образцами) объектов распознавания (реализаций)

.

Таблицу Т называют допустимой, если:

существует подмножество Mg, М * сМ , такое, что каждая строка

из Т является элементом одного и только одного подмножества

Mg, т. е. эталоном одного и только одного объекта из Mg;

все строки таблицы Т должны быть различны. Сравниваются

строки по значениям элементов в соответствующих столбцах

и при наличии хотя бы одного несовпадения значений строки

считаются различными.

При этом таблица Т называется допустимой в узком смысле,

если Т является допустимой и, кроме того, для всех объектов Mg

верифицирована принадлежность к g -му классу. В задаче диагностирования

рассматривают лишь допустимые или допустимые

в узком смысле таблицы. Понятие допустимой таблицы позволяет

установить различающую меру —вес признака. Необходимо

также учитывать, что используемый нами тестовый алгоритм

применяется для задач с непересекающимися классами.

Пусть множество объектов М разделено на два класса М 1 и

М°. Для множества М задана допустимая таблица Т, строки

которой являются эталонами для объектов из М 1 и М°. Для всех

объектов множества М верифицирована принадлежность к классу

М 1 или М°. Тогда справедливо:

M = М ' П Л * ° = 0 .

В соответствии с классификацией на два класса таблица Т

распадается на подтаблицы Т' и Т°, где строки подтаблицы Т1

содержат эталоны для объектов (реализаций) М', а строки

подтаблицы Т° —эталоны для объектов (реализаций) класса М°.

Тестом таблицы Т называется набор столбцов {si, ..., sp},

таких, что после удаления всех столбцов из w, за исключением

{si, ..., sp}, в таблице Г' и Т° все строки будут различны. Это означает,

что строки, принадлежащие разным классам, не совпадают.

Тест для таблиц эталонов (Т и Т°) называют тупиковым,

если после удаления из него любого столбца он перестает

быть тестом для Т] и Т°.

Тупиковый тест —это минимальное, несжимаемое описание

распознаваемых классов. Однако оно содержит необходимую

информацию о разделении на классы. Тупиковых тестов может

быть достаточно много, чем в большее число тупиковых тестов

входит признак, тем он важнее.

213

Рассмотрим пример:

Г =

Y'O_

а1 а2 о с3 а4 а5

т1

О I I) 1 о

0 1 1 1

1 0 1 1 0

Pi Рг Рз 04 Рб

1 0 0 0 1

0 1 0 0 0

1 1 1 1 0

Наборы столбцов (si, s2 , s4} и {s2, S3 , s4} являются тупиковыми

тестами (алгоритм 8.1) для таблиц Т1 и Т°, т. е. таблицы (Г1)' и

(Г0)', составленные из столбцов, вошедших в соответствующие

наборы, не имеют между собой равных строк1.

Для набора jsi, S2, s4} получаются следующие таблицы:

(Г) =

1 а2 а4 Pi Р2 Р4

0 1 1

; (Т°) =

1 0 0

1 0 1 0 1 0

1 0 1 1 1 1

набора {≪2, S3 , s 4} соответственно

а 2 а з “ 4 Р2 Рз 04

1 0 1 ; ( Т°)" =

0 0 0

0 1 1 1 0 0

0 1 1 1 1 1

(Т') =

Удаление любого столбца из (Г 1)' и (Т°)' приводит к наличию

одинаковых строк в них.

Пусть k —число тупиковых тестов допустимой в узком смысле

таблицы Т, а —число тупиковых тестов таблицы, в которые

входит столбец, соответствующий признаку s,.

Число

/ ? (* )= - р ≪=1, w (8.4)

называют различающим весом признака si. Множество различающих

весов признаков R(s 1), ..., R(Si), ..., R(sw), определяя раз-