
книги из ГПНТБ / Горелик, А. Л. Некоторые вопросы построения систем распознавания
.pdf
об ъекта ш — X , = Х ° , |
X N__k— \X°N_ k. П усть, кроме то |
го, из тех или других соображений можно полагать, что наиболее вероятные значения признаков объекта, кото рые экспериментально определить не удалось, таковы
у |
__ у* |
у |
__ у* |
у __ у* |
£+1 |
Л |
N —Ä + P Л іѴ—Ä+2 |
Л N —k + 2 1 |
^ ЛГ |
Наличие указанных данных позволяет определить значения априорных условных плотностей распределе ния значений признаков Xlt. . . , по классам й г-, і = = 1,. .. , т, т. е. функций
и ( К .... К N —k ' |
X 1 |
X* ) |
N—k+V |
Л ЛѴ- |
Решающее правило может быть основано на крите рии максимума апостериорной вероятности. Для этого необходимо определить значения апостериорных веро ятностей
...... |
К-** * ѵ * +і. - |
- |
||
P V â h i x l ..... |
x*N_k+1................... |
|
x*N) |
|
m |
|
|
|
(4.39) |
S |
. . . .X.°N. . k. |
, X * N _ k + x . . . . , N * K) |
||
а затем определить |
|
|
|
|
- . х Ц , . |
X V , . ........X V = |
|||
= гаахР(П. | Х ; ........ |
Х Ц , . |
X V |
, . .......... |
|
•••> |
X*N), i = 1, ..., |
m. |
(4.40) |
При рассмотрении этих задач предполагалось, как и выше, что сц = С2 2 = 0 , а с12 = с21 .
4.7.ПРИМЕНЕНИЕ МЕТОДА МОНТЕ-КАРЛО ДЛЯ ОЦЕНКИ ЭФФЕКТИВНОСТИ ВЕРОЯТНОСТНЫХ СИСТЕМ
РАСПОЗНАВАНИЯ
Для оценки эффективности вероятностных систем распознавания может быть использован метод статисти ческих испытаний. Основой для проведения таких испы таний может служить математическая модель, структур ная схема которой представлена на рис. 4.3.
7 * |
99 |
Рис. 4.3.
Принцип действия модели состоит в следующем. Для проведения каждого испытания осуществляется фор мирование модели объекта, принадлежность которого к определенному классу заранее известна. Формирова ние объекта в модели производится с помощью модели рования совокупности численных значений признаков,
как непрерывных Г,так и дискретных т/ ( а = 1 , . .. Д;
ß—1, .. . , р). Многократное повторение этой процедуры позволяет определить количество правильных и непра вильных решений задачи распознавания, число отказов системы от решения задачи и неоднозначных решений. При этом эффективность системы распознавания можно характеризовать предельной величиной отношения ко-
100
личества правильных ответов тѴпр к общему числу испы таний N:
К = lm(NaVfN). |
(4.41) |
Л ? - » с о |
|
На практике число испытаний N определяется довери
тельной вероятностью, задаваемой при формулировке задачи исследования.
При построении модели для обеспечения ее адекват ности реальной системе распознавания в качестве апри орных данных в модели необходимо использовать те же
значения функций f;(Sa), Р(т)Э/г) и Р(П,), z' = l , . . . , т,
которые применяются в моделируемой системе.
В блоках модели первоначально производится обра ботка статистического материала для получения априор
ных характеристик классов /у (Г) и P(-rf|,-). Пусть при
нято разбиение всей совокупности объектов на т клас
сов в соответствии с заранее выбранным принципом классификации. Априорная информация представляется в виде т таблиц (табл. 4.1).
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
|
4.1 |
Н |
о |
м |
е |
р |
а |
|
/ - й |
к л а |
с |
с |
|
|
о |
б ъ |
е |
к |
т |
|
|
7 |
) 1 |
|
|
|
|
|
1 |
|
|
е |
і |
E |
i |
|
|
|
. . . |
|
|
|
|
|
|
|
|
|
|
||||
|
2 |
|
|
І |
2 |
І 2 |
|
■ » J a |
■ » J a |
• |
■ |
|
|
|
|
|
|
|
|
|
|
|
|
. |
. • |
|
N |
|
|
? |
л г |
? N |
|
V N |
T n |
|
|
|
|
|
|
|
|
|
|
Алгоритмы построения функций ft- (£“) и Р | г) изложе
ны в гл. 2. Формирование объекта проводится в три этапа.
Первый этап — определение номера класса объекта, поступающего на вход алгоритма распознавания. Для этого вырабатывается реализация случайной величины і, (= 1, 2, ..., т на основе известной априорной вероятно
сти появления объектов г-го класса Р (й г). Технически
101
процедура реализуется следующим образом. Подсчиты ваются промежуточные величины
т
Рг = Р(Р->), Р, = Р($,) + Р № , - , р т = 2 , Р т (4.42)
»•=1
С помощью датчика случайных чисел, равномерно рас
пределенных в интервале Оч-l, получаем число |
Класс |
||
формируемого объекта определяется из условий: |
|||
г = 1, |
если |
0 < q l < p 1, |
|
І — 2, |
если |
р2, |
(4.43) |
|
|
|
|
і = т, |
если |
P m . ^ q ^ P m - |
|
Полученное значение і |
определяет набор |
функций |
fi (äf) и Р (т]31і), используемых на втором и третьем эта
пах моделирования.
Второй этап состоит в установлении величины каж
дого признака 5“, а —. 1, ... , Я. |
Генерируется |
последова |
тельность случайных чисел X я, |
k = \ , 2, ..., |
непрерывно |
распределенных в интервале [0,1] с функцией плотности
?г(Ха), соответствующей |
функции /г-(іГ) на интервале |
№шіп~АЛ ; (С ах+А2^)}г- |
Здесь Д^“ и Д2Г — величины |
расширения интервала существования реального признака
объекта влево от минимального и вправо |
от максималь |
|
ного значения признака Г по оси |
(см. |
§ 2.1). Далее |
выбираются все пары последовательно получаемых слу
чайных чисел (X“, X“ ), для которых проверяется |
спра |
ведливость неравенства |
|
где |
|
Г< = ? № Ш Ѵ і ( Г ) 1 аах- |
(4.44) |
При выполнении неравенства считаем, что очередное число X я= X* . Переход от безразмерной величины X я
к значению Г осуществляется по формуле
? = ** RLx - А.^ + АЛ + А^ . (4-45)
Здесь индекс і для простоты опущен.
102
Третий этап формирования объекта состоит в полу чении дискретного признака i f ; этот этап технически
реализуется по «схеме жребиев», т. е. аналогично пер вому этапу, а именно, вычисляются количества
А = -Р (і)р = |
1 10, |
|
|
|
|
Рз — Р (у13— 1 I О Р (г? ~ |
2 10> |
|
(4.46) |
||
= Р (Т]? = |
1 I /) -I- Р (7)?= |
2 I0 + |
... Р = S Iі), |
||
где 5 — число возможных значений признака |
if. |
||||
Если случайное число |
у,, вырабатываемое |
датчиком |
|||
случайных чисел, |
|
|
|
|
|
0 < д 2< Рі, |
то |
if = |
\ |
(4>47) |
Рі < <7г <С А> т0 Т(р = 2 и т. д.
После того как объект сформирован значениями прису щих ему признаков, информация о нем поступает в блок классификации. В зависимости от характера исследова ния эта информация подвергается той или иной обработ ке («ухудшается» в соответствии с точностными харак теристиками средств измерения, ограничивается ввиду отсутствия тех или других средств определения при знаков и т. д.). В блоке классификации определяется класс объекта при условии, что истинный номер класса, к которому принадлежит объект, не сообщается алгорит му распознавания. Найденный в результате работы блока номер класса, к которому отнесен объект, сопоставляется с истинным номером, т. е. с тем, который задавался на первом этапе формирования объекта. При совпадении номеров результат испытания положителен, при несовпа дении — отрицателен.
Выходной блок модели определяет правильность рас познавания объекта и систематизирует соответствующую информацию для подсчета оценок эффективности распо знавания по большому количеству испытаний.
При заданных функциях fz- (?“), Р (if\i) и Р (Пг) и заданном
алгоритме распознавания рассмотренная модель позво ляет оценить, как изменяется эффективность системы распознавания в зависимости от объема и качества апо стериорной информации о распознаваемых объектах.
103
Другими словами, модель позволяет построить поверх ности уровня для величин (4.41), рассматриваемых как функции
|
К = |
К(?, гД з^а , 3^), |
|
(4.48) |
|
где параметры з ^ |
|
и з ? характеризуют |
точности |
опре |
|
деления |
признаков |
объекта Г и тД В качестве з^, ... |
|||
..., з х ; з |
, ..., з |
могут фигурировать, |
например, |
сред- |
ние квадратические ошибки определения признаков
S1...... 5х; 41. /■-
Сведения, содержащиеся в (4.48), являются исходны ми для решения целого ряда задач об определении со става технических средств наблюдения системы распо знавания, необходимой точности их работы, об оптималь ном с точки зрения экономических соображений распре делении точности по средствам и т. д. Таким образом, эксперименты со статистической моделью системы распо знавания позволяют без обращения к натурным экспери ментам решать важные задачи, связанные с построением систем распознавания.
II.ЛОГИЧЕСКИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ
5. ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ АЛГЕБРЫ ЛОГИКИ
5.1. ВВЕДЕНИЕ
Методы алгебры логики (исчисления высказываний), по существу, необходимы для исследования ряда важных задач из самых различных областей: биологии, медици ны, военного дела, автоматики, управления, планирования экспериментов и т. д. — и вообще всюду, где сущест венны не только количественные соотношения между ве личинами, характеризующими рассматриваемые процес сы, но и связывающие их логические зависимости.
Новой областью приложения методов алгебры логи ки, обозначившейся в последнее время, является пробле ма распознавания объектов. В этой проблеме методы алгебры логики выступают на передний план в двух слу чаях: когда отсутствуют сведения о количественном рас пределении объектов по пространственным, временным, весовым, энергетическим или каким-либо другим интер валам в соответствующем пространстве признаков, а в распоряжении исследователя имеются лишь детерми нированные логические связи между рассматриваемыми объектами и их признаками;
когда распределение объектов в пространстве при знаков известно, законы распределения ошибок изме рения величин, характеризующих отдельные объекты, также заданы, но логические зависимости, связывающие признаки и классы объектов, сложны и не поддаются не посредственному анализу.
Примерами задач, для решения которых требуется применение методов алгебры логики, могут служить:
распознавание типа объекта на основе данных наблю дения и известных априорных зависимостей между типа ми объектов и соответствующими признаками;
установление различных совокупностей признаков распознаваемого объекта, учет которых наряду с уже известными приводил бы к определенному заключению о типе объекта;
анализ информации, содержащейся в каком-либо до кладе или сообщении и относящейся к определенным ти
105
пам объектов, с целью определить, какие выводы можно сделать о данных объектах на основании полученного сообщения;
выбор технической политики предприятия, направ ленной на достижение определенного экономического эффекта, если известны некоторые общие закономернос ти, связывающие, например, отдельные изменения в об ласти технологии производства с расходами на рекламу, наличием запасов сырья и товаров, уровнем производи тельности труда, снижением себестоимости продукта и объемом сбыта;
задачи прогноза погоды; выявление закономерностей, связывающих определен
ные типы объектов и их признаки (задача обучения). Вместе с тем, в настоящее время имеется сравнитель
но немного работ, где предпринимается попытка приме нить аппарат алгебры логики к решению задач распоз навания объектов [13— 17]. Это объясняется, с одной стороны, тем, что широкий круг инженеров не в доста точной степени знаком с вычислительными методами алгебры логики и, с другой — некоторой трудностью стандартного применения этих методов к решению логи ческих задач с числом элементов порядка 20 и более.
Применение методов алгебры логики, основанное на использовании ЭВМ, для решения различных практичес ких задач может принести ощутимую пользу. Для того чтобы привлечь внимание инженеров к этим методам, мы стремились доступно и систематически изложить их и показать, как ими пользоваться в тех нетривиальных случаях, когда без формального аппарата невозможно получить какие-либо значительные результаты.
В гл. 5 изложены фундаментальные идеи, лежащие в основе вычислительных методов алгебры логики и свя занные с понятиями изображающего числа булевой функции, базиса и сокращенного базиса. Эта глава пред ставляет собой переработанный (иногда весьма значи тельно) и дополненный новыми примерами материал некоторых разделов книги [13], с чтения которой началось наше знакомство с данным предметом. Эта глава долж на ввести читателя в круг основных понятий и идей исчисления высказываний и обрисовать в общих чертах область приложений данного математического аппарата, связанную главным образом с задачами построения ло гических систем распознавания объектов.
106
5.2.ОСНОВНЫЕ ПОНЯТИЯ АЛГЕБРЫ ЛОГИКИ. ФОРМУЛЫ БУЛЕВОЙ АЛГЕБРЫ
По определению, алгеброй *) называется непустое
множество элементов, являющееся ее областью, вместе с некоторым заданным набором операций, которые мож но совершать над элементами, не выходя за пределы области. Область алгебры логики состоит из множества высказываний. Высказыванием называется законченное
предложение, которое может иметь два значения истин ности: быть либо истинным, либо ложным. Например,
высказывание «пять —■четное число» |
является |
ложным, |
||
а |
высказывание |
«логика — наука |
о законах |
мышле |
ния» — истинным. |
Высказывания обозначаются |
буквами |
||
А, |
В, С, .... К, X, |
У, ... или буквами с индексами Аи |
||
А2, |
..., В і, В2, ... |
|
|
|
В качестве операций над высказываниями, с по мощью которых из данных высказываний можно полу чить новые, в рассматриваемой нами алгебре исполь зуются логическое умножение, или конъюнкция, логиче ское сложение, или дизъюнкция, и отрицание.
Логическое умножение совершается по крайней мере
над двумя высказываниями, что соответствует комбина ции этих двух высказываний при помощи связки И и обозначается знаком «•», например, А-В читается «А и Ву>. П о определению, высказывание А-В истинно тогда и только тогда, когда истинны и А, и В одновременно. На
пример, конъюнкция двух высказываний: «самолет — это летательный аппарат»-«прямое попадание мощного сна ряда в цель приводит к поражению цели» является истинным, тогда как. конъюнкция «три — четное чис ло»-«применение танков целесообразно» ло^кна.
Логическое сложение совершается по крайней мере
над двумя высказываниями, соответствует объединению этих двух высказываний при помощи связки ИЛИ и обо значается знаком « + », например, А + В читается «А или В». По определению, высказывание А + В истинно, когда истинно либо только одно А, либо только одно В, либо А я В вместе. Например, высказывание «танки могут
остановить наступление пехоты» + «собака — насекомое» истинное. Дизъюнкция А + В ложна тогда и только тогда, когда А ложно и В ложно.
*> Точнее, абстрактной алгеброй.
107
Операция отрицания в отличие от умножения и сло
жения может совершаться над одним высказыванием. Эту операцию мы будем обозначать чертой над буквой, например, Л читается «не Л». По определению, высказы вание Л истинно тогда и только тогда, когда А ложно.
Как мы уже отметили, высказывания являются эле ментами области алгебры логики и поэтому наряду со словом «высказывание» мы часто будем употреблять термин «элемент». В результате применения операций конъюнкции, дизъюнкции и отрицания к некоторому исходному набору элементов А, В, С, ... возникают но вые комбинированные элементы X, У, ..., которые назы ваются булевыми функциями*~> от элементов А, В, С, ...
Чтобы подчеркнуть зависимость функций от данных эле ментов, часто пишут: Х(А, В, С, ...), Y(A, В, С,
Рассмотрим _две особо важные булевы функции А + + В и A - B+Ä - B, с помощью которых выражаются опре деленные связи между элементами А и В.
Предположим, что булева функция Ä + B истинна.
Тогда в соответствии с определённей операций дизъюнк ции и отрицания заключаем, что если А истинно, то В тоже истинно, если В ложно, то А также ложно. Однако
если В истинно, то А может быть как |
истинно, так и |
|||
ложно. Такую зависимость между |
А |
и В |
называют |
|
импликацией и записывают также |
в виде: А— >В, |
чи |
||
тается «если А, то В» или «из Л_ следует В». |
Тогда |
из |
||
Пусть высказывание А - В + А - В |
истинно. |
определения операций над высказываниями следует, что А и В имеют одинаковые значения истинности, т. е. А и В либо оба истинны, либо оба ложны. Такая зависимость между А и В называется эквивалентностью и записы вается в виде А = В, читается «А эквивалентно В». Если
А = В, |
то какова бы ни была булева |
функция f(A, U, |
|||
V, |
...) |
справедливо соотношение |
f(.4, |
U, |
V, .. . )=f(B, |
U, |
V, ...), что можно записать в виде |
|
|
||
|
|
( A = B ) — >{f(A, U, V, |
(В, |
U, |
V, ...)]. (5.1) |
Среди всех булевых функций можно выделить та кие, которые остаются истинными, независимо от того, какие значения истинности принимают входящие в эти
функции |
элементы, |
например, Л+Л, А - В —А, |
а также |
*> Рассматриваемая |
нами алгебра впервые была |
исследована |
|
Дж. Булем |
(1815—1864). |
|
|
108