книги из ГПНТБ / Виноградов Р.И. Автоматическое опознавание электрических сигналов
.pdf90
на основании единичных опознавательных признаков. Поэтому опо знавание простых предметов происходило легко, а адекватное вос приятие изображений, имеющих неоколько однотипных элементов, делало опознавание невозможным. Обнаружено, что больной не мо жет осуществить последовательное рассмотрение нескольких эле ментов, если он не в состоянии схватить их в комплексе. Дела ется вывод, что для проолеживания изображения необходимо, по крайней мере,(Два возбужденных пункта.
Рассматриваются случаи сокращения зрительных путей до тан называемого "трубчатого зрения" при условии, что зрительная вора остается сохранной. В этом случае прослеживающее движение глее служит ооновным средством компенсации зрительного дефек та [59].
При ловвльном повреждении определенного участка зрительной воры наблюдается избирательное нарушение способности читать буквенный текст, но сохраняется способность различать числа. Замечено, что темой больной, обводя буквы по контуру, может воспринимать их значения. Возможность воспринимать цифры и не возможность воспринимать буквы свидетельствует о том, что они принадлежат к различным алфавитам.
Зрительное восприятие объектов обусловливается комплексной работой ряда отделов мозга. Особое значение имеет корновый центр зрения, который располагается в области "борозды птичьей шпоры" и представляет собой 17-е мозговое поле, куда непосред ственно проецируется зрительный образ, попадающий на сетчвтку гнева. Если повредить эту честь мозга, человек перестает ви деть, а нарушение 18-го и 19-го полей приводит к потере чело веком способности узнавэть объекты, хотя он их и видит.
Существенным является то, что глаз производит дискретиза цию информации, передаваемой в мозг, причем определенная ча стота следования кедров обеспечивает их слияние. Однако не вся информация, поступающая на сетчатку глаза, передается в мозг. В сетчатке глаза производится первоначальная обработке по вы делению из изображений основной информации и только последняя передается в мозг. Реагирование глаза лишь на изменение свето вого потока, независимо от того, произошли ли эти изменения за счет движения глаза или по другим причинам, позволяет вы делить границы изображения, т .е . его контур, в котором сосре доточена главная информация изображения. Выделение контуров
91
происходит по всем направлении, что обеспечивается движениями глаза вертикально, горизонтально и врэцэтельно. Знание конту ров зачастую оказывается достаточным для узнавания зрительных образов. Характерно, что рисунки первобытного человека были контурными изображениями [бО].
Контур может быть представлен в виде совокупности простей ших конфигураций: отрезков прямых линий, углов и т .п . В зри тельной системе животных обнаружены клетки, реагирующие на форму линий и простейших конфигураций. В зрительной коре моз
га дошки и обезьяны обнаружены клетки сложных рецептивных по лей, реагирующие на одинаково ориентированные, но взаимно сме щенные отрезви, а также найдены клетки, служащие для обнаруже ния прямолинейных отрезков нонтуров, реагирующих на ориентацию этих отрезков. Совокупностью таких ориентированных отрезков можно описвть с достаточной степенью точности границы любого сложного изображения. Наличие таких полей позволяет объяснить независимость изображения от параллельного переноса [61].
Заслуживает внимания предположение известного английского физиологе Грэйя Уолтера, который считает, что живой экрвн в 17тм поле зрительного отдела мозга подвергается как бы ощупы ванию или, вернее,имеет меото последовательное считывание имею щейся информации о последующей рассылкой ее в другие отделы мозга. Причем одновременно происходит как бы "снятие" изобра жения. Проводимые эксперименты делают похожим данное предпо ложение не истину. Удалось обнаружить, что мозг как бы расчле няет поступающую информацию об изображении. Создается впечат ление наличия какого-то развертывающего устройства. Имеет ме сто также последующее синтезирование этих отдельных чаотей [62].
Выдвигаются гипотезы наличия условных обозначений у элемен тарных геометрических фигур, которые закладываются от природы. Безусловно, нав зрительный набор образов формируется в тече ние всей навей жизни, во формирование сложных образов проис ходит на базе заложенных в мозг простых образов.
Имеются предположения, что мозг при опознавании обрезов производит выборочную оценку признаков, не сравнивая всех де талей изображения с хранящимися в памяти "эталонами", если в этом нет необходимости. Важнейшей особенностью мозге явля
ется способность отбирать из всего бесконечного потока инфор маций, действующего на него, тольхо нужную, полезную [63].
92
И.П. Павлов, создавший стройное учение об анализаторах, указывал, что "для выработки представления о действительной величине предмета" требуется вместе с определенной величиной изображения на сетчатке "известная работе наружных и внутрен них мыщ глаза". Связь ретинального изображения и напряжения внешних глазных нннц осуществляется по принципу установочного рефлекоа.
Если удалить ядро двигательного анализатора, то наблюда ется нарушения зрительной функции. Наступившая слепота обус ловливается нарушением мышечного чувства гневных мышц. Почтн с самого рождения человеке зрительная и двигательная системы находятся в постоянном и очень тесном взаимодействии. В резуль тате этого в процессе жизни образуется множество связей между корковыми отделами зрительного и двигательного анализаторов.
Уделение ядра двигательного анализатора ведет к нарушению этих связей, что сразу же отражается на зрительной функции - нару шает ее нормальное протекание [б4, 65].
Большую я интересную экспериментальную работу по изучению функций глаз проделал А.Л.-Ярбус [58, бб ]. Отмечается, что при рассмотрении неподвижных объектов движения глаз носят только
СК8 ЧК0 0 бр8 8 НЫЙ ХЭрЭКТбр. При ВОСПРИЯТИИ К8 КОГО-ЛИбО ОбЪвКТв
глаза человека фиксируют те элементы объекта, которые несут наибольшее количество информации. Чен больше информации содер жится в элементе, тем дольше на нем останавливаются глаза.Ори гинально проведенные опыты с изображением, неподвижным относи тельно сетчатки, показали, что видимые различия изображения исчезают, если оно становится неподвижным относительно сетчат ки. Неподвижное изображение становится видимым, если оно осве щается мелькающим светом.
Несмотря на то , что физиологи хорошо изучили работу зри тельного аппарата, они ничего не могут сназвть о том, каким образом мы отличвем одни предметы от других, как запоминается образ эвэкомого нам объекта, хотя попытки разгадать, квк мозг различает предметы, ведутся давно.
Результаты экспериментальных работ биологов переплетаются о работами психологов. Многие выводы совпадают, и это может являться подтверждением правильности полученных результатов.
93
§ 3 .4 . Метод автоматического опознавания изображений
геом етрических Фигур и возможный путь его реализации
Всущности предлагаемый метод достаточно прост, однако ре ализация его немыслимв бее использования электронных вычисли тельных машин.
Воснове этого метода заложены два главных принципа, ко торые использовались для опознавания электрических сигналов и описаны в цервой главе.
Всоответствии с первым принципом, базирующимся на мето дах теории подобия, в качестве универсальных признаков исполь зуются инварианты групповых преобразований,
Всоответствии со вторым принципом производится учет взаи мосвязей между отдельными инвариантными признаками.
Реализующее данный метод опознающее устройство решает две тесно связанные, но различные по характеру задачи:
1)производит выделение из полученной информации о конту ре опознаваемой фигуры инвариантных признаков, т .е . осущест вляет анализ;
2)делает заключение на основании результатов сравнения этих связных признаков с признаками эталонов, хранящихся в запоминающем устройстве, о принадлежности данного объекта к одному из классов определённого эталона, т .е . производит син тез.
Основными предпосылками для реализации данного метода яв
ляются:
1) опознавание изображений фигур должно включать опе рации по выделению контуров, их фильтрации и препари рования;
2)изображение контура любой фигуры должно представляться
ввиде совокупности прямолинейных отрезков.
Представление криволинейного контура в виде ломаной линищ может осуществляться с помощью метода скользящей касательной, ноторнй позволяет выделить на кривой ряд точек, инвариантных относительно преобразований координат.
Во-первых, точки специального типа, 8 именно: точки пере
гиба и особые точки. |
К особым точкам относятся: |
|
а) |
узловые |
точки, в которых происходит самопересечение |
кривых; |
* |
|
94
б) точки возврата, ипи заострения, в которых направление кривой меняетоя не обратное;
в ) точки излома 5, б; г ) точки самоприкосновения;
д) точки прекращения I , 7 и др.
Во-вторых, точки,выделенные на кривой о помощью касатель ной 2,3 и 4, коллинеарной хорде, соединяющей две ближвйщие ин вариантные относительно возможных преобразований точки этой кривой (ри с,3 .1 ).
Геометрическое описание контурных линий фигур, состоящих И8 совокупности прямолинейных отрезков, можно представить в виде упорядоченной'конечной последовательности параметров этих
отрезков, отнесенной |
к определенной системе координат. |
|
V , |
||||||
|
Если |
обозначить геометрическое описание |
контура через |
||||||
а прямолинейные отрезки, образующие контур, |
через |
L- , |
то |
гео |
|||||
метрическое описание изображения контура, расположенного |
на |
||||||||
неподвижной плоскости, можно представить в следующем виде: |
|
||||||||
где |
о |
означает, что |
Ьт предшествует |
Lm+I, |
|
х |
я у |
- теку |
|
щие координаты уравнений пряных линий, |
а п |
- |
количество |
пря |
|||||
молинейных отрезков, |
образующих данный |
контур. |
|
|
|
|
|||
|
Такое геометрическое описание однозначно определяет разме |
||||||||
ры и геометрическую форму контура, а также его |
расположение |
||||||||
на |
заданной плоскости. |
|
|
|
|
|
|
||
F
95
Для того чтобы геометрическое описание контура быно ин вариантно по отношению к ортогональному преобразованию "пере нос” , необходимо выразить прямолинейные отрезки контура через их длины и углы наклона. Обозначая длину отрезков через L , а углы - через oL , получим
Г = [ L( »0ll » > V <*2> *-'*> L n d n] ’
где L ■ есть расстояние между двумя крайними точками прямых, определенных при помощи декартовой прямоугольной системы ко ординат.
Геометрическое описание контура, инвариантное также по от ношению к ортогональному преобразованию "поворот", выражаем в виде упорядоченной конечной последовательности пар чисел, ха рактеризующих длины прямолинейных отрезков и углы искривления
контуре |
при |
переходе от одного смежного отрезка к другому |
(ри с.3 . |
2 ). |
Угол искривления контура определяется как первая |
разность углов наклона его смежных прямолинейных отрезков. Если угол искривления контура обозначим через
6/n= 0W |
d m ' ’ |
' |
|
то геометрическое описание контура |
примет |
следующий вид: |
|
[-V |
\ Е>‘ |
• C > -L n'> *„] * |
|
. ' . . Л . . * '
Для того чтобы геометрическое.описание контура было ин вариантно по отношению преобразований подобия, необходимо пе рейти от конкретных размеров прямолинейных отрезков контуре к их относительным размерам.
96
Для обеспечения связности нашего геометрического описания вырэзии размеры прямолинейных отрезков контуре в виде отноше ния смежных отрезков при определенном направлении обхода кон туре. Получим I
Тогда геометрическое описание контура Г , инвариантное отно сительно подобных преобразований первого рода, примет следую щий вид:
Г = |
бг > . . . о 1п)5п |
Получим теперь геометрическое описание контура F , инва риантное по отношению к аффинным преобразованиям (ри с.3 .3 ).
Поскольку геометрическое изображение контура представлено в виде конечной упорядоченной последовательности прямолиней ных отрезков, весь контур представим в виде ориентированных треугольников, соединенных цепью.
В этом случае инвариантным признаком по отношению н аффин ным преобразованиям будет произведение отношения площадей S двух смежных треугольников, которые можно образовать с помощью трех смежных прямолинейных отрезков
$ т + /
на характеристику ориентации треугольников
97
Следовательно, геометрическое описание контура плоской фи гуры, инвариантное относительно перспективно-аффинных преобра зований, будет вырэнено в виде упорядоченной конечной последо вательности произведений Л на р , т .е .
г = о Л г рг с> ... о .
Успешная реализация данного метода опознавания геометри ческих фигур во многом зависит от правильного решения ряда за дач, сопутствующих денному методу. Остановимся лишь не тех за дачах, решение которых имеет первостепенное значение. Bo-rtep- вых, это разработке и выбор рациональных методов поиске и вы деления контуров геометрических фигур. Во-вторых, разработка методов фильтрации и корректировки контурных изображений фи гур, искаженных помехами. В-третьих, разработка метода, обес печивающего препарирование контурных линий фигур в виде упо рядоченной последовательности прямолинейных отрезков. При зтом контур фигуры представляется ломаной линией, вершины углов из лома которой являются особыми точками. В-четвертых, это опре деление длины и углов наклона отдельных прямолинейных отрез ков, а также определение основных геометрических размеров фи гуры.
Детальная разработка и комплексное реиение вышеперечислен ных задач позволили бы реально оценить все положительные и от рицательные стороны разработанного метода опознавания.
Несмотря на то, что в настоящее время проведено значитель ное число исследований строения глаз и характеристик зрения человека и животных, а также производится успешное моделиро вание зрительных функций различных животных, выбору типа сет чатки рецепторного устройства не уделяется должного внимания. Авторы различных опознающих устройств, стремясь к наиболее "естественному" кодированию изображений фигур на некотором поле, разбивают его с помощью горизонтальных и вертикальных прямых не одинаковые нвадратные элементы. Выбор сетчатки, со стоящей из квадрэтных элементов, обьясняется некоторой про стотой тех операций, которые в дальнейшем проводятся при ана лизе рецепторного поля.
Существует лишь небольшое число возможных типов мозаик, состоящих из неперекрывающихся равносторонних многоугольни ков. Форма этих многоугольников может быть квадратная, трех-
98
угольная и шестиугольная. Конечно, можно было бы рассмотреть и тание мозаики, как прямоугольные, трапецеидальные, ромбиче ские и др. Но даже при беглом ознакомлении с ними нетрудно убедиться в нерациональности их использования.
Если выбор типе сетчатки производить из условия использо вания круглых светочувствительных элементов, то задача решает ся однозначно путем выборе наиболее плотной 5П8ковни.
Коэффициенты заполнения сетчатки светочувствительными эле ментами будут равны при имитации нвадратной мозаики 0 ,7 9 ,трех угольной 0,61 и шестиугольной (сотовой) 0,95, являющейся нэилучшей. Использование сетчатки, состоящей из шестиугольных элементов, позволяет повысить точность измерений. Кроме этого, необходимо отметить еще одно дополнительное свойство шести гранной сетчатки. Оно заключается в том, что при изображении фигур малым числом элементов (мелкие фигуры) поворот изобра жения фигуры относительно координатных осей шестигранной сетчатни приводит к меньшим искажениям изображений, чем при ис пользовании сетчатки из квадратных элементов. Вышеприведенное позволяет сделэть вывод о целесообразности использования в рецепторных устройствах сетчаток с шестигранными светочувст вительными элементами, образующими сотовую сетчатку.
При решении задачи поиска объектов на анализируемом поле главным является рациональное распределение поискового усилия, которое должно осуществляться в соответствии с вероятностными характеристиками возможного наличия интересующих нас объектов в различных честях поля. Если мы располагаем вероятностными характеристиками распределения объектов по полю, то, опери руя с такими критериями, как максимум вероятности обнаружения, минимум вероятности пропуска объектов, минимум времени поиска и д р ., можно определить наияучшую траекторию сканирования, ко-* торая получается в результате разработки стратегии поиска. В основе данного типа сканирования лежат априорные данные о воз можных положениях объектов, причем эти данные могут задавать ся заранее в виде жестких программ или формироваться и уточ няться в соответствии с результатами предыдущего сканирования определенных участков анализируемого поля.
Кроме данного типа сканирования в поисковых сканирующих системах применяется равномерное распределение поисковых уси лий, которое сопровождается рэвноплотным сканированием всего поля. Второй тип сканирования, использующий построчные, зиг-
С
99
зэгообразные, петлевые и другие траектории, применяется в слу чае равновероятного положения объектов в контролируемом поле. Если геометрические размеры искомых объектов известны и они не являются точечными, то съем информации может осуществлять ся в виде сетки, что позволяет значительно сократить время поиске.
При этом величина клеток сетки выбирается из условия их равенства искомым объектам.
Третий тип сканирования использует спиральные, розеточные и паутинообразные траектории, которые целесообразны в случав потери объекта и обзора пространства, окружающего определенную точну анэлируемого поля [б ?].
На основании вышеизложенного, учитывая, как правило, от сутствие априорных данных о возможных положениях объектов и их геометрических размерах, можно рекомендовать использовать при поиске объектов зигзагообразную и спиральную развертки.
Зигзагообразную развертку можно использовать на первом этапе поиске, а спиральную в случае потери информации при наличии помех.
В связи с тем, что рассматриваемый метод автоматического опознавания основвн на использовании геометрических описаний контуров изображений фигур, имеется необходимость выделения нонтуров, а также препарирования контурных линий в виде упо рядоченной последовательности прямолинейных отрезков. Опера ция препарирования выполняется благодаря выделению особых то чек контурных линий, которые могут быть получены лишь в резуль тате детального анализа контура опознаваемого объекта.
Для осуществления твкого детального анализе в настоящее время имеется большое число достаточно хорошо разработанных и экспериментально проверенных следящих сканирующих систем.
Все эти системы можно разделить на три класса: оптико-механи ческие сканирующие системы, фотоэлектронные сканирующие систе мы и комбинированные.
Дня целей автоматического опознавания образов в дальней шем, по-видимому, найдут применение комбинированные системы развертки, которые будут состоять как из оптико-механических, так и фотоэлектронных устройств.
В связи с тем, что оптико-механические сканирующие систе мы ограничены по быстродействию, их самостоятельное использо вание не может найти широкого применения в системах оптическо
