Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Тайны восприятия

.pdf
Скачиваний:
69
Добавлен:
16.09.2017
Размер:
3.9 Mб
Скачать

21. Несколько задач нараспознавание

171

обстоятельство не вносит сколько-нибудь существенных изменений в обсуждаемую здесь концепцию распознавания образов, и потому мы не будем его особо рассматривать.

21. Несколько задач на распознавание

Перейдем теперь от все еще абстрактных рассуждений к некоторым конкретным результатам. Образы, разумеется, можно выбирать совершенно произвольно, и ничто не мешает нам рассматривать не лица целиком,

Рис. 21.1.Фотографии области рта, хорошо различаемые компьютером

Рис. 21.2. Ещедва изображения, которые компьютер отличает какодно от другого, так и от вышеприведенных

172

Часть 111

Рис. 21.3. Фотографии области глаз, хорошо различаемые компьютером

а отдельные выражения этих самых лиц. Анализ выражений лица играет существенную роль и в психологии, и при исследовании болезней состояний в психиатрии. Возникает вопрос: а способен ли компьютер однозначно определить столь тонкую вещь, как различие в выражениях лица? Приведем несколько небольших, но весьма типичных, примеров из проработанного нами вместе с Робертом Хёнлингером и Филиппосом Вангером обширного материала. Сначала о том, удается ли компьютеру отличать друг от друга по выражению не только целые лица, но и отдельные участки лиц (например, область рта или глаз). В первой серии экспериментов мы сохранили в памяти компьютера в качестве прототипов несколько изображений двух участков лица (области рта и области глаз) одного и того же человека в различных эмоциональных состояниях, а затем предложили компьютеру одно из этих изображений в качестве тестового образа. Компьютер оказался на удивление проницательным и смог заметить различие между выражениями лица, приведенными на рис. с 21.1 по 21.3. Несколько более сложной оказалась

21. Несколько задач на распознавание

173

Рис. 21.4. Четыре сохраненных в памяти компьютера плана городов

для компьютера задача по различению мимики разных людей; удалась лишь небольшая часть попыток. Однако способность компьютера к распознаванию человеческих эмоций резко улучшилась — до 90% верных ответов — после того как для запоминания ему предоставили усредненные прототипы. При создании таких прототипов были использованы фотофафии различных участков лиц (например, области рта) примерно десяти человек в определенном эмоциональном состоянии; затем было вычислено среднее значение уровня серого в одинаково расположенных пикселях всех фотофафии одного участка лица и на основе полученных данных создано его усредненное изображение. Выяснилось, что с помощью усредненного прототипа компьютер способен узнавать выражение лица людей, не входящих в число тех, фотофафии которых использовались для создания этого самого прототипа. Исходя из результатов эксперимента можно предположить, что и человеческий мозг создает свои прототипы посредством подобного усреднения — по крайней мере, при распознавании лиц. Об удивительном подтверждении тому мы расскажем в одной из последующих глав.

174

Часть 111

Рис. 21.5. Компьютерная реконструкция плана города по предложенному фрагменту; кроме этого, компьютер определяет и название города, закодированное буквой

Рис. 21.6. По буквенному коду компьютер восстанавливает план города на основе сохраненных изображений

22. Распознавание синергетическим компьютером зашумленных...

175

Хотя компьютер оказался способен различать сами по себе выражения лиц, интерпретация этих выражений, т. е. определение их эмоционального смысла (радость, грусть, злость) ему, естественно, пока не по силам. Его, однако, можно определенным образом запрограммировать и тем самым, так сказать, научить узнавать собственно эмоции — так, чтобы на экран монитора рядом с предложенным компьютеру изображением лица выводилась бы еще и его интерпретация (верная!).

В качестве следующего примера проиллюстрируем процесс распознавания плана города (рис. 21.4-21.6). Вообще говоря, область возможных применений описанного процесса распознавания практически безгранична: сравнение промышленных деталей и отыскание бракованных, сортировка упаковок по надписям на них — например, в фармакологической промышленности — и многое другое. Как бы то ни было, обсуждение радужных перспектив применения синергетического компьютера не является целью нашей книги, и поэтому мы обратимся к основным моментам, связывающим работу синергетического компьютера с деятельностью мозга.

22.Распознавание синергетическим компьютером зашумленных и профильтрованных изображений

Мы уже неоднократно имели возможность убедиться в том, что концепция «образа» непосредственно связана с понятием «инвариантности». Мы распознаем образ вне зависимости от его величины и положения в пространстве, мы распознаем его даже тогда, когда изображение искажено различными помехами: растянуто, зашумлено или подвергнуто частотной фильтрации. Примеры таких искажений можно найти в главе 5 (рис. 5.4-5.7).

Попытаемся выяснить, в какой мере воспроизводит упомянутое свойство нашего мозга синергетический компьютер. Это, как мы надеемся, прольет некоторый свет и на способность самого мозга к обработке информации, а также, возможно, позволит установить, в каких случаях такая обработка производится относительно просто, а в каких встречается с трудностями. Кроме того, мы узнаем, какие модели мышления имеются в распоряжении у синергетического компьютера и как именно он ими пользуется; далее мы проведем с этими моделями некоторые психофизические эксперименты с целью выяснить их применимость в качестве возможных моделей функционирования человеческого мозга.

Прежде всего, напомним, что синергетический компьютер —в том виде, в каком мы представили его в предыдущих главах — играючи справляет-

176

Часть 111

i75

50

25

0,50 1,00 1,50

1п(уровень шума)

Рис. 22.1. Распознавание синсргстичсским компьютером зашумлснного изображения. В верхней части рисунка —фотографии одного итого же лица в разной степени зашумленности; уровень зашумленности увеличивается слева направо. Внижней части — кривая, отражающая зависимость успешности опознавания (в процентах) от степени зашумленности (отложена по горизонтальнойоси)

ся с целым рядом задач по распознаванию образов. Мы убедились также, что синергетический компьютер оказывается в состоянии опознать «искаженные» лица, и даже лица, скрытые в тумане — что нам, людям, удается уже с трудом. На рис. 22.1, вверху, показано изображение лица в различной степени зашумленности (шум усиливается в направлении слева направо), а

внижней части рисунка приведен график, на котором с зашумленностью изображения сопоставлена способность синергетического компьютера опознать изображенное лицо. Как видите, степень зашумленности становится весьма высокой еще до того, как компьютер перестает опознавать лицо

в100% случаев. В ходе этого компьютеру предъявлялись изображения с разной степенью зашумленности, причем эта степень могла изменяться и в пределах одного изображения.

Споразительной легкостью компьютеру удавалось распознавать и изображения, подвергнутые высоко- и низкочастотной фильтрации. Здесь

22. Распознавание

синергетическим

компьютером

затушенных...

177

Рис. 22.2. Выделение из изображения ряда пикселей

Рис. 22.3. Распределение уровней серого в ряде пикселей с рис. 22.2

следует прежде пояснить, что именно мы имеем в виду, говоря о высоко- и низкочастотной фильтрации изображений. Рассмотрим ряд пикселей, расположенных вдоль прямой, как это показано на рис. 22.2. Если теперь по вертикальной координатной оси откладывать значение уровня серого в пикселе, а горизонтальную расположить вдоль рассматриваемой линии пикселей, то мы получим некоторую кривую (рис. 22.3), которую — как утверждают математики — всегда можно представить в виде суммы некоторых волн (такие волны можно видеть на рис. 22.4). Этот метод называется анализом Фурье. Под высокочастотной фильтрацией изображения подразумевается удаление из Фурье-разложения упомянутой кривой длинных волн; при низкочастотной фильтрации, напротив, удаляются короткие волны. После фильтрации оставшиеся волны снова складываются в кривую, по которой и восстанавливается изображение. После высокочастотной фильтрации

178

Часть III

Рис. 22.4. Кривая с рис. 22.3 может быть представлена в виде суммы волн разной длины; здесь приведены лишь некоторые из них

контуры изображения становятся более резкими, при низкочастотной же более мягкими, размытыми.

Задавшись целью исследовать способность человека к распознаванию образов, американские психологи (А. Дж. О'Тул с сотрудниками) провели несколько серий экспериментов с применением в качестве тестовых образов изображений, подвергшихся той или иной фильтрации. Экспериментаторы ставили перед собой целый ряд задач. Сначала испытуемым было предложено запомнить несколько «нормальных» (т. е. непрофильтрованных) изображений лиц. Затем им предъявлялись портреты, подвергшиеся высокочастотной фильтрации; от испытуемых требовалось опознать знакомые лица, т. е. определить, какому из знакомых лиц соответствует профильтрованное изображение. Аналогичный эксперимент был проведен и с низкочастотной фильтрацией изображений. В другой серии экспериментов испытуемым предлагалось запомнить изображения, прошедшие низкочастотный фильтр, и сопоставить их затем по памяти с изображениями, прошедшими высокочастотный фильтр, и наоборот. Результаты экспериментов О'Тула представлены на рис. 22.5.

Мы провели аналогичные эксперименты с нашим синергетическим компьютером, также использовав несколько предварительно «запомненных» им портретов (уже знакомых нам по рис. 17.2). Профильтрованные (как высоко-, так и низкочастотными фильтрами) изображения представлены на рис. 22.6 и 22.7. Как нам представляется, уже при низкочастот-

22. Распознавание

синергетическим

компьютером

зашумленных...

179

 

эксперимент 1

 

 

 

пемьпусмыс запоминали изображения следующего типа:

 

низкочастотная

пепрофильт-

высокочастотная

100

фильтрация

ронаниые

фильтрация

 

 

 

низкочастотная

испрофилы-

высокочастотная

фильтрация

рованные

фильтрация

Рис. 22.5. Результаты экспериментов А. Дж. О'Тула и его сотрудников. В экспериментах принимали участие три группы. Испытуемым первой группы (левая часть диаграммы) предлагались для запоминания изображения, подвергшиеся низкочастотной фильтрации; испытуемым второй группы (средняя часть диаграммы) —нспрофиль- трованные изображения; испытуемым же третьей группы (правая часть диаграммы) — изображения, прошедшие высокочастотную фильтрацию. Затем испытуемым всех групп изображения всех трех типов предлагались уже для распознавания. Как показано на диаграмме, группа, запоминавшая лица, прошедшие низкочастотный фильтр, лучше всего, естественно, распознавала именно их, в то время как прошедшие высокочастотный фильтр изображения опознавались испытуемыми хуже всего. Группа, запоминавшая непрофильтрованные изображения, их же лучше всего и опознавала; на втором месте оказались изображения, подвергшиеся низкочастотной фильтрации; результаты же высокочастотной фильтрации узнавались хуже остальных. Третья группа также лучше всего узнавала изображения «своего» типа, что же до остальных изображений (непрофильтрованных и прошедших низкочастотный фильтр), то степень их узнавания оказался приблизительно одинаковой.

180

Часть 111

"If 1*1

Рис 22 6 RRepxy: ичображение, подвергнутое ничкочястотной фильтрации; степень фильтрации возрастает слева направо. Внизу: результат Фурьс-прсобразования (см. рис. 22.4) этих изображений

Рис. 22.7. Вверху: изображение, подвергнутое высокочастотной фильтрации; степень фильтрации возрастает слева направо. Внизу: результат Фурье-преобразования (см. рис. 22.4) этих изображений