Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
диплом готовый_красильников.doc
Скачиваний:
10
Добавлен:
27.10.2018
Размер:
966.14 Кб
Скачать

Зрительное и пространственное воображение

Во многих случаях, когда мы думаем о больше не существующих картине или объекте, мы переживаем образ этой картины или объекта. Люди часто называют это «внутренним взором». В последние 40 лет было проведено множество исследований репрезентации знаний, лежащей в основе таких зрительных образов; эти репрезентации обычно называют умственными образами. Термин «образы» часто используется как синоним зрительных образов, хотя можно также иметь слуховые или осязательные образы. Поэтому в названии этого раздела речь идет о зрительных и пространственных образах. Это связано с тем, что часть наших образов не привязана к зрительной модальности, но более общим способом связана с местоположением вещей в пространстве.

С реди наиболее важных исследований умственных образов — серия экспериментов по умственному вращению, выполненных Роджером Шепардом и его колле­гами. Первым был эксперимент Шепарда и Мецлера (Shepard & Metzler, 1971).

Стимулы в исследовании умственного вращения, проведенном Шепардом и Мецлером (Shepard & Metzler, 1971): а — объекты повернуты относительно друг друга на 80°; б— объекты повернуты относительно друг друга на 80°; в — пара не может быть приведена в соответствие с помощью вращения

Испытуемым предъявлялись пары двухмерных репрезентаций трехмерных объектов. Задача состояла в том, чтобы определить, были ли объекты идентичны без учета их ориентации. Две фигуры в части а идентичны друг другу и две фигуры в части б идентичны друг другу; просто они представлены в различных ориентациях. Испытуемые сообщают, что для сравнения двух форм они мысленно вращали один из объектов в каждой паре, пока он не совпадал с другим объектом. В части в изображены разные объекты: не существует никаких способов вращения одного объекта, при котором он стал бы идентичен другому.

Время реакции изображено как ве­личина угла между двумя объектами, предъявленными испытуемым. Эта величи­на угла выражает, на сколько градусов должен быть повернут один объект,

Среднее время определения идентичности трехмерной формы двух объектов как функция величины угла между их изображениями; а — график для пар, отличающихся поворотом на плоскости изображения, б — график для пар, отличающихся поворотом в пространстве (Metzler & Shepard, 1974)

чтобы соответствовать другому объекту по ориентации. Обратите внимание, что отношения линейны — для каждого равного приращения угла вращения требуется равное приращение времени реакции. Графики времени реакции построены для двух различных видов вращения. Один — для двухмерного вращения, которое может быть выполнено в плоскости изображения (т. е. вращая страницу); другой — для вращения в трехмерном пространстве, которое требует, чтобы испытуемый вращал объект «в страницу». Обратите внимание, что две функции очень похожи. Обработка объекта в глубине пространства (в трех измерениях), очевидно, не требует большего времени, чем обработка в плоскости изображения. Следовательно, испытуемые должны оперировать трехмерными репрезентациями объектов и при условии обработки в плоскости изображения, и при условии обработки в глубине пространства.

На основании этих данных может показаться, что испытуемые вращают объект в трехмерном пространстве в своей голове. Чем больше угол между двумя объектами, тем дольше испытуемые осуществляют вращение. Конечно, на самом деле испытуемые не вращают объект в голове. Но каким бы ни был мыслительный процесс, он, по-видимому, аналогичен физическому вращению.

Записи нервной активности у обезьян предоставили некоторые данные о нервной репрезентации в течение умственного вращения. Георгопулос, Лурито, Петридес, Шварц и Масси (Georgopoulos, Lurito, Petrides, Schwartz, and Massey, 1989) заставляли обезьян выполнять задание, в котором они должны были поворачивать рукоять под определенным углом к данному стимулу. Например, если стимул появлялся на 12 ч, то они должны были передвинуть рукоять на 9 ч, т. е. на 90°. Если стимул появлялся на 6 ч, они должны были переместить рукоять на 3 ч. Чем больше угол, тем больше времени требуется обезьянам для того, чтобы начать движение, а это говорит о том, что данная задача включала в себя процесс умственного вращения. Георгопулос с коллегами записывали активность клеток в моторной коре, в которых регистрировались разряды, когда обезьяна делала определенное движение. Когда обезьяна не должна изменять направление движения, но просто перемешает объект в определенном направлении, различные клетки реагируют на движения в различных направлениях. Когда обезьяна должна изменять направление движения, Георгопулос с коллегами обнаружили, что различные клетки реагировали в разное время во время изменения направления движения. Они также обнаружили, что в начале выполнения попытки с изменением движения, когда предъявлен стимул, наиболее активные клетки связаны с движением в направлении стимула. Но к концу выполнения попытки с изменением направления движения, когда обезьяна поворачивала рукоять, они обнаружили максимальную активность в клетках, связанных с движением. Между началом и концом выполнения попытки клетки, представляющие промежуточные направления, были максимально активны. Это указывает на то, что умственное вращение включало в себя постепенные изменения активности клеток, которые кодируют начальный стимул для клеток, которые кодируют преобразованный стимул. В главе 2 мы видели, что зрительные клетки чувствительны к местоположению и направлению. Вращение может включать в себя постепенное изменение активности клеток, представляющих различные позиции.

Постулирование связи между активностью клеток в моторной коре, расположенной там, где делали записи Георгопулос и его коллеги, и вращением зрительного образа может показаться странным. Но Дойч, Бурбон, Папаниколау и Эйзен-берг (Deutsch, Bourbon, Papanicolaou, & Eisenberg, 1988) обнаружили, что, когда люди осуществляют умственное вращение, у них имеется активация в лобной и теменной областях коры, связанных с планированием и выполнением движений. Косслин (Kosslyn, 1995) предполагает, что умственное вращение обычно осуществляется при подготовке к моторным действиям, когда человек должен иметь дело с объектом в нестандартном положении. Например, если мы видим нож, мы должны вообразить, как повернуть руку, чтобы взять нож за черенок. Косслин утверждает, что умственный образ должен пройти промежуточные положения, потому что наши конечности должны пройти эти промежуточные положения при обращении с объектами.

Когда испытуемые должны изменить ориентацию умственного образа, чтобы сделать сравнение, они вращают его через промежуточные положения, пока он не принимает желаемую ориентацию.

Сканирование образа

Разыскивая некоторую важную информацию, мы часто сканируем умственные образы. Например, когда людей спрашивают, сколько окон в их доме, многие сообщают, что они зрительно просматривают дом, когда считают окна. Исследователей заинтересовало, в какой степени люди фактически просматривают перцептивные репрезентации в таких задачах в сравнении с простым вспоминанием абстрактной информации.

Брукс (Brooks, 1968) провел важную серию экспериментов на сканирование зрительных образов. Он предлагал испытуемым сканировать воображаемые схемы, подобные изображенной на рис. 4.6.

Пример простой схемы, использованной Бруксом (Brooks, 1968), чтобы изучить сканирование

умственных образов. Звездочка и стрелка показывают испытуемому начальную точку и направление для сканирования образа

Например, испытуемый должен был сканировать воображаемую форму fot указанной отправной точки и в указанном направлении, классифицируя каждый угол как точку, лежащую на крайней вершине или крайнем основании (ответ «да»), или как точку между ними (ответ «нет»). В данном примере правильная последовательность ответов такова: «да», «да», «да», «нет», «нет», «нет», «нет», «нет», «нет», «да». Для не зрительной контрастной задачи Брукс также давал испытуемым предложения типа A bird in the hand is not in the bush («Птица в руке — это не птица в кустах»). Испытуемые должны были сканировать такое предложение, удерживая его в памяти, и классифицировать каждое слово как существительное или не существительное. Второй экспериментальной переменной был способ, которым испытуемые давали ответы.

Испытуемые:

    1. говорили «да» и «нет»;

    2. стучали левой рукой для «да» и правой рукой для «нет»;

    3. указывали на последовательные Y или N на бланке, изображенном на рис. 4.7. Таким образом, учитывались еще две переменные: стимульный материал (схема или предложение) и форма ответа. В итоге получалось шесть условий эксперимента.

Обзор существующих решений

Выполним обзор нейросетевых методов, используемых при распознавании изображений. Нейросетевые методы - это методы, базирующиеся на применении различных типов нейронных сетей. Основные направления применения различных НС для распознавания образов и изображений:

  • применение для извлечения ключевых характеристик или признаков заданных образов,

  • классификация самих образов или уже извлечённых из них характеристик (в первом случае извлечение ключевых характеристик происходит неявно внутри сети),

  • решение оптимизационных задач.

Архитектура искусственных нейронных сетей имеет некоторое сходство с естественными нейронными сетями. Нейронные сети, предназначенные для решения различных задач, могут существенно различаться алгоритмами функционирования.

Нейронная сеть состоит из элементов, называемых формальными нейронами, которые сами по себе очень просты и связаны с другими нейронами. Каждый нейрон преобразует набор сигналов, поступающих к нему на вход в выходной сигнал. Именно связи между нейронами, кодируемые весами, играют ключевую роль. Одно из преимуществ нейронных сетей (а так же недостаток при реализации их на последовательной архитектуре) это то, что все элементы могут функционировать параллельно, тем самым существенно повышая эффективность решения задачи, особенно в обработке изображений. Кроме того, что нейронные сети позволяют эффективно решать многие задачи, они предоставляют мощные гибкие и универсальные механизмы обучения, что является их главным преимуществом перед другими методами (вероятностные методы, линейные разделители, решающие деревья и т.п.). Обучение избавляет от необходимости выбирать ключевые признаки, их значимость и отношения между признаками. Но тем не менее выбор исходного представления входных данных (вектор в n-мерном пространстве, частотные характеристики, вэйвлеты и т.п.), существенно влияет на качество решения и является отдельной темой. Нейронная сеть обладают хорошей обобщающей способностью (лучше чем у решающих деревьев ), т.е. могут успешно распространять опыт, полученный на конечном обучающем наборе, на всё множество образов.