Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК Б ОГД 1 МатСтат 3 УЧПОС Воронов И.А

.pdf
Скачиваний:
44
Добавлен:
02.04.2015
Размер:
3.01 Mб
Скачать

Федеральное агентство связи

Государственное образовательное учреждение высшего профессионального образования

«Санкт-Петербургский Государственный университет телекоммуникаций имени проф. М.А. Бонч-Бруевича»

И.А. Воронов

ЭКСПЕРИМЕНТ

иметоды обработки многомерных данных

висследованиях человека

с применением SPSS:

медико-биологические исследования, психология, физическая культура и спорт

Учебное пособие

200401

Санкт-Петербург

2008

УДК [621.37/.39:615.47] (075.8) ББК 380:P

В 75

Рецензенты:

профессор, доктор технических наук, заведующий кафедрой биомедицинской техники СПбГУТ им. проф. М.А. Бонч-Бруевича, генеральный директор ассоциации электронной промышленности Санкт-Петербурга, заместитель директора НПО «Авангард»

Н.П. Меткин

доктор технических наук, ведущий научный сотрудник лаборатории биомедицинской информатики СПИИРАН

В.А. Дюк

Одобрено в качестве учебного пособия редакционно-издательским советом университета

Воронов, И.А. Эксперимент и методы обработки многомерных дан- В 75 ных в исследованиях человека с применением SPSS: медикобиологические исследования, психология, физическая культура и спорт: учебное пособие. 200401 / И.А. Воронов; ГОУВПО СПбГУТ. – СПб.,

2008. –100с.

ISBN 978-5-89160-054-6

Рассмотрены различные планы и техники экспериментов. Особое внимание посвящено методам обработки многомерных данных с помощью компьютерного статистического пакета SPSS.

Предназначено для студентов специальности 200401 «Биотехнические и медицинские аппараты и системы». Соответствует программе «Методы обработки биомедицинских сигналов и данных».

Может быть полезно специалистам и аспирантам, бакалаврам и магистрам специальностей и направлений, связанных с человекознанием.

УДК [621.37/.39:615.47] (075.8)

ББК 380:P

©Воронов И.А., 2008

©Государственное образовательное

учреждение высшего профессионального образования «Санкт-Петербургский государственный университет

ISBN 978-5-89160-054-6 телекоммуникаций им. проф. М.А. Бонч-Бруевича», 2008.

2

Содержание

Введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1. Экспериментальные планы с малыми объемами выборок. . . . . . . . . . . . 6 2. Экспериментальные планы с большими объемами выборок. . . . . . . . . . 14 3. Методы обработки многомерных данных. . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.1. Классификация многомерных методов. . . . . . . . . . . . . . . . . . . . . . . 47 3.2. Множественный регрессионный анализ (МРА) . . . . . . . . . . . . . . . 48 3.3. Дискриминантный анализ (ДА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.4. Факторный анализ (ФА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.5. Кластерный анализ (КА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.6. Многомерное шкалирование (ММШ) . . . . . . . . . . . . . . . . . . . . . . . . 65 4. Техники экспериментов O, P, Q, R, S, T. . . . . . . . . . . . . . . . . . . . . . . . . . . 74

Приложение 1. Пример экспериментального плана с малым объемом выборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Приложение 2. Пример экспериментального плана с большим объемом выборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Приложение 3. Статистические таблицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

Литература. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

3

ВВЕДЕНИЕ

Non scholae, sed vitae discimus.

Не для школы, но для жизни учимся.

Человечество изобрело множество методов познания окружающего мира. Если речь идет о религии, то здесь методом познания является личный опыт общения с тем, что люди назвали богом, посредством соблюдения определенных ритуалов в соответствии с религиозным календарем. Роль учебных центров в религии играют монастыри.

Если же речь заходит о науке, то основными методами познания здесь являются классификация собранной первичной информации, эксперимент, математические методы анализа данных и поиска знаний в этих данных, наконец, уточненная классификация научной информации и моделирование. Учебные центры – университеты.

Алгоритм познания можно представить в форме шести последовательных взаимосвязанных шагов:

1.Выбор объекта и предмета познания (исследования), явления, процесса.

2.Регистрация явления, процессов, детектирование, измерение, тестирование или диагностика, создание баз данных; анализ.

3.Выявление закономерностей, обработка данных, создание баз знаний; синтез.

4.Первичная (экспериментальная) попытка управления объектом и предметом познания (исследования), явлением, процессом; проект модели.

5.Обратная связь, коррекция.

6.Надежное управление объектом и предметом познания (исследования), явлением, процессом; окончательная модель.

Одним из наиболее сложных объектов познания является сам человек. До сих пор в науке не существует четких окончательных моделей организма человека, его психики, поведения. Одним из многочисленных примеров тому является противостояние Западной (биолого-анатомической) и Восточной (инфор- мационно-энергетической1) моделей функционирования организма человека и связанных с ними методов воздействия на человека – лечения человека, адаптации, научения (обучения и тренировки), развития индивидуальных и личностных качеств, качеств субъекта деятельности.

Необходимо учитывать и тот факт, что, с одной стороны, развитие, в настоящее время, компьютерных технологий явилось предпосылкой широкого внедрения методов математического анализа в науки о человеке: медико-биолог- ические исследования [4], психологию [6], физическую культуру и спорт [3].

С другой стороны, уровень овладения специалистами указанных областей деятельности математико-статистическими методами обработки данных оставляет желать лучшего. Не только дипломные работы студентов, но и научные

1 Имеется в виду восточное понятие «ци» «жизненная сила», некорректно переводимое на русский язык как «энергия» или «пневма».

4

исследования более высокого уровня не дают повода для оптимизма. И цитата из юмористического рассказа О’Генри, приведенная ниже, к сожалению, все чаще становится нормой расчетов данных экспериментальных исследований в таких «НИР»: «Если я съел курочку, а ты остался голодным, значит, в среднем мы съели по пол курочки».

Для устранения сложившегося противоречия и написано настоящее учебно-методическое пособие.

Первый раздел посвящен рассмотрению планов экспериментов с малым количеством объектов исследования.

Второй раздел рассматривает эксперименты с большими объемами выборок.

Третий раздел кратко описывает на примерах методы обработки многомерных данных с помощью компьютерного статистического пакета SPSS. Примеры, приведенные в разделе 3 для расчетов в программе SPSS, в электронном виде, можно заказать, отправив по электронной почте woronoff1960@mail.ru запрос с пометкой «примеры SPSS» и Вам будет выслан файл «Воронов_примеры.rar» (3,65 кб), а также, если требуется, файл «Иллюстрированный самоучитель по SPSS.rar» (5,72 Мб). Некоторые примеры заимствованы из [4, 7].

В четвертом разделе описаны планы экспериментов типов O, P, Q, R, S, T, где исследуются объект (O, P), условия (Q, R) и методика (S, T).

Особое внимание автор обращает на прил. 1 и 2. Это одни из лучших образцов проведения экспериментов по указанным планам с малыми и большими выборками, с одной стороны, и подходов к исследованию человека, с другой. Естественно, эти два примера не исчерпывают всего многообразия экспериментальных подходов, но они могут быть преподнесены в качестве крайних образцов широкого спектра экспериментов. Указанная структура учебнометодического пособия продиктована реалиями сегодняшнего дня и многолетним опытом преподавания дисциплины автором.

Так как пособие предназначено прежде всего для приобретения навыков практических расчетов, оно, в основном, построено на конкретных примерах. Автор не ставит своей задачей теоретический анализ методов математической статистики, не заостряет внимание на причинах выбора тех или иных методов анализа данных, он предлагает ряд примеров, которые моделируют наиболее часто встречающиеся задачи из практики.

Автор с благодарностью примет все конструктивные предложения по улучшению настоящего учебно-методического пособия. Отзывы можно направлять на электронный адрес, указанный выше.

И.А. Воронов

14 января 2008 г.

5

1.ЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ

СМАЛЫМИ ОБЪЕМАМИ ВЫБОРОК

Исследование, базирующееся на одиночном испытуемом или малой выборке, называется планом с малым n, или малым числом испытуемых. Большинство исследований в психологии базируется на большой совокупности испытуемых, которая позволяет получить большое количество данных. Соответствующие им планы экспериментов иногда называют планами с большим n [9].

Данные, полученные в ходе этих экспериментов, подлежат статистическому анализу, в котором могут быть сделаны вероятностные заключения и широкие обобщения. В силу огромной популярности экспериментов с большим n и их сопоставимости с современными статистическими приемами может показаться, что планы с малым n с методологической точки зрения второстепенны. Однако в таких отраслях наук о человеке, как клинические исследования,

психофизика, оперантное научение и спорт высших достижений, проведе-

ние экспериментальных планов с большими n зачастую оказывается просто невозможным.

Исследования, проводимые на одном испытуемом, связаны с особыми проблемами. В этих экспериментах измерения производятся до и после введения независимой переменной, а это означает, что сравнения производятся в различные периоды времени. В начальный период проводятся измерения с тем, чтобы определить исходный уровень (или базис), например, поведенческих характеристик, которые существуют до введения независимой переменной. Эти поведенческие характеристики можно измерить с помощью тестов, которые оценивают несколько черт поведения. Если исследователя интересуют эмоциональные изменения, которые происходят после введения независимой переменной, например, после введения в организм лекарства, меняющего настроение, базис может включать в себя описание нескольких характеристик, таких как ощущение счастья, непосредственность и общительность. После введения независимой переменной, в данном случае лекарства, меняющего настроение, производятся последующие оценки по тем же самым многомерным характеристикам. Эти показания сравниваются с исходным уровнем и представляют собой главный эффект исследования.

Клиническая психология. Поскольку в исследованиях с одним испытуемым решающую роль играют индивидуальные различия, необходимо подробное описание испытуемого. В исследованиях в области психотерапии это описание включает в себя «историю болезни», пример которой приведен в прил. 1. Автор эксперимента Реймонд Новако [9] дает описание клинических данных испытуемого, которые включают в себя описание его производственной ситуации, симптомы, госпитализацию, реакцию на стрессовые ситуации и предыдущее лечение. В клинических исследованиях идентификация этих характеристик особенно важна, так как именно определяют методику дальнейшего лечения.

6

Психофизические исследования. В психофизических экспериментах, как правило, изучается связь между физическими стимулами и тем, как испытуемый воспринимает эти стимулы. Во многих психофизических экспериментальных моделях каждый испытуемый подвергается воздействию десятков или даже сотен различных стимулов во время одного эксперимента. Тем самым, хотя количество наблюдений в психофизических экспериментах и базируется всего лишь на нескольких испытуемых (или даже на одном испытуемом), оно может превышать количество наблюдений в эксперименте с большим n. Кроме того, во многих психофизических экспериментах испытуемые не догадываются о возможном результате эксперимента. Фактически многие исследователи в этой области сами берут на себя роль испытуемых в собственных экспериментах, мотивируя это тем, что реакции испытуемого имеют физический характер и на них не влияет знание теории или гипотезы. Этот аргумент станет еще более основательным, если принять во внимание то, через какое большое количество опытов проходит каждый испытуемый.

Сюда же можно отнести и психофизиологические тесты.

Спорт высших достижений. Не секрет, что существуют «одиночные» виды спорта. Здесь ставка делается на одного или несколько спортсменов, которых обслуживает целая команда специалистов: тренеры, врачи, психологи и др. Функциональное, психическое и профессиональное состояние спортсмена – залог победы государства на международных соревнованиях. Проигрыш спортсмена обходится слишком дорого. По его выступлению судят не только о спортивных достижениях в стране, но, порой, и о самой стране. Поэтому в спортивной науке провести экспериментальный план с большим n зачастую просто невозможно. Спортсмена исследуют большим количеством тестов с применением информационных технологий [3] и компьютерных методов обработки данных.

Оперантное обусловливание. В начале XX в. в исследовательской деятельности психологов, специализировавшихся в области научения, доминировали две модели научения. Одна из них была разработана И.П. Павловым и называется классическим обусловливанием; вторая была предложена Э.Л. Торндайком, усовершенствована Б.Ф. Скиннером и носит название оперантного обусловливания. Начальные эксперименты в обоих направлениях исследований ставили целью идентифицировать необходимые для научения условия, используя подопытных животных. Павлов прибегал к помощи своих знаменитых выделявших слюну собак, а Торндайк исследовал, как эффект вознаграждения отражается на поведении кошек. Скиннер в своих экспериментах сначала использовал крыс, затем голубей и, наконец, наряду с различными видами животных, людей. Сейчас в лабораториях, где исследуются процессы научения, имеет место все более широкое использование различных видов животных для определения законов поведения.

Основу классического обусловливания, по Павлову, демонстрирует схема условного рефлекса. Известно, что проблему научения можно свести к выработке сложного комплекса условных рефлексов. Прежде чем приступать к

7

изучению всего этого комплекса, необходимо рассмотреть простой одиночный условный рефлекс. Классический «слюнный» рефлекс можно описать следующим образом.

1.Когда собаке дают мясо (безусловный раздражитель), у нее выделяется слюна (безусловный рефлекс).

2.Звонит звонок, затем собаке дают мясо; это повторяют несколько раз.

3.Звонит звонок (условный раздражитель), у собаки выделяется слюна; условный рефлекс образовался.

4.Если условный раздражитель повторяется несколько раз, но собаке не дают мяса, она перестает реагировать на звонок; рефлекс угасает.

Алгоритм выработки условного рефлекса – это алгоритм высшего по-

рядка, который изменяет, в соответствии с внешними условиями, алгоритм работы управляющей системы (системы безусловных и закрепившихся условных рефлексов). Выявление алгоритмов работы сложной управляющей системы, каковой является головной мозг, очень важно для понимания работы мозга.

Еще в 1958 г. отечественный исследователь А.А. Ляпунов указывал: «Критерием того, что функционирование некоторой управляющей системы изучено, является возможность моделировать ее...». Зная алгоритм выработки условного рефлекса, можно моделировать это явление на ПК или построить нервную сеть, поведение которой будет описываться этим алгоритмом. Последнее значительно интереснее, так как построенная нервная сеть позволит представить себе структуру и принципы строения нервных сетей, делающих возможным обучение и приспособление к окружающей обстановке, адаптацию.

Обозначим безусловный раздражитель буквой F, событие «появился безусловный раздражитель» – p(F); p(F) = 1, если безусловный раздражитель появился и p(F)=0, если он не появился. Условный раздражитель обозначим G, и р(G) – событие «появился условный раздражитель».

Имеется специальный математический аппарат для описания строения алгоритмов – логические схемы алгоритмов. Отдельные части алгоритма, перерабатывающего информацию, называются операторами. Будем обозначать их прописными латинскими буквами. В алгоритм могут входить некоторые логические условия, которыми определяется дальнейший порядок выполнения алгоритма. Будем обозначать логическое условие Р(Е). Так, в нашем алгоритме логическими условиями будут Р(G) и P(F). Логическое условие, например Р(G) будет выполнено, если появляется раздражитель G.

Алгоритм состоит из нескольких частей – операторов. Последовательное выполнение нескольких операторов будем обозначать как их произведение. Например, запись

A1·A2·A3·A4

означает, что сначала выполняется оператор A1 , затем A2 и т. д.

Выражение, составленное из операторов и логических условий, называется логической схемой алгоритма.

Например, логическая схема алгоритма безусловного рефлекса (F→a):

8

1,2↓ K(F) P(F) 1↑Aω 2

где: К(F) – оператор ввода информации;

А – оператор выполнения действия а, т. е. этот оператор заставляет систему совершить действие а;

ω – тождественно ложное условие, т. е. оно всегда не выполняется и поэтому всегда означает переход по стрелке;

Стрелки в этой схеме означают переход к следующей oneрации в случае невыполнения логического условия. Каждая стрелка имеет начало (стрелка вверх) и конец (стрелка вниз). Начало и конец отмечаются одинаковыми цифрами.

Для приведенного алгоритма, если Р(F)= 1, т. е. появился безусловный раздражитель, алгоритм выглядит так:

2↓ K(F) Aω 2

т. е. при появлении F система отвечает действием а и возвращается в исходное состояние по стрелке 2 (так как ω – тождественно ложное условие, т. е. оно всегда не выполняется и поэтому обозначает безусловный переход по стрелке).

Построим теперь логическую схему алгоритма выработки простого условного рефлекса. Пусть в системе имеется запоминающий элемент, который хранит возбуждение, связанное с событием GΛF (Λ – логический оператор «И»). Этот накопитель имеет порог h и, когда хранимое в нем возбуждение превзойдет порог h, образуется связь между условным раздражителем и действием (G→a). Обозначим текущее значение содержимого накопителя r и введем логическое условие р(r≥h) такое, что:

р(r ≥ h) = 1, если r ≥ h;

р(r ≥ h) = 0, если r < h.

Накопление возбуждения может происходить по различным законам (см. ниже).

Введем операторы: R – оператор накопления возбуждения в накопителе по определенному закону; S – оператор нейтрализации части возбуждения в накопителе; K(F,G) – оператор ввода информации.

Логическая схема алгоритма запишется в виде:

3,4,7↓ K(F,G) p(G) 1↑ p(F) 2↑ R 5,6↓ Aω 32↓ S p(r≥h) 4↑ ω 51↓ p(¯F) 6↑ ω 7

Такая запись алгоритма позволяет уже в некоторой степени представить, какова должна быть структура нервной сети. В этой нервной сети должны быть представлены события G, F, GΛF; эта нервная сеть должна иметь запоминающий элемент (накопитель) и какие-то переключающие элементы, управляемые накопителем. Все эти элементы должны быть соединены в соответствии с алгоритмом.

Задача построения нервной сети по заданному алгоритму имеет неоднозначное решение, можно построить различные сети, реализующие данный алгоритм в зависимости от того, какой элемент взять за основу нервной сети. В связи с этим возникает задача построения модели нейрона, более точно соответствующей реальному нейрону, что требует уточнения нейрофизиологических данных о нем.

9

Однако несмотря на неоднозначность решения, принципы построения нервной сети, реализующей данный алгоритм, и ее структура в общих чертах останутся одинаковыми для всех возможных сетей, поведение которых описывается данным алгоритмом.

Рассмотрим теперь нервную сеть, реализующую описанный алгоритм (алгоритм выработки классического условного рефлекса). На рис. 1.1 приведена схема нервной сети, предложенная Дж. Нейманом еще в 1956 г.

 

G –

вход от условного раздражителя;

Рис. 1.1

F –

вход от безусловного раздражителя;

А –

выход;

 

 

 

Р, N – нейроны с порогом

h = 2;

 

Q, М, T

– нейроны с порогом

h = 1;

 

R, S – накопители возбуждения

 

Сеть имеет два входа (G, F) и один выход (А). В необученном состоянии раздражитель G не вызывает никакой реакции (А = 0); возбуждение же рецептора F вызывает реакцию А, что иллюстрирует наличие безусловного рефлекса.

Чтобы выработать условный рефлекс, необходимо некоторое время подавать совместно раздражители G и F.

При этом в результате каждого возбуждения пары входов G и F возбуждается нейрон Р, нейрон Q не возбуждается. Импульсы при совпадении G и F накапливаются в счетчике R, выход которого возбуждается только тогда, когда число пришедших импульсов превзойдет некоторую фиксированную величину. С выхода R возбуждение передается на нейрон М (h = l) с петлей обратной связи. Этот нейрон играет роль ячейки памяти. Теперь, если появляется один раздражитель G, возникает реакция А, так как нейрон N (порог h = 2) имеет один возбужденный вход (концевая пластина нейрона М). Условный рефлекс выработан. Если теперь на схему подается только сигнал G, то будет возбуждаться нейрон Q. Возбуждение нейрона Q передается на счетчик S и, если событие GΛ¯F повторяется несколько раз подряд, возбудится аксон счетчика, имеющий концевую тормозящую пластину на нейроне М, нейрон М тормозится – рефлекс угасает.

Если в процессе обучения наряду с событием GΛF происходит событие GΛ¯F, то возбуждается нейрон Q и происходит сброс счетчика R. Обучение

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]