Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОСЭКЗАМЕНЫ.docx
Скачиваний:
46
Добавлен:
23.03.2015
Размер:
2.82 Mб
Скачать

Непараметрические критерии[править | править исходный текст]

Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

  • Q-критерий Розенбаума

  • U-критерий Манна-Уитни

  • Критерий Уилкоксона

  • Критерий Пирсона

  • Критерий Колмогорова-Смирнова

Параметрические критерии[править | править исходный текст]

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

  • t-критерий Стьюдента

  • Критерий Фишера

  • Критерий отношения правдоподобия

  • Критерий Романовского

Критерий Фишера

F - критерий Фишера является параметричесикм критерием и используется для сравнения дисперсий двух вариационных рядов. Эмпирическое значение критерия  вычисляется по формуле:

где - большая дисперсия,- меньшая дисперсия рассматриваемых вариационных рядов.

         Если вычисленное значение критерия Fэмп больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются различными. Иными словами, проверяется гипотеза, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: H0={Dx=Dy}.

         Критическое значение критерия Фишера следует определять по специальной таблице, исходя из уровня значимости α и степеней свободы числителя (n1-1) и знаменателя (n2-1).

         Проиллюстрируем применение критерия Фишера на следующем примере. Дисперсия такого показателя, как стрессоустойчивость для учителей составила 6,17 (n1=32), а для менеджеров 4,41 (n2=33). Определим, можно ли считать уровень дисперсий примерно одинаковым для данных выборок на уровне значимости 0,05.

         Для ответа на поставленный вопрос определим эмпирическое значение критерия:При этом критическое значение критерия Fкр(0,05;31;32)=2.

         Таким образом, Fэмп=1,4<2=Fкр, поэтому нулевая гипотеза о равенстве генеральных дисперсий на уровне значимости 0,05 принимается.

 

Непараметрические критерии

Непараметрические критерии не содержат расчёта параметров распределения и основаны на оперировании частотами или рангами. Непараметрические критерии, как правило, менее сложны в вычислениях и могут быть измерены в любой шкале, начиная от шкалы наименований.

Т - Критерий Стьюдента

Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

Случай несвязных выборок

В общем случае формула для расчета по t - критерию Стьюдента такова:

где 

Рассмотрим сначала равночисленные выборки. В этом случае n1 = n2 = n, тогда выражение (9.2) будет вычисляться следующим образом:

В случае неравночисленных выборок , выражение будет вычисляться следующим образом:

В обоих случаях подсчет числа степеней свободы осуществляется по формуле:

где n1 и n2 соответственно величины первой и второй выборки.

Понятно, что при численном равенстве выборок k = 2 n - 2.

Рассмотрим пример использования t - критерия Стьюдента для несвязных и неравных по численности выборок.

Пример: Психолог измерял время сложной сенсомоторной реакции выбора

(в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающихся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Результаты эксперимента представим в виде табл. 9, в которой произведем ряд необходимых расчетов:

Таблица 9

Группы

Отклонение от среднего

Квадраты отклонения

 

X

Y

1

504

580

- 22

- 58

484

3368

2

560

692

34

54

1156

2916

3

420

700

- 106

62

11236

3844

4

600

621

74

- 17

5476

289

5

580

640

54

- 2

2916

4

6

530

561

4

- 77

16

5929

7

490

680

- 36

42

1296

1764

8

580

630

54

- 8

2916

64

9

470

-

- 56

-

3136

-

Сумма

4734

5104

0

0

28632

18174

Среднее

526

638

 

 

 

 

Средние арифметические составляют в экспериментальной группе , в контрольной группе 

Разница по абсолютной величине между средними

Подсчет выражения дает:

Тогда значение , вычисляемое по формуле (9.1), таково:

Число степеней свободы = 9 + 8-2= 15. По табл. 17 приложения 6 для данного числа степеней свободы находим :

2,13 для P 0,05

2,95 для P 0,01

4,07 для P 0,001

Строим ``ось значимости'':

Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,]% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза - о различии между экспериментальной и контрольными группами.

Случай связных выборок

В случае связных выборок с равным числом измерений в каждой можно использовать более простую формулу t - критерия Стьюдента.

Вычисления значений осуществляется по формуле:

где - разности между соответствующими значениями переменной X и переменной Y, а среднее этих разностей.

В свою очередь вычисляется по следующей формуле:

Число степеней свободы k определяется по формуле k = n - 1

Рассмотрим пример использования t - критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Пример: Психолог предположил, что в результате научения время решения эквивалентных задач ``игры в 5'' (т. е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач. Решение задачи представим в виде табл. 10.

Таблица 10

№ испытуемых

1 задача

2 задача

1

4,0

3,0

1,0

1,0

2

3,5

3,0

0,5

0,25

3

4,1

3,8

0,3

0,09

4

5,5

2,1

3,4

11,56

5

4,6

4,9

-0,3

0,09

6

6,0

5,3

0,7

0,49

7

5,1

3,1

2,0

4,00

8

4,3

2,7

1,6

2,56

Суммы

37,1

27,9

9,2

20,04

Вначале произведем расчет по формуле:

Затем применим формулу:

И, наконец, следует применить формулу. Получим:

Число степеней свободы: k = 8 - 1 = 7 и по табл. 17 приложения 6 находим :

2,37 для P 0,05

З,50 для P 0,01

5,41 для P 0,001

Строим ``ось значимости'':

Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза отклоняется и принимается гипотеза -- о различиях.

Для применения t - критерия Стьюдента необходимо соблюдать следующие условия:

Измерение может быть проведено в шкале интервалов и отношений.

Сравниваемые выборки должны быть распределены по нормальному закону.

критерий Манна-Уитни Назначение критерия Критерий предназначен для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малымивыборками, когда n1•n23 или n1=2, n2≥5, и является более мощным, чем критерий Ро­зенбаума. Описание критерия Существует несколько способов использования критерия и не­сколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988). Этот метод определяет, достаточно ли мала зона перекрещиваю­щихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значе­ния, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже. Чем меньше область перекрещивающихся значений, тем более ве­роятно, что различия достоверны. Иногда эти различия называют раз­личиями в расположении двух выборок (Welkowitz J. et al., 1982). Эмпирическое значение критерия U отражает то, насколько вели­ка зона совпадения между рядами. Поэтому чем меньше Uэмптем более вероятно, что различия достоверны. Гипотезы Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1. H1: Уровень признака в группе 2 ниже уровня признака в группе 1. Графическое представление критерия U На Рис. 2.5. представлены три из множества возможных вариан­тов соотношения двух рядов значений. В варианте (а) второй ряд ниже первого, и ряды почти не пере­крещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними досто­верны. Точно определить это мы сможем с помощью критерия U. В варианте (б) второй ряд тоже ниже первого, но и область пе­рекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придет­ся признать несущественными. Но так ли это, можно определить толь­ко путем точного подсчета критерия U. В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются. ^ Ограничения критерия U 1. В каждой выборке должно быть не менее 3 наблюдений: n1•n2≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5. 2. В каждой выборке должно быть не более 60 наблюдений; n1•n2≤60. Однако уже при n1•n2>20 ранжирование становиться достаточно трудоемким. На наш взгляд, в случае, если n1•n2>20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ,, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим. Пример Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального ин­теллекта. С помощью критерия Q Розенбаума мы в предыдущем па­раграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот резуль­тат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3. Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта? Таблица 2.3 Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2=12) факультетов

Студенты-физики

Студенты-психологи

Код имени испытуемого

Показатель невербального интеллекта

Код имени испытуемого

Показатель невербального интеллекта

1.

И.А.

111

1.

Н.Т.

ИЗ

2.

К.А.

104

2.

О.В.

107

3.

К.Е.

107

3.

Е.В.

123

4.

П.А.

90

4.

Ф.О.

122

5.

С.А.

115

5.

И.Н.

117

6.

Ст.А.

107

6.

И.Ч.

112

7.

Т.А.

106

7.

И.В.

105

8.

Ф.А.

107

8.

К.О.

108

9.

Ч.И.

95

9.

P.P.

111

10.

ЦА.

116

10.

Р.И.

114

11.

См.А.

127

11.

O.K.

102

12.

К.Ан.

115

12.

Н.К.

104

13.

Б.Л.

102

14.

Ф.В.

99

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

Критерий Вилкоксона

Критерий применяется для сопоставления показателей изменений в двух разных условиях на одной и той же выборке испытуемых. С его помощью можно определить, является ли сдвиг показателя в каком-то одном направлении более существенным, чем в другом.

Нулевая гипотеза H0={существенность сдвигов в типичном направлении не превосходит существенности сдвигов в нетипичном направлении}. На объём выборки накладывается следующее условие: 5≤n≤50.

Для демонстрации применения критерия определим значимость различий изменений вербальной памяти до и после иппотерапии (в баллах), используя следующие данные:

 

Измерение до эксперимента

6

5

4

3

7

6

4

4

5

6

Измерение после эксперимента

8

5

6

4

7

7

5

3

8

7

 

Воспользуемся следующим алгоритмом:

1.         Вычислим разности между индивидуальными значениями показателя после проведения эксперимента и до него.

2.          Для полученных разностей найдём их модули и произведём их ранжирование в порядке возрастания.

3.         Отметим ранги, соответствующие сдвигам в нетипичном направлении. Например, если в большинстве случаев после проведения эксперимента наблюдалось увеличение измеряемого параметра, то его уменьшение следует считать нетипичным сдвигом.

После выполнения указанных действий исходную таблицу можно представить следующим образом (нетипичные сдвиги выделены шрифтом).

 

Измерение до эксперимента

6

5

4

3

7

6

4

4

5

6

Измерение после эксперимента

8

5

6

4

7

7

5

3

8

7

Разность показателей

2

0

2

1

0

1

1

-1

3

1

Модуль разности

2

0

2

1

0

1

1

1

3

1

Ранг модуля разности

8.5

1.5

8.5

5

1.5

5

5

5

10

5

 

Эмпирическое значение критерия определяется как сумма рангов, соответствующих нетипичным сдвигам. В рассмотренном примере имеется только один такой сдвиг (см. таблицу), которому соответствует ранг, равный 5. Поэтому эмпирическое значение критерия будет численно равно этому рангу: Tэмп=5. Критическое значение следует искать в специальной таблице.

         Пусть уровень значимости равен 0.05. По таблице находим, что Tкр(0.05)=10.

         Сравним полученные значения критерия. Если критическое значение не превосходит эмпирического, то на данном уровне значимости отсутствуют основания для отклонения нулевой гипотезы о несущественности различий. Иначе, нулевая гипотеза отвергается.

         Т.к. Tэмп=5<10=Tкр(0,05), то нулевую гипотезу следует отвергнуть и считать различия существенными.

         Таким образом, схема применения критерия Вилкоксона будет иметь следующий вид:

         Критерий Вилкоксона позволяет установить не только направленность изменений, но и их выраженность. Следующий рассматриваемый нами критерий служит только для определения направления изменения в двух связанных выборках.

. Н - критерий Крускала-Уоллиса  Назначение критерия Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака. Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих из­менений. ^ Описание критерия Критерий Н иногда рассматривается как непараметрический ана­лог метода дисперсионного однофакторного анализа для несвязных вы­борок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981). Данный критерий является продолжением критерия U на боль­шее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выбор­ка. Затем все индивидуальные значения возвращаются в свои первона­чальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случай­ны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между вы­борками. Но если в одной из выборок будут преобладать низкие значе­ния рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия. Гипотезы H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз­личия по уровню исследуемого признака. Н1: Между выборками 1, 2, 3 и т. д. существуют неслучайные разли­чия по уровню исследуемого признака. ^ Графическое представление критерия Н Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная об­ласть наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными. Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штри­ховкой отмечены зоны наложения Ограничения критерия Н 1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п—Ъ, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р≤0,05). Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по край­ней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2. 2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица преду­смотрена только для трех выборок и {n1, n2, n3}≤5. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ2, поскольку критерий Крускала-Уоллиса асимптотически прибли­жается к распределению χ2 (Носенко И.А., 1981; J. Greene, M. D'Olivera, 1982). Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок. 3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказать­ся стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½·[c·(c-1)]*6 таких попарных сопоставлений используется, ес­тественно, критерий для двух выборок, например U или φ*. Пример В эксперименте по исследованию интеллектуальной настойчивости (Е. В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала раз­решимые четырехбуквенные, пятибуквенные и шестибуквенные ана­граммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграмма­ми испытуемые продолжали работать дольше, чем над другими, и, воз­можно, необходимо будет делать поправку на то, какая именно нераз­решимая анаграмма предъявлялась тому или иному испытуемому. Пока­затели длительности попыток в решении неразрешимых анаграмм пред­ставлены в Табл. 2.5. Все испытуемые были юношами-студентами тех­нического вуза в возрасте от 20 до 22 лет. Можно ли утверждать, что длительность попыток решения каж­дой из 4 неразрешимых анаграмм примерно одинакова? Таблица 2.5 Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (7V=22)

Группа 1: анаграмма

Группа 2: анаграмма

Группа 3: анаграмма

Группа 4: анаграмма

^ ФОЛИТОН (n1=4)

КАМУСТО (n2=8)

СНЕРАКО (n3=6)

ГРУТОСИЛ (n4=4)

1

145

145

128

60

2

194

210

283

2361

3

731

236

469

2416

4

1200

385

482

3600

5

720

1678

6

848

2081

7

905

8

1080

Суммы

2270

4549

5121

8437

Средние

568

566

854

2109

Сформулируем гипотезы. H0: 4 группы испытуемых, получившие разные неразрешимые анаграм­мы, не различаются по длительности попыток их решения. H1: 4 группы испытуемых, получившие разные неразрешимые анаграм­мы, различаются по длительности попыток их решения.

Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Критерий Фридмана

Критерий применяется для сопоставления показателей, измеренных в c условиях (c≥3) на одной и той же выборке из n испытуемых. Критерий Фридмана позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений и в этом смысле похож на критерий знаков.

         Критерий Фридмана является обобщением критерия Вилкоксона на большее, чем два, количество условий измерения, в котором мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения измерений.

         Нулевая гипотеза H0={между полученными в разных условиях показателями существуют лишь случайные различия}.

Рассмотрим использование критерия Фридмана на примере. Пять учащихся исследуются по четырём тестам. Являются ли результаты тестирования случайными?

 

 

Оценки в баллах по проведённым тестам

Номер испытуемого

Тест A

Тест B

Тест C

Тест D

1

3.6

4.1

2.9

3.5

2

3.8

4.2

3.7

4.6

3

3.3

3.8

3

3.7

4

3.8

3.3

3.4

2.7

5

4

3.6

1.9

3.1

 

Проранжируем индивидуальные значения показателей для каждого испытуемого в порядке убывания признака. Т.е. производим ранжирование параметров каждой строки представленной таблицы.

Найдём суммы рангов по столбцам. В результате получаем:

 

Ранги тестов (по строкам)

Номер испытуемого

Тест A

Тест B

Тест C

Тест D

1

2

1

4

3

2

3

2

4

1

3

3

1

4

2

4

1

3

2

4

5

1

2

4

3

Сумма рангов:

10

9

18

13

Найдём эмпирическое значение критерия по формуле:гдеc – количество условий (тестов, т.е. c=4), n – количество испытуемых (n=5), Tj – сумма рангов по j-ому условию (тесту).

Найдём по таблице критическое значение критерия , зависящее от уровня значимости α и степени свободыk=c-1.  В нашем случае k=4-1=3 и возьмем α=0,05 получим:

Проверим, можно ли на данном уровне значимости принять нулевую гипотезу, утверждающую о несущественности различий результатов тестов. Нулевая гипотеза принимается, если критическое значение превосходит эмпирическое. 

Вывод: нулевая гипотеза принимается, т.е. результаты теста можно считать случайными (различия несущественны).

Схема применения критерия имеет вид:

Следующий критерий можно рассматривать как продолжение критерия Фридмана, поскольку он не только констатирует различия, но и указывает на направление изменений.

Билет27

Экспериме́нт (от лат. experimentum — проба, опыт), также опыт, в научном методе — метод исследования некоторого явления в управляемых условиях. Отличается от наблюдения активным взаимодействием с изучаемым объектом. Обычно эксперимент проводится в рамках научного исследования и служит для проверки гипотезы, установления причинных связей между феноменами. Эксперимент является краеугольным камнемэмпирического подхода к знанию. Критерий Поппера выдвигает возможность постановки эксперимента в качестве главного отличия научной теории от псевдонаучной. Эксперимент — это метод исследования, который воспроизводится в описанных условиях неограниченное количество раз, и даёт идентичный результат

Основные особенности эксперимента, обусловливающие его силу, заключаются в следующем. 1) В эксперименте исследователь сам вызывает изучаемое им явление, вместо того чтобы ждать, как при объективном наблюдении, пока случайный поток явлений доставит ему возможность его наблюдать. 2) Имея возможность вызывать изучаемое явление, экспериментатор может варьировать, изменять условия, при которых протекает явление, вместо того чтобы, как при простом наблюдении, брать их такими, какими ему их доставляет случай. 3) Изолируя отдельные условия и изменяя одно из них при сохранении неизменными остальных, эксперимент тем самым выявляет значение отдельных условий и устанавливает закономерные связи, определяющие изучаемый им процесс. Эксперимент, таким образом, очень мощное методическое средство для выявления закономерностей. 4) Выявляя закономерные связи между явлениями, экспериментатор может варьировать не только сами условия в смысле их наличия или отсутствия, но и их количественные соотношения. В результате эксперимента устанавливаются допускающие математическую формулировку количественные закономерности. В основном именно благодаря эксперименту естествознание пришло к открытию законов природы.

 

Основная задача психологического эксперимента заключается в том, чтобы сделать доступными для объективного внешнего наблюдения существенные особенности внутреннего психического процесса. Для этого нужно, варьируя условия протекания внешней деятельности, найти ситуацию, при которой внешнее протекание акта адекватно отражало бы его внутреннее психологическое содержание. Задача экспериментального варьирования условий при психологическом эксперименте заключается прежде всего в том, чтобы вскрыть правильность одной-единственной психологической интерпретации действия или поступка, исключив возможность всех остальных.

 

Первоначальный вундтовский эксперимент был экспериментом психофизиологическим. Он заключался по существу в регистрации физиологических реакций, сопутствующих психическим процессам, которая сопровождалась самонаблюдением.

 

Вундтовский эксперимент был целиком построен на дуалистической теории внешнего параллелизма психического и физиологического. Эти методические принципы легли в основу экспериментальной методики и определили первые шаги экспериментальной психологии.

 

Но экспериментальная методика стала скоро прокладывать себе и несколько иные пути. Существенный этап составили в этом отношении исследования Г.Эббингауза о памяти (см. главу о памяти). Вместо того чтобы изучать исключительно соотношение между физическими раздражителями, физиологическими процессами и сопутствующими им явлениями сознания, Эббингауз направил эксперимент на изучение протекания самого психологического процесса в определенных объективных условиях.

 

Возникший в пограничной области психофизики и психофизиологии эксперимент в психологии в дальнейшем стал продвигаться от элементарных процессов ощущения к высшим психическим процессам; с этим продвижением в иные области связано было и изменение самого характера эксперимента. От изучения соотношения отдельного физического раздражителя или физиологического раздражителя и соответствующего ему психического процесса он пришел к изучению закономерностей протекания самих психических процессов в определенных условиях. Из внешней причины физические факты стали условиями психического процесса. Эксперимент перешел на изучение его внутренних закономерностей.

 

С тех пор и главным образом за последние годы эксперимент получил очень многообразные формы и широкое применение в самых различных областях психологии – в психологии животных, в общей психологии и в психологии ребенка. При этом некоторые из новейших экспериментов отличаются большой строгостью методики; по простоте, изяществу и точности результатов они иногда не уступают лучшим образцам, созданным такими зрелыми экспериментальными науками, как, например, физика.

 

Ряд глав современной психологии может уже опереться на точные экспериментальные данные. Особенно богата ими современная психология восприятия.

 

Против лабораторного эксперимента выдвигались три соображения. Указывалось: 1) на искусственность эксперимента, 2) на аналитичность и абстрактность эксперимента и 3) на осложняющую роль воздействия экспериментатора.

 

Искусственность эксперимента или его отдаленность от жизни обусловлена не тем, что в эксперименте выключаются некоторые осложняющие условия, встречающиеся в жизненных ситуациях. Искусственным эксперимент становится, лишь поскольку в нем выпадают существенные для изучаемого явления условия. Так, эксперименты Г.Эббингауза с бессмысленным материалом являются искусственными, поскольку они не учитывают смысловых связей, между тем как в большинстве случаев эти связи играют существенную роль в работе памяти. Если бы теория памяти Эббингауза по существу была правильной, т.е. если бы лишь механические повторения, чисто ассоциативные связи определяли воспроизведение, эксперименты Эббингауза не были бы искусственными. Сущность эксперимента в отличие от простого наблюдения определяется не искусственностью условий, в которых он производится, а наличием воздействия экспериментатора на подлежащий изучению процесс. Поэтому искусственность традиционного лабораторного эксперимента нужно преодолевать прежде всего внутри экспериментального метода.

 

Известная аналитичность и абстрактность была в значительной мере свойственна лабораторному эксперименту. Эксперимент обычно берет изучаемый им процесс изолированно, внутри одной определенной системы условий. Раскрытие взаимосвязи различных функций и изменения в процессе развития законов протекания психических процессов требуют дополнительных методических средств. Их доставляют главным образом генетический и патологический методы. Далее, эксперимент в психологии проводится обычно в условиях, далеких от тех, в которых протекает практическая деятельность человека. Так как закономерности, которые вскрывал эксперимент, были очень общего, абстрактного характера, то они не давали возможности непосредственных выводов для организации человеческой деятельности в производственном труде или педагогическом процессе. Попытка приложения этих абстрактных закономерностей к практике превращалась часто в механическое перенесение результатов, полученных в одних условиях, на другие, нередко совершенно разнородные. Эта абстрактность психологического эксперимента заставила искать новые методические приемы для решения практических задач.

ассмотрим эксперимент как специфический научный метод, имеющий славу наиболее точного метода в психологии. Напомним слова великого натуралиста Ж. Кювье: если наблюдатель "слушает природу", то экспериментатор "вопрошает и принуждает ее разоблачиться".

Анализ и сравнение многочисленных определений эксперимента демонстрирует их несогласованность и неполноту. Это обстоятельство даже дает повод для весьма безрадостных оценок возможностей дать ему полноценную дефиницию: "Может быть, лучше всего об эксперименте говорить, пользуясь метафорами... А еще лучше, может быть, вовсе не пытаться давать определения того, что есть эксперимент, полагая, что это понятие не поддается компактному определению. Смысл его может стать ясным только после того, как о нем будет много сказано... Составители многих словарей, видимо, поняли тщетность попытки определить понятие "эксперимент". Ничего не сказано об этом понятии в таких хорошо известных изданиях справочного характера, как энциклопедический словарь Брокгауза и Ефрона, Энциклопедический словарь Граната, Encyclopedia Britanica, Chamber's Encyclopedia, словарь Larussn даже в нашей Физической энциклопедии".

Подобный пессимизм, граничащий с агностицизмом, в науке неприемлем. Ее обязанность не уклоняться от четких и понятных, а по возможности и однозначных формулировок при описании и объяснении реальности, а, наоборот, стремиться к ним. Как известно, лаконичность и простота языка - красноречие науки. А главные элементы этого красноречия - определения, в которых "словам должно быть тесно, а мыслям просторно".

Избежать определения эксперимента в психологии невозможно. Поэтому попытаемся в кратком виде обобщить соответствующие сведения.

Считается, что главное отличие эксперимента в психологии (впрочем, как и других психологических методов) от эксперимента в других науках предопределено основным объектом исследования. Человек как объект изучения в силу своей активности и сознательности очень сильно влияет как на процесс, так и на результаты исследования. Отсюда вытекают особые требования к процессу экспериментирования, рассматриваемому как процесс общения экспериментатора с испытуемым [147,148]. Эту особенность эмпирического психологического исследования психологи называют проблемой "субъектноcти объекта" [119]. Конкретизацией этой особенности психологического эксперимента является инструкция испытуемому, даваемая в подавляющем большинстве экспериментальных работ в психологии.

Главное же отличие психологического эксперимента от других психологических методов заключается в том, что он дает возможность внутреннему психическому явлению адекватно и однозначно проявиться во внешнем поведении, доступном объективному наблюдению. Адекватность и однозначность объективизации экспериментально вызываемых психических явлений достигаются за счет целенаправленного жесткого контроля условий их возникновения и протекания. С. Л. Рубинштейн писал на этот счет: "Основная задача психологического эксперимента заключается в том, чтобы сделать доступными для объективного внешнего наблюдения существенные особенности внутреннего психического процесса. Для этого нужно, варьируя условия протекания внешней деятельности, найти ситуацию, при которой внешнее протекание акта адекватно отражало бы его внутреннее психическое содержание. Задача экспериментального варьирования условий при психологическом эксперименте заключается прежде всего в том, чтобы вскрыть правильность одной единственной психологической интерпретации действия или поступка, исключив возможность всех остальных".

Осуществление главной цели экспериментального метода - предельно возможной однозначности в понимании связей между явлениями внутренней психической жизни и их внешними проявлениями - достигается благодаря следующим основным особенностям эксперимента: 1) инициатива экспериментатора в появлении интересующих его психологических фактов; 2) возможность варьирования условий возникновения и развития этих явлений; 3) строгий контроль и фиксация условий и процесса их протекания; 4) изоляция одних и акцентирование других факторов, обусловливающих изучаемые феномены, дает возможность выявления закономерностей их существования; 5) возможность повторения условий эксперимента позволяет многократную проверку получаемых научных данных и их накопление, что значительно повышает их надежность; 6) варьирование условий предполагает не только присутствие или отсутствие каких-то элементов экспериментальной ситуации, но и их количественные изменения, что позволяет выявленные закономерности представлять в строгих количественных выражениях.

Все сказанное позволяет определить эксперимент как метод, при котором исследователь сам вызывает интересующие его явления и изменяет условия их протекания с целью установления причин возникновения этих явлений и закономерностей их развития. Кроме того, получаемые научные факты могут неоднократно воспроизводиться благодаря управляемости и строгому контролю условий, что дает возможность их проверки, а также накопления количественных данных, на основе которых можно судить о типичности или случайности изучаемых явлений.

1. Основные элементы экспериментального метода

Главными компонентами любого эксперимента являются: 1) испытуемый (исследуемый субъект или группа); 2) экспериментатор (исследователь); 3) стимуляция (выбранный экспериментатором раздражитель, направленный на испытуемого); 4) ответ испытуемого на стимуляцию (его психическая реакция); 5) условия опыта (дополнительные к стимуляции воздействия на испытуемого, которые могут влиять на его ответы).

Ответ испытуемого является той внешней реальностью, по которой можно судить о протекающих в его внутреннем субъективном пространстве процессах. Сами эти процессы есть результат воздействий на него стимуляции и условий опыта.

Если ответ испытуемого обозначить символом R (от лат. reactio - реакция, противодействие), а воздействия на него экспериментальной ситуации (как совокупности воздействий стимуляции и условий эксперимента) - символом S (от франц. situation - ситуация), то их соотношение можно выразить формулой R=f(S). To есть реакция есть функция от ситуации. Но эта формула верна лишь как первое приближение. Именно ею пользуется бихевиоризм, игнорирующий активную роль психики. В действительности реакция на ситуацию всегда опосредована психикой. В отношении человека лучше говорить об опосредовании ответов его личностью (Р - от лат. persona). И более того, в понятие "ситуация" необходимо включить и влияние на испытуемого экспериментатора, проводящего опыт. Действительно, отношения, сложившиеся между исследователем и испытуемым, могут в значительной степени влиять на ответы последнего. Об этой специфике эксперимента подробнее поговорим позже, а сейчас зафиксируем соотношение между основными элементами эксперимента: Р = f(P, S).

В зависимости от задач исследования различают три классических типа отношений между этими тремя компонентами эксперимента: 1) функциональные отношения, 2) структурные отношения, 3) дифференциальные отношения.

Функциональные отношения характеризуются вариативностью ответов (R) испытуемого (Р) при систематических качественных или количественных изменениях ситуации (S). Различия в реакциях свидетельствуют о различиях в способах взаимодействия субъекта и среды. Графически эти отношения можно отразить схемой.

Структурные отношения раскрываются через систему ответов (Rp ..., Rn) на различные ситуации (Sl5..., Sn). Отношения между отдельными ответами структурируются в систему, отражающую структуру личности (Р).

Дифференциальные отношения выявляются через анализ реакций (Rp ..., Rn) разных испытуемых (Рр ... , Рп) на одну и ту же ситуацию (S). Различия в ответах характеризуют индивидуальные различия испытуемых.

В теории эксперимента рассмотренные компоненты предпочитают представлять в несколько ином виде, что способствует более четкому выделению предмета экспериментального исследования. В идеале в качестве предмета изучения следует принять зависимость ответов испытуемого от стимуляции. Однако в реальности подобной "чистой" связи не существует, так как в структуре ответа присутствуют элементы зависимости от других привходящих факторов, на которые мы уже обращали внимание. Это дополнительные воздействия, включенные в понятие "ситуация" (внешние условия опыта и влияние экспериментатора), и опосредование ответов личностью испытуемого. Для уточнения соотношения всех факторов, входящих в эксперимент, введено понятие "переменной величины" или просто переменной.Тогда предмет исследования в эксперименте предстает в виде соотношения этих переменных, которое и определяет появление, протекание и характеристики изучаемого явления.

Выделяют три вида переменных: независимые, зависимые и дополнительные. Фактор, изменяемый самим экспериментатором, т. е. стимул, называется независимой переменной (НП). Фактор,изменение которого является следствием изменения НП, называется зависимой переменной (ЗП). По сути, ЗП - это компонент в составе ответа испытуемого, который непосредственно интересует исследователя. Дополнительные переменные (ДП) - это сопутствующие стимуляции (НП) воздействия на испытуемого, оказывающие влияние на его ответ, и соответствующие составляющие ответа, дополняющие ЗП. Совокупность дополнительных воздействий состоит, как правило, из двух групп: внешних условий опыта физичес-койприроды и внутренних факторов психологической природы.Квне-шним ДП относятся: физическая обстановка опыта (освещенность, температурный режим, звуковой фон, пространственные характеристики помещения и т. д.), непредвиденные помехи (например, непредусмотренное появление посторонних лиц или самого экспериментатора в лаборатории), характеристики стимульного материала, не входящие в комплекс НП (например, форма зрительного тест-объекта при изучении влияния цвета на опознание); параметры аппаратуры и оборудования (например, дизайн измерительных приборов, отвлекающий испытуемого). К внутренним ДП относятся: настроение и мотивация испытуемого, его отношение к экспериментатору и опытам, его психологические установки, склонности, знания, навыки и опыт в данной деятельности, уровень утомления и т.д.

2. Независимые переменные

А)Виды независимых переменных:

Независимая переменная (НП) является главной составляющей экспериментальной ситуации. Именно ее воздействие на испытуемого исследуется в эксперименте через изучение его реакций. Обеспечив приемлемые внешние и внутренние условия опыта, экспериментатор приступает к непосредственному предъявлению испытуемому стимульного материала и регистрации его ответов, систематически контролируя постоянство созданных условий.

В качестве независимой переменной в психологических экс*-периментах могут выступать любые воздействия, способные вызывать необходимые по задаче исследования психические реакции индивида или группы. Чаще всего в роли НП выступают следующие факторы: а) стимул; б) любое внешнее условие опыта; в) какая-либо внутренняя ДП; г) способ выполнения экспериментальной задачи; д) режим стимуляции.

а. Под стимулом в данном случае понимается специальное внешнее воздействие, побуждающее испытуемого к определенным реакциям. Это может быть любой физический раздражители. Например, свет при изучении темновой адаптации; звук при измерении слуховой чувствительности; форма или размеры при исследовании константности зрительного восприятия; механические, температурные, химические, электрические воздействия при изучении эмоций и т. д. Это может быть второсигнальный раздражитель - слово. Обычно в этом случае воздействующим фактором является смысл слова, смысл высказывания. Например/ разные по информативности или эмоциональности речевые воздействия. В качестве стимула могут выступать действия других людей или события, зарегистрированные каким-либо образом (скажем, на кинопленку) и представленные испытуемому. Например, демонстрация сцен насилия с целью изучения формирования и проявления агрессивности.

б. Любое внешнее условие экспериментальной ситуации, т. е.внешняя ДП, может приниматься исследователем как НП. Тогдаона практически ничем не отличается от "стимула". Но их разведение имеет смысл при многофакторном эксперименте, использующем не одну независимую переменную. В этом случае желательно специфическую стимуляцию акцентированно отделить отдругих изменяющихся дополнительных воздействий. Примерыподобных ситуаций: изучение эффективности интеллектуальнойдеятельности при помехах и без них; точность движений при зрителях и в одиночестве; исследование динамики сенсорных порогов при изменении освещенности.

в. В качестве НП может приниматься и любая доступная исследованию внутренняя дополнительная переменная. Те из них,которые в течение эксперимента у испытуемого могут изменяться, называются непостоянными ДП. Например, мотивация илипсихологическая установка на эксперимент, настроение, физиологическое состояние. Те же, которые в течение экспериментаостаются неизменными, называются постоянными ДП. Например, возраст, пол, тип темперамента, уровень способностей. Ихреализация в качестве НП может производиться только черезгрупповые эксперименты либо в лонгитюдных исследованиях.

г. Задача и способ ее выполнения определяются выбранной методикой, соответствующей цели исследования. Для испытуемогометодика раскрывается через инструкцию, регламентирующуюего действия со стимульным материалом (НП) и характер ответов (R). Достижение одних и тех же целей, как известно, можно осуществить разными путями. Влияние различий в этих путях на конечный результат (ответы) выясняется через предоставление разных вариантов решения одной и той же экспериментальной задачи. Классический пример в этом плане: получение разных порогов сенсорной чувствительности у одних и тех же людей при применении разных методов их измерения, что сыграло не последнюю роль в переходе от психофизики "чистых ощущений" к психофизике "решения сенсорных задач".

д. Режим стимуляции. Иногда экспериментатора интересуетвлияние на ответы порядка предъявления стимулов. Тогда режимизменения стимуляции сам выступает в качестве НП наряду сосновной независимой переменной. Такая задача часто встает настадии "отладки" методики, когда необходимо выяснить "вес"подобных влияний, чтобы учесть их в процедуре основных экспериментов. Если обнаруживается их значительное влияние, то в дальнейших опытах обычно применяется один из способов нейтрализации такого влияния: уравновешенный чередной порядок, предварительная практика, комбинирование группового состава и проч., о чем сказано ниже.

Из приведенного перечня возможных в психологическом эксперименте НП видно, что она может иметь количественное и качественное выражение. Количественному выражению, а следовательно, и изменению поддаются такие параметры экспериментальной ситуации, которые могут быть упорядочены в возрастающем или убывающем порядке. Таковы интенсивностные и временные показатели физических стимулов, число проб или время, отпускаемое на выполнение задания, объем экспериментального материала, возраст испытуемых и т. д. Подобные показатели могут представать в виде ряда (континуума) последовательных значений и отражаться порядковыми (ранговыми), интервальными или даже пропорциональными шкалами.

Переменные качественного характера представляют собой некий целостный и статический параметр ситуации, который либо есть в наличии, либо отсутствует. Эти показатели ситуации соответствуют номинативным шкалам. К такого рода переменным относятся тот или иной тип стимула (например, свет или звук при измерении времени реакции), наличие или отсутствие помех (шумов), осмысленность или бессмысленность экспериментального вербального материала, пол испытуемых, присутствие посторонних людей, наличие или отсутствие эмоциогенного фактора, то или иное физическое или психическое состояние и т. д.(1)

Б)Выделение независимой переменной:

В чем сходны следующие ситуации?

1. Женщина стоит внутри огромного деревянного ящика, в который могло бы поместиться пианино, и смотрит через "глазок" на десятилетнюю девочку-индианку. Если девочка садится на стул у одного угла ящика и многократно нажимает на рычаг, то после каждого десятого нажатия женщина вкладывает шарик.в металлическую трубку, через которую тот со стуком 'скатывается в пластмассовый лоток перед девочкой. Если же девочка садится на стул в другом конце ящика, где никакого рычага нет, женщина все равно периодически посылает ей шарики.

2. Эластичная повязка на голове спокойно сидящего молодого человека прочно удерживает введенные в его ноздри две пластиковые трубки. Несмотря на то что вовсе не холодно, уши человека плотно прикрыты заглушками. Делая вдох, он нажимает кнопку, приводя в действие два насоса, которые поочередно вдувают порции воздуха с запахом гвоздики ему в ноздри.

3. Мать и ребенок находятся в комнате с еще одной молодой женщиной. Мать кладет ребенка в постельку я со словами "бай-бай, Томми" выходит из. комнаты. Ребенок начинает кричать. Ровно через 60 секунд после ухода мать возвращается в комнату.

Во-первых, ни одни из них, по всей вероятности, не дает результатов, которые могли бы немедленно быть использованы на практике, как, например, новый метод обучения испанскому языку или лучший способ информировать покупателя о ценах на продукты в универсаме. Во-вторых, здесь независимая переменная более проста, чем описанные выше. Те, как правило, представляли собой сложные по составу "группы факторов". Эту же можно определить как единичную переменную. Так, единственное, чем отличаются условия в эксперименте с обонянием, -- это время поступления воздуха в каждую ноздрю. Напротив, когда сравниваются два метода обучения испанскому языку, то они оказываются различными не только по виду речи (разговорная или письменная), по и по используемым упражнениям, по числу проверок, по порядку ознакомления с темами и т. д. В-третьих, в обсуждаемых здесь экспериментах независимая переменная не только более изолирована, но и условия ее предъявления более тщательно "очищены". Так, в эксперименте с обонянием для ослабления посторонних раздражителей на испытуемого надевали наушники.

Напротив, в экспериментах, которые "улучшают" реальный мир, экспериментатор иногда специально вводит осложняющие обстоятельства, чтобы приблизить обстановку эксперимента к реальности и тем самым повысить внешнюю валидность. Так, в эксперименте с ночными посадками самолета было смоделировано движение второго самолета, о котором нужно было сообщать "на землю".

Новые эксперименты помогут нам углубить понимание переменных, влияющих на поведение. Такие эксперименты уже можно назвать научными. Их результаты могут не сразу найти практическое применение. Такова первая особенность трех экспериментов, упомянутых R начале данной главы. Они не обязательно связаны с "практикой". Но и слово "научный" следует употреблять с некоторыми оговорками. Весь смысл проведения экспериментов в том, чтобы через четкое и полное описание связей между независимой и зависимой переменными понять, что определяет поведение.

Вторая характерная черта -- выделение единичной независимой переменной указывает на то, что если полученные данные будут использованы для лучшего понимания поведения, необходима более точная экспериментальная гипотеза. Когда Дио:1 предположила, что поиск лучше вести без бинокля, она привела ряд доводов, как-то: ограниченность обзора в бинокле, отсутствие восприятия глубины. Если бы гипотеза подтвердилась, то это могло бы быть следствием либо всех названных причин, либо некоторых из них, либо каких-то причин, не упомянутых вовсе, Чтобы выделить действительную причину, требуются дальнейшие эксперименты. С этой целью мы должны изолировать независимую переменную и в нашей гипотезе, и в нашем эксперименте.

Третья особенность перечисленных экспериментов-- использование "чистых" условий. Это один из способов контролировать "шум" в эксперименте, Даже идеальный эксперимент в том виде, как он был описан ранее, не всегда имеет "чистые" условия. Другими словами, даже предъявление одному и тому же испытуемому сразу двух условий независимой переменной нс обеспечивает строгой проверки ее действия. Оба условия могут быть одинаково "нечистыми", одинаково "зашумленными". Например; двумя условиями могут быть два разных количества лекарства -- с одними и теми же примесями. В этом случае действие чистого лекарства выявить невозможно.

Очевидно, что чем точнее рабочая гипотеза, тем выше класс эксперимента. Как и ранее, эталоном при этом является безупречный эксперимент. Любой реальный эксперимент должен стремиться к безупречному. Безупречный в отношении внутренней валидности эксперимент -- это такой вариант идеального эксперимента, который мы можем назвать чистым экспериментом. Прежде всего это идеальный эксперимент со всеми вытекающими отсюда последствиями, но этого мало. Чистый эксперимент (также практически недостижимый) требует еще, чтобы экспериментатор оперировал только с выделенной независимой переменной и ни с чем больше. Более того, все другие переменные, которые могли бы воздействовать на поведение, остаются строго постоянными.

Одной из мер достижения этого является "очищение" условий независимой переменной, которое, как вы увидите, может привести даже к надеванию теплых наушников в августе. Другие способы обеспечения достаточно высокой внутренней валидности мы уже обсуждали: это устранение систематического смешения с побочными переменными.

Здесь, в лабораторных экспериментах, отличающихся от естественных, мы рассмотрим- некоторые новые виды смешения.

Смешения, описанные ранее, в основном проистекали из того факта, что одному и тому же испытуемому не могут быть предъявлены два разных условия одновременно. Конечно, такое "процедурное" по своей природе смешение остается проблемой и в этих экспериментах, как и в любых других. Но в лабораторных экспериментах, предполагающих выделение независимой переменной, существует также другая разновидность смешения. Она связана с тем, что экспериментатор не может создать совершенно "чистые" условия независимой переменной, как того требует эксперимент. Гаррет Хардии, сведущий биолог, хорошо выразил сущность этой трудности, сказав: "Мы никогда не можем иметь дело с чем-то одним" (1972, с. 68). Поскольку это "одно", что интересует экспериментатора, неизбежно соединено с чем-то "другим", мы говорим о сопутствующем смешении.

Первая разновидность такого смешения вызвана артефактами эксперимента. Экспериментатор дорого бы дал, чтобы удалить только ту небольшую часть мозга животного, которая фигурирует в его экспериментальной гипотезе. Но он не может этого сделать. Он непременно повредит другую ткань. Если теперь он сравнит свою экспериментальную группу (с частично удаленным мозгом) с контрольной группой (не подвергавшейся операции), то он смешает экспериментальную переменную с искусственно вызванной переменной. Будет неясно, обусловлена ли разница в поведении двух групп Животных удалением именно данной части мозга или оперативным вмешательством вообще?

Вторая разновидность сопутствующего смешения порождается не методикой эксперимента как таковой, а тем фактом, что независимая переменная "естественным" образом связана с другой переменной. Когда мать выходит из комнаты, оставив ребенка, его плач может быть вызван как тем, что ушла мать, так и тем, что он вообще остался один.

Избавление от подобного "естественного смешения" -- одна из главных забот экспериментатора, пытающегося выделить независимую переменную.

В связи с обсуждаемыми новыми экспериментами встает по-новому вопрос относительно внешней валидности, а именно -- вопрос, тот ли эксперимент был проведен. Эксперименты, направленные на выделение независимой переменной, часто предпринимаются, чтобы проверить истинность теории. В настоящее время теории, как правило, абстрактны, в то время как эксперименты должны быть конкретными. Необходимо, чтобы конкретная методика эксперимента вполне соответствовала экспериментальной гипотезе, изложенной в более абстрактных терминах.

Например, можно выдвинуть гипотезу, что отклонения в поведении подростков преодолеваются более эффективно рациональным путем ("убеждением"), чем наказанием. Экспериментатор должен применить какой-то конкретный вид наказания. Предположим, в качестве такового он выбрал неприятный звук зуммера (Ля Вуайе, 1973). Является ли- этот звук адекватной экспериментальной операционализацией абстрактного термина наказание Безусловно, нет. Скорее всего он будет действовать на рефлекторном уровне- (При этом может оказаться, что и самому экспериментатору придется надеть наушники.) Итак, эксперименты можно оценивать и с точки зрения операциональной валидности.

В)Количественные и качественные независимые переменные:

Преимущества многоуровневого эксперимента над двухуровневыми экспериментами выходят далеко за рамки только что описанного контроля. В общем можно оказать, что он способствует дальнейшему развитию понимания, обеспечивая проверку более разработанных экспериментальных 'гипотез.

Покажем прежде всего преимущество, которое определяется не тем, что используется несколько уровней независимой переменной, а тем, что независимая переменная представлена в количественной форме. В отличие от нее, качественная независимая переменная не поддается описанию с помощью чисел. Чтобы иметь качественную независимую переменную, эксперимент не обязательно должен быть двухуровневым. Мы видели в главе 4, что Гейтвуд и Перлофф (1973) сравнивали три способа сообщения о стоимости товаров покупателям универсама. Различия между тремя условиями были качественными, ибо их нельзя было описать числами. С другой 'стороны, хотя эксперимент по рабочей этике был двухуровневым (два условия.независимой переменной), независимая переменная в нем, как уже говорилось, была по существу количественной.

Уже сама способность вводить количественную или градуированную независимую переменную обнаруживает прогресс в выделении существенного фактора- Давайте сравним сходные эксперименты, в одном из которых используется качественная переменная, в другом -- количественная. Экспериментатор может выдвинуть гипотезу, что знаковая информация перерабатывается быстрее в зрительном 'канале, чем в слуховом. Затем он ставит эксперимент, в котором сравнивается скорость чтения и восприятие на слух. Для отобранных им текстов он находит, что его испытуемые могут читать и хорошо понимать текст со скоростью около 1000 слов в минуту; однако при восприятии на слух текста, который произносится со скоростью большей, чем 200 слов в минуту, понимание уже затрудняется. Без сомнения, такой эксперимент показывает, что человек может читать быстрее, чем слушать. Однако это не значит, что подтвердилась гипотеза о более быстрой переработке знаковой информации в зрительном канале. Чтение и прослушивание отличаются по многим параметрам. Один из них состоит в том, что при чтении человек может забегать вперед или возвращаться назад в поисках ключевых слов или идей. При слуховом же восприятии человек вынужден полагаться на свои ожидания или память для расширения его "настоящего времени".

Следуя за этим рассуждением, экспериментатор может попытаться выяснить, ухудшается ли чтение при ограничении объема материала, видимого в данный момент. С этой целью он использует ограничительную рамку, за которой движется строка печатного текста. Независимой переменной является ширина рамки: вмещается ли в нее в среднем одно слово, два слова, три слова, пять слов или десять слов. Может оказаться, что скорость чтения будет увеличиваться с расширением окошка (до некоторой величины). В результате такого эксперимента с количественной независимой переменной будут получены некоторые сведения о факторах, определяющих скорость чтения. Он заставит нас также проявлять большую осторожность при отнесении различий в чтении и слуховом восприятии текстов за счет фундаментальных различий в скорости зрительных и слуховых процессов переработки информации.

Конечно, сравнение скорости чтения и скорости слухового восприятия является ценным экспериментом, поскольку оно работает на экспериментальную гипотезу -Но гипотеза сама по себе еще ничего не прибавляет к пониманию, поскольку независимая переменная в ней -- это "клубок" факторов. Проверка той же самой гипотезы в эксперименте с ограничительной рамкой была бы более информативной, поскольку различные условия представлены в нем различными количествами лучше выделенной.переменной. Благодаря этому можно было бы лучше понять причину различий в результатах.

Как мы уже видели, существует много конкретных способов представления количественной независимой переменной: дозировка вещества, временной интервал между элементами списка, число элементов, которые нужно удержать.в памяти, необходимое число нажатий на рычаг, различный вес поднимаемых грузов и т. п. Здесь может быть также использовано психологическое шкалирование. Например, триграммы Калфи и Андерсон имели "высокую степень осмысленности". Большая группа испытуемых предварительно оценила множество триграмм по степени их осмысленности. Все триграммы, использовавшиеся Калфи и Андерсон, имели высокую оценку.

Существуют шкалы оценки вербального материала по таким различным параметрам, как произносимость и эмоциональность. Ассоциативная сила слова обычно - оценивается по продуктивному критерию -- количеству ассоциаций, которые может дать испытуемый на заданное слово в течение фиксированного периода времени. Опубликованы таблицы, содержащие разные типы подобных шкал (например, Ранквист, 1966). По желанию, экспериментатор может использовать их для.независимой переменной в исследованиях значимости степени осмысленности, произносимости, эмоциональности или ассоциативности. Например, он может исследовать зависимость между произносимостью слов и скоростью их запоминания.

В эксперименте можно шкалировать и большие единицы словесного материала. Например, можно оценить предложения по степени их приятности или ясности, Можно даже прошкалировать забавность шуток. Конечно, мнения испытуемых могут разойтись с вашим. Чтобы обойти эту трудность, нужно вначале взять большое число шуток, например 200. Затем предложить пятидесяти судьям оценить их по 10-балльной системе: 10-- самая смешная, 1 -- самая плоская. Отобрать затем только те шутки, которые всеми судьями будут оценены одинаково. Так могут остаться только 60 или около того уток. Шкальная оценка каждой из них будет просто средним баллом. Так может оказаться шутка с высшей оценкой 9,4; другая -- со средней оценкой 5,3; 3-я -- низкой оценкой 1,5. На таком материале можно далее проверять гипотезу, например, о том, что очень смешенные и очень саркастические шутки запоминаются лучше, чем умеренные. Конечно, первоначальная группа судей не должна участвовать в основном эксперименте.(2)

психологический эксперимент стимуляция опыт

Заключение

Итак, на основании вышесказанного можно сделать следующие выводы.

Фактор, изменяемый экспериментатором, называется независимой переменной; фактор, изменение которого вызывает независимая переменная, называется зависимой переменной. (3)

Независимая переменная (НП) - экспериментальное воздействие и экспериментальный фактор - управляемая (переменная), т.е. активно изменяемая исследователем.

Проблема выделения независимой переменной предполагает следующие аспекты:

- выделение из экспериментальной гипотезы таких следствий, фическая проверка которых подразумевает управление некоторыми условиями или контроль независимой переменной как причинно действующих факторов;

- обоснование контролируемой (управляемой) переменной как психологической, т. е. включение ее в причинную связь на уровне психологического объяснения;

- возможность реализации причинного воздействия (эксперементального) с точки зрения практического применения в научных целях.

Выделяются следующие виды независимых переменных (НП) как основания задания эксперементальных условий (Кэмбелл Д., 1980):

- управляемые переменные, или факторы, такие, как метод обучения, стимульные условия, отдельные стимулы;

- потенциально управляемые переменные, которые исследователь мог бы изменить, но не делает этого из-за сложности изменения условий (система школьного образования, предметы)

- относительно постоянные аспекты социального окружения:социально-экономический уровень, населенный пункт, школа и т. д

Они выступают как основания разбиения испытуемых на группы как уровни воздействия независимой переменной:

- "оргазмические" переменные - пол, возраст и т. д., определяющие возможность подбора групп, эквивалентных или отличающихся по этой характеристике;

- тестируемые или измеряемые переменные, т. е. весь тот арсенал психологических методик, по данным которых возможны классификации или выделение испытуемых в отдельные группы (например, методики выделения экстровертов - интровертов, тревожных - нетревожных и т.д.)

Для так называемых личностных переменных, реконструируемых (представляемых) на основании тестируемых показателей, управление независимой переменной сводится к подбору групп, отличающихся по заданному показателю, что означает использование уже не собственно экспериментальных, а квазиэкспериментальных схем.(4)

Билет28

Валидность по своей сути -- это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность.

По этой причине не существует какого-то единого универсального подхода к определению валидности. В зависимости от того, какую сторону валидности хочет рассмотреть исследователь, используются и разные способы доказательства. Другими словами, понятие валидности включает в себя разные ее виды, имеющие свой особый смысл. Проверка валидности методики называется валидизацией.

Валидность в первом ее понимании имеет отношение к самой методике, т. е. это валидность измерительного инструмента. Такая проверка называется теоретической валидизацией. Валидность во втором понимании уже относится не столько к методике, сколько к цели ее использования. Это прагматическая валидизация.

Понятие валидности

Ключевым критерием оценки качества методик, после надежности, является валидность. Вопрос о валидности методики решается лишь после того, как установлена достаточная ее надежность, поскольку ненадежная методика не может быть валидной. Но самая надежная методика без знания ее валидности является практически бесполезной.

Следует заметить, что вопрос о валидности до последнего времени представляется одним из самых сложных. Наиболее укоренившимся определением этого понятия является то, которое приведено в книге А. Анастази: «Валидность теста -- понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает».

Важную роль для понимания того, что методика измеряет, играет сопоставление ее показателей с практическими формами деятельности. Но здесь особенно важно, чтобы методика была тщательно проработана в теоретическом плане, т. е. чтобы имелась прочная, обоснованная научная база. Тогда при сопоставлении методики с взятым из повседневной практики внешним критерием, соответствующим тому, что она измеряет, может быть получена информация, подкрепляющая теоретические представления о ее сущности.

Если опять обратиться к истории развития тестологии, то можно выделить такой период (20-30-е гг. XX в.), когда научное содержание тестов и их теоретический багаж интересовали в меньшей степени. Важно было, чтобы тест работал, помогал быстро отбирать наиболее подготовленных людей. Эмпирический критерий оценки тестовых заданий считался единственно верным ориентиром в решении научных и прикладных задач.

Виды валидности и её нахождение

По определению американского текстолога А. Анастази, «валидность теста - понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Валидность свидетельствует о том, пригодна ли методика для измерения определённых качеств, особенностей и насколько эффективно она это делает. Наиболее распространённым способом нахождения теоретической валидности теста (методики) является конвергентная валидность, то есть сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними.

Сопоставление с методиками, имеющими другое теоретическое основание, и констатация отсутствия значимых связей с ними называется дискриминантной валидностью. Другой вид валидности - прагматическая валидность - проверка методики с точки зрения её практической значимости, эффективности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии, то есть используется независимый от теста, внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемого психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если например, методика измеряет особенности развития профессионально важных качеств, то для критерия необходимо найти такую деятельность или отдельные операции, где именно эти качества реализуются.

Для проверки валидности теста можно использовать метод известных групп, когда приглашаются люди, про которых известно, к какой группе по критерию они относятся (например, группа «высокоуспешных, дисциплинированных студентов» - высокий критерий и группа «неуспевающих, недисциплинированных студентов» - низкий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.

высокий критерий

низкий критерий

высокий результат теста

a

b

низкий результат теста

c

d

Здесь a - число испытуемых, попавших в высокую группу по тесту и по критерию, c - число испытуемых, попавших в высокую группу по критерию и имеющих низкие результаты теста. При полной валидности теста элементы b и c должны быть равны нулю. Меру совпадения, корреляции между крайними группами по тесту и критерию оценивают с помощью фи-коэффициента Гилфорда. Существует достаточно много разных способов доказательства валидности теста. Тест называется валидным, если он измеряет то, для измерения чего предназначен.

Валидность внешняя - применительно психодиагностических методик означает соответствие результатов психодиагностики, проводимой посредством данной методики, независимым от методики внешним признакам, относимым к субъекту обследования. Означает примерно то же самое, что валидность эмпирическая, с той разницей, что здесь речь идёт о связи между показателями методики и самыми важными, ключевыми внешними признаками, относимыми к поведению испытуемого. Психодиагностическая методика считается внешне валидной, если, например, её посредством оцениваются черты характера индивида и его внешне наблюдаемое поведение согласуется с результатами проведённого тестирования.

Валидность внутренняя - применительно психодиагностических методик означает соответствие содержащих в ней заданий, субтестов; соответствие результатов психодиагностики, проводимой посредством данной методики, определению оцениваемого психологического свойства, использованному в самой методике. Методика считается внутренне не валидной или недостаточно валидной, когда все или часть включённых в неё вопросов, заданий и субтестов измеряют не то, что требуется данной методикой. Очевидная валидность - описывает представление о тесте, сложившиеся у испытуемого. Тест должен восприниматься обследуемым как серьёзный инструмент познания его личности.

Очевидная валидность приобретает особое значение в современных условиях, когда представление о тестах в общественном сознании формируется многочисленными публикациями в популярных газетах и журналах того, что можно назвать квазитестами, с помощью которых читателю предлагается определить всё, что угодно: от интеллекта до совместимости с будущим супругом.

Конкурентная валидность оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена. П. Клайн отмечает, что данные о конкурентной валидности полезны тогда, когда есть неудовлетворительно работающие тесты для измерения некоторых переменных, а новые создаются для того, чтобы улучшить качество измерения. В самом деле, если уже существует эффективный тест, то для чего нужен такой же новый?

Прогностическая валидность устанавливается с помощью корреляции между показателями теста и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время. Например, прогностическая валидность какого-нибудь теста интеллекта может быть показана корреляцией его показателей, полученных у испытуемого в возрасте 10 лет, с академической успеваемостью в период окончания средней школы. Л. Кронбах считает прогностическую валидность наиболее убедительным доказательством того, что тест измеряет именно то, для чего он был предназначен. Основная проблема, с которой сталкивается исследователь, пытающийся установить прогностическую валидность своего теста, состоит в выборе внешнего критерия. В особенной степени чаще всего это касается измерения личностных переменных, где подбор внешнего критерия - чрезвычайно сложная задача, решение которой требует немалой изобретательности. Несколько проще обстоит дело при определении внешнего критерия для когнитивных тестов, однако и в этом случае исследователю приходится «закрывать глаза» на многие проблемы. Так, академическая успеваемость традиционно используется в качестве внешнего критерия при валидизации тестов интеллекта, но в то же время хорошо известно, что успехи в обучении далеко не единственное свидетельство высокого интеллекта. валидность методика тест психодиагностика

Инкрементная валидность имеет ограниченное значение и относится к случаю, когда один тест из батареи тестов может иметь низкую корреляцию с критерием, но не перекрываться другими тестами из этой батареи. В этом случае данный тест обладает инкрементной валидностью. Это может быть полезно при проведении профотбора с помощью психологических тестов.

Дифференциальная валидность может быть проиллюстрирована на примере тестов интересов. Тесты интересов обычно коррелируют с академической успеваемостью, но по-разному для разных дисциплин. Значение дифференциальной валидности, так же как и инкрементной, ограничено.

Содержательная валидность определяется через подтверждение того, что задания теста отражают все аспекты изучаемой области поведения. Обычно она определяется у тестов достижений (смысл измеряемого параметра полностью ясен), которые как еже указывалось, тестами, собственно психологическими не являются. На практике для определения содержательной валидности подбираются эксперты, которые указывают, какая область поведения наиболее важна, например, для музыкальных способностей, а затем, исходя из этого, генерируются задания теста, которые вновь оценивают эксперты.

Конструктная валидность теста демонстрируется полным, насколько это возможно, описанием переменной, для измерения которой предназначается тест. По сути дела, конструктная валидность включает в себя все подходы к определению валидности, которые были перечислены выше. Кронбах и Мил, которые ввели в психодиагностику понятие конструктной валидности, пытались решить проблему отбора критериев при валидизации теста. Они подчёркивали, что во многих случаях ни один отдельно взятый критерий не может служить для валидизации отдельного теста. Можно считать, что решение вопроса о конструктной валидности теста представляет собой поиск ответа на два вопроса:

1) существует ли реально некоторое свойство;

2) надёжно ли измеряет данный тест индивидуальные различия по этому свойству. Вполне понятно, что с конструктной валидностью связана проблема объективности в интерпретации результатов по изучению конструктной валидности, однако эта проблема общепсихологическая и выходит за рамки валидности.

Проблема измерения валидности

Проблема валидности возникает в процессе применения теста, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения. Чем валиднее тест, тем лучше он отражает то качество (свойство), ради измерения которого он создан.

Понятие валидности относится не только к тесту, но и к критерию оценки его качества. Чем выше коэффициент корреляции теста с критерием, тем выше валидность. Развитие факторного анализа позволило создавать тесты, валидные по отношению к идентифицируемому фактору. Только проверенные на валидность тесты могут быть использованы в научных исследованиях.

В то же время необходимо заранее предполагать, что ни один элемент измерительного инструментария не является валидным вообще, он может быть валидным лишь в определенном смысле. Математический тест не дает сведений о развитии интеллекта, об уровне владения лингвистическими навыками и др. Математический тест, предназначенный для второго полугодия 6-го класса, не является валидным для другой стадии обучения. Если тест ориентирован на содержание конкретного учебника, то его валидность для учащихся, работавшим по иным учебникам, является проблематичной. В связи с этим определение валидности теста требует постановки дополнительных вопросов: валидность для чего, для какой цели, по какому критерию?

На валидность измерения могут влиять различные факторы. Возрастные, социальные или временные изменения влияют, помимо заранее спланированных педагогических условий, на сформированность тех или иных качеств личности. Незапланированное и неучитываемое воздействие личности педагога-экспериментатора на учащихся. Ошибки и неточности, связанные с субъективностью оценки поступков, мнений и действий наблюдаемых учащихся. Нередко наблюдается случайный отбор школьников для проведения опытно-экспериментальной работы без учета требований типичности характерных проявлений изучаемых сторон личности, в этом случае нарушается условие репрезентативности выборки из генеральной совокупности. Преобладание в экспериментальном классе учащихся с крайними позитивными или негативными проявлениями изучаемого свойства или качества влияет на весь ход опытно-экспериментальной работы. Большая психологическая настроенность, определенная установка на участие в исследовательской работе, которая существует в экспериментальном классе в отличие от контрольного. Как правило, ученики экспериментального класса более податливы к различным воздействиям и влияниям экспериментатора, чем такие же ученики в независимых условиях. Неравномерные изменения в составе классов во время проведения исследовательской работы, так как появление в классе большого количества новых для этого коллектива учеников будет влиять на конечный результат.

Наряду с тремя важнейшими критериями качества измерения в литературе называются и другие критерии. Линерт (Lienert, 1969) различает, например, следующие:

а) нормирование теста, позволяющее включать результаты индивидуального тестирования в систему соотносительных понятий;

б) сопоставимость теста, возможная благодаря параллельным формам или благодаря тестам с одинаковой валидностью. В таком случае тест можно сравнить с его «близнецом» или «двойняшкой». К тому же при групповых исследованиях в школьных классах параллельные формы затрудняют списывание;

в) экономичность теста, имеющая место в том случае, если для проведения тестирования и обработки данных не требуется больших затрат времени и средств, если тест несложен и может использоваться в группах;

г) полезность теста, являющаяся максимальной, если существует большая практическая потребность в исследовании данного поведения и если для этой цели еще не разработано или разработано слишком мало методов.

Советский исследователь А.А. Кыверялг подробно описал такой критерий, как диагностическая ценность теста, используемый при конструировании тестов успеваемости.

Диагностическая ценность теста успеваемости определяется путем проведения предварительного опыта с так называемым «нейтральным классом», результаты которого в дальнейшей исследовательской работе не используются. В процессе обработки результата предварительной контрольной работы все полученные данные располагают в возрастающем порядке и определяют медиану, т.е. величину члена, находящегося в середине ряда. Учеников, которые получили оценку ниже медианы, считают «слабыми», тех, кто получил оценку выше медианы, считают «сильными».

Заключение

Понятие валидности отражает прагматическую идею обязательной практической проверки качества измерения психологических свойств человека. Если раньше понятие валидности чаще других ассоциировалось с понятием «качество теста», то в последние годы всё больше осознаётся роль интерпретации тестовых результатов. Таким образом, валидность - это, прежде всего, адекватность интерпретации тестовых результатов по отношению к цели тестирования, содержанию основного понятия (содержанию диагносцируемого психического свойства) и применению результатов тестирования (в профотборе и других прикладных психологических обследованиях). В контексте прикладной задачи валидность представляет собой не столько критерий качества теста, сколько показатель меры соответствия теста цели тестирования. Итак, понятие валидности относится не только к тексту, но и к критерию оценки его качества. Чем выше коэффициент корреляции теста с критерием, тем выше валидность. Развитие факторного анализа позволило создавать тесты, валидные по отношению к идентифицируемому фактору. Только проверенные на валидность тесты можно использовать в профессиональной ориентации, профессиональном отборе и в научных исследованиях.

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности[2].

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Внутренняя Валидность

(internal validity) В. в. относится к степени уверенности, с к-рой можно судить о предполагаемой каузальной связи между переменными. Эксперимент обладает В. в. в той мере, в какой наблюдаемые эффекты можно отнести к влиянию независимых переменных, а не к.-л. др. посторонних факторов. Приписывание причинной обусловленности обычно 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]