Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект лекций-экспериментальная пси-я

.pdf
Скачиваний:
101
Добавлен:
07.02.2015
Размер:
532.23 Кб
Скачать

труднительна или приводит к «разрыву» экспериментальной про- цедуры (выполнение теста на внимание);

когда оценка воспринимается испытуемым как неотъемлемая часть экспериментальной процедуры (подсчёт суммы баллов при выпол- нении арифметических задач);

когда есть уверенность, что испытуемый заинтересован в объек-

тивной оценке исследуемого качества и не будет преднамеренно или неумышленно вносить искажения или неточности в результа- ты (например, если инициатива на проведение психодиагностиче- ского исследования поступала со стороны испытуемого, испытуе- мый мотивирован на тщательное выполнение задания или при вы- полнении методик для самотестирования).

Процедура подсчёта баллов зачастую длительная и утомитель- ная процедура, поэтому необходимо её автоматизировать в макси- мально возможной степени. Идеальным и свободным от ошибок об- работки способом является компьютерная психодиагностика с ис- пользованием специализированного программного обеспечения.

Подсчёт баллов по ключу может быть значительно упрощён, если в ответном бланке пункты будут располагаться определённым обра- зом, так чтобы сумма баллов по вертикали или по горизонтали была равна значению по одной из шкал (бланки ответов сокращённого ва- рианта 16-факторного личностного опросника Р. Кэттела, теста Лири и пр.). Полученные в результате подсчёта значения называются сырыми баллами. Во многих одношкальных методиках для оценки выраженности и формулировки заключения пользуются сырыми бал- лами.

Полученные значения в сырых баллах могут быть тут же под- вергнуты простейшему количественному анализу. Если определены границы выраженности изучаемого признака выражен»/«не выражен» или «высокий»/«средний»/«низкий»), то можно подсчитать процентное соотношение этих показателей. Также можно определить характер распределения показателя.

Проще всего это сделать, если заранее заносить все данные в электронную таблицу. Тогда помимо «сырых» показателей, в элек- тронной таблице можно будет при помощи простых формул автома- тически вычислить:

среднее значение показателя;

стандартное отклонение – показатель «размаха» значений;

41

процентное соотношение высоких, средних и низких показателей по шкале.

Помимо значений шкал в электронную таблицу есть смысл зано- сить (см.: рисунок):

Ф.И.О. испытуемого, его шифр или порядковый номер для того, чтобы не запутаться при вводе результатов;

пол испытуемого – в дихотомической шкале (мужской=1, жен- ский=0, или наоборот);

возраст – полных лет;

образование – значения либо в ранговой шкале (0=неграмотный; 1=начальное; 2=неполное среднее; 3=среднее; 4=среднее специ- альное; 5=высшее), либо при необходимости можно перейти на шкалу интервалов, указав соответствующее количество лет обуче- ния (0, 4, 9, 11, 13 и 16 соответственно);

семейное положение, наличие детей, отношение к вере и другие значимые для исследователя показатели в дихотомической или ранговой шкале.

 

 

 

 

 

A

 

 

B

 

 

C

 

 

D

 

 

E

 

 

F

 

 

G

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

ФИО

 

Пол

 

Возр.

 

Холер

 

Сангв

 

Флегм

 

Меланх

 

Сит-

 

 

 

 

 

(М=1)

 

 

 

 

 

 

Трев

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Иванова А.С.

0

 

26

 

14

 

8

 

12

 

5

 

36

 

3

 

 

 

Петров С.И.

1

 

34

 

3

 

0

 

14

 

6

 

69

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

Сидоров А.П.

1

 

49

 

8

 

11

 

2

 

5

 

59

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

81

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

СРЕДНЕЕ

0,37

 

27,64

 

9,12

 

7,24

 

6,98

 

5,18

 

42,65

 

 

82

 

 

 

 

 

 

 

 

 

 

83

 

 

 

СТАНД. ОТКЛ

0,49

 

12,23

 

3,54

 

2,12

 

5,11

 

0,87

 

14,67

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

84

 

 

 

ВЫСОКИЙ УР-НЬ

 

 

 

 

 

 

23,5%

 

14,4%

 

13,2%

 

0,0%

 

18,6%

 

85

 

 

 

 

 

 

 

 

 

 

 

 

 

 

86

 

 

 

СРЕДНИЙ УР-НЬ

 

 

 

 

 

 

68,2%

 

61,3%

 

54,4%

 

24,8%

 

66,9%

 

87

 

 

 

НИЗКИЙ УР-НЬ

 

 

 

 

 

 

8,3%

 

24,3%

 

32,4%

 

75,2%

 

14,5%

 

Образец электронной таблицы

2. В некоторых случаях сырые баллы при помощи линейного пре-

образования по специальной формуле или таблице переводятся в стандартизированные оценки. Это делается для того, чтобы привести распределение значений шкалы как можно ближе к нормальному, или Гауссовскому, распределению. Таким образом, появится возможность

42

оценивать показатели, включающие в себя разное количество пунк- тов.

Часто такое преобразование выполняется отдельно для мужчин и женщин, для лиц различного возраста и разных профессиональных групп и т.п. Наличие стандартизированных оценок для разных поло-

возрастных и профессиональных категорий испытуемых указывает на профессиональный подход исследователей к разработке и апробации методики.

Значительно удобнее работать и изображать графически набор шкал с одинаковыми границами выраженности высоких, средних и низких показателей, чем делать это для каждой шкалы отдельно.

Следует напомнить, что нормальное распределение обладает сле- дующими свойствами:

в диапазоне σ находится 68,26% всех значений показателя;

в диапазоне M±2σ находится 95,44% всех значений показателя;

в диапазоне M±3σ находится 99,72% всех значений показателя.

Соответственно, следует отметить, что линейное преобразование возможно лишь для тех шкал, распределение показателей которых близко к нормальному. Если распределение показателей шкалы не соответствуют нормальному, то перед преобразованием необходимо провести эмпирическую нормализацию (например, изменить содер- жание тестовых заданий, усложнить или облегчить их), или восполь- зоваться нелинейной нормализацией.

Чаще всего сырые баллы переводят в следующие шкалы: стены, T-баллы и процентили.

Шкала стенов была предложена Р. Кэттелом и используется при обработке результатов его 16-факторного опросника. В ней всего 10 баллов, и она обладает следующими особенностями распределения: M=5,5; σ=2. Каждому из 10 стандартных значений ставится в соот- ветствие интервал значений «сырых» баллов. Среднее «сырых» бал- лов делит шкалу стенов ровно пополам, т.е. является границей стенов 5 и 6. Границей следующих стенов, 6 и 7, является значение Mсыр+0,5σсыр, т.е. в этот интервал входят значения между средним и средним плюс половина стандартного отклонения сырых баллов. Со- ответственно, границей стенов 4 и 5 станет значение Mсыр–0,5σсыр. Крайние границы остаются открытыми.

Шкала T-баллов аналогична шкале стенов, но в ней 100 баллов и стандартное отклонение в пределах 10 баллов (M=50; σ=10). В дан- ной шкале среднему «сырых» баллов соответствует 50 T-баллов, а

43

значение стандартного отклонения в 2 раза меньше по сравнению со шкалой стенов. Шкала T-баллов широко используется в многофак-

торных личностных методиках при построении профиля личности

(MMPI, ISTA и др.).

Шкала процентилей делит шкалу значений на 100 интервалов. Границами интервалов являются кумулятивные (накопленные) часто- ты, выраженные в сотых долях процента всех значений. Интервалы в шкале процентилей различной ширины по краям широкие, ближе к центру узкие. Например, при определении 10-го процентиля (P10) сначала все значения признака упорядочиваются по возрастанию, затем отсчитывается 10% испытуемых, имеющих наименьшую выра- женность признака. P10 будет соответствовать тому значению при- знака, который отделяет эти 10% испытуемых от остальных 90%.

Стандартизация или Z-преобразование данных – это перевод измерений в стандартную Z-шкалу (Z-scores) со средним M=0 и σ=1, как у кривой нормального распределения.

Сначала для переменной, измеренной на выборке, вычисляют среднее MX и стандартное отклонение σX. Затем все значения пере- менной x пересчитываются по формуле:

ZI = (xI-MX)/σX

В результате преобразованные значения (z-значения) непосредст- венно выражаются в единицах стандартного отклонения от среднего.

Если для одной выборки несколько признаков переведены в z-значения, появляется возможность сравнения уровня выраженности разных признаков у того или иного испытуемого.

Для того чтобы избавиться от неизбежных отрицательных и дробных значений, можно перейти к любой другой известной шкале: IQ (M=100; σ=15); Т-баллов (M=50; σ=10); 10-балльной шкале стенов (M=5,5; σ=2) и др. Перевод в новую шкалу осуществляется путем умножения каждого z-значения на заданное стандартное отклонение и прибавления среднего:

SI = σSzI+MS.

Таким образом, стандартизация данных является универсальным способом «выравнивания» сырых значений. Стандартизация может проводиться отдельно для мужчин и женщин, для лиц разного возрас- та, профессий и др.

44

Ранжирование

Под ранжированием понимают определённый порядок сортиров- ки значений, представленных в числовой шкале (как правило, ранго- вой). Ранжировать можно как качественные, так и количественные признаки измеряемого свойства. Ранжирование предполагает особую перегруппировку данных, которая позволяет упорядочить показатели

от наименее выраженных до наиболее выраженных с сохранением порядка.

Процедура ранжирования заключается в присвоении каждому значению порядкового номера. Самому большому или самому ма- ленькому значению присваивается ранг 1, следующему по величине – 2 и т.д. Последнему значению присваивается номер, равный общему количеству значений.

Если возникает ситуация, когда имеется несколько одинаковых значений, им всем присваиваются ранги, равные среднему арифмети- ческому их условных рангов.

Показатель

Знач.

Ранг

 

Знач.

Ранг

 

Знач.

 

Усл. ранг

 

Ранг

Энергичность

16

4

 

16

4

 

7

 

7

 

7

Целеустремлённость

24

7

 

24

1

 

1

 

1

 

1

Настойчивость

8

1

 

8

7

 

3

 

(2)

 

2,5

Интуиция

12

2

 

12

6

 

3

 

(3)

 

2,5

Коммуникабельность

23

6

 

23

2

 

5

 

5

 

5

Эмпатия

14

3

 

14

5

 

4

 

4

 

4

Добросовестность

19

5

 

19

3

 

6

 

6

 

6

Если ранжирование было проведено правильно, то сумма всех рангов должна равняться значению:

Σ = n*(n-1)/2,

где n количество ранжируемых признаков.

3. Все критерии условно подразделены на две группы: парамет- рические и непараметрические критерии. Критерий является параметрическим, если он основан на определённом типе распределения генеральной совокупности (нормальном) или использует определён- ные параметры этой совокупности (среднее, дисперсию, стандартное отклонение и пр.). Если критерий «свободен» от распределения и не использует вышеуказанные параметры, он называется непараметри-

ческим.

45

При нормальном распределении параметрические критерии об- ладают большей мощностью, т.е. они способны с большей достовер- ностью доказывать или опровергать изучаемую взаимосвязь явлений. Однако, как показывает практика, большее число получаемых в пси- хологических экспериментах данных не распределены по нормально- му закону, и применение к ним параметрических методов анализа может привести к ошибкам в статистических выводах. В этом случае более мощными оказываются непараметрические критерии. Непара- метрические критерии выявляют значимые различия и в том случае, если распределение близко к нормальному, однако менее значимые различия не поддаются выявлению с их помощью.

4. При использовании статистических методов в психологиче- ских экспериментах необходимо чётко осознавать, для решения како- го рода задач применяется тот или иной метод (см.: таблица).

Классификация задач и методов их решения (по Е.В. Сидоренко, О.Ю. Ермолаеву)

 

 

 

Задачи

Условия

Методы

 

 

Критерий Мак-Немара

Выявление разли-

2 выборки

Q критерий Розенбаума

U критерий Манна—Уитни

чий в уровне иссле-

 

 

φ критерий (угловое преобразование Фишера)

дуемого признака

 

3 и больше выборок

S критерий Джонкира

 

 

Н критерий Крускала-Уоллиса

 

 

 

2 замера на одной и

Т критерий Вилкоксона

Оценка сдвига зна-

G критерий знаков

той же выборке

φ критерий (угловое преобразование Фишера)

чений исследуемого

 

t-критерий Стьюдента

признака

3 и более замеров на

χ²фр критерий Фридмана

 

одной и той же выбор-

L критерий тенденций Пейджа

 

ке

t-критерий Стьюдента

 

при сопоставлении

χ² критерий Пирсона

 

эмпирического распре-

Выявление разли-

деления с теоретиче-

λ критерий Колмогорова—Смирнова

t-критерий Стьюдента

чий в распределе-

ским

 

нии признака

 

 

при сопоставлении

χ² критерий Пирсона

 

двух эмпирических

λ критерий Колмогорова—Смирнова

 

распределений

φ критерий (угловое преобразование Фишера)

 

 

φ коэффициент корреляции Пирсона

Выявление степени

 

τ коэффициент корреляции Кендалла

двух признаков

R бисериальный коэффициент корреляции

согласованности

η корреляционное отношение Пирсона

изменений

 

ρ коэффициент ранговой корреляции Спирмена

 

 

r коэффициент корреляции Пирсона

 

 

Линейная и нелинейная регрессии

46

 

 

 

Задачи

Условия

Методы

 

 

ρ коэффициент ранговой Корреляции Спирмена

 

трех или большего

r коэффициент корреляции Пирсона

 

Множественная и частная корреляции

 

числа признаков

Линейная, криволинейная и множественная

 

 

регрессия

 

 

Факторный и кластерный анализы

 

 

S критерий Джонкира

 

 

L критерий тенденций Пейджа

Анализ изменений

под влиянием одного

Однофакторный дисперсионный анализ

Критерий Линка и Уоллеса

фактора

признака под влия-

Критерий Немени

нием контролируе-

 

Множественное сравнение независимых выбо-

мых условий

 

рок

 

под влиянием двух

 

 

факторов одновремен-

Двухфакторный дисперсионный анализ

 

но

 

47

Лекция 9. ИНТЕРПРЕТАЦИЯ И ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ

План:

1.Ошибки принятия и отвержения гипотезы.

2.Обобщение выводов на генеральную совокупность.

3.Требования к оформлению работы.

1.В самом начале эксперимента у исследователя есть целый на- бор гипотез, число которых может исчисляться десятками. После оз- накомления с научной литературой и определения плана эксперимен- та, количество гипотез ограничивают до двух: основной и альтерна- тивной. В дальнейшем в ходе процедуры статистической интерпрета- ции данных происходит оценка сходств и различий. Как правило, ученый ищет различия, закономерности. При проверке статистиче-

ских гипотез используются лишь два понятия: Н1 (гипотеза о различии) и Н0 (гипотеза о сходстве). Подтверждение гипотезы о разли- чии свидетельствует о верности статистического утверждения Н1, а подтверждение их отсутствия о принятии утверждения Н0.

При статистическом выводе возможны различные варианты ре- шений. Исследователь может принять или отвергнуть статистическую нуль-гипотезу, но это вовсе не означает, что это в действительности так, и подобный вывод может быть или верным, или ложным. Соот- ветственно возможны четыре исхода: принятие верной нуль- гипотезы, принятие ложной нуль-гипотезы, отвержение ложной нуль- гипотезы, отвержение верной нуль-гипотезы. Два варианта решения правильны, два ошибочны. Ошибочные варианты называются ошибками 1-го и 2-го рода.

Решение

Гипотеза

 

Верна гипотеза H0

 

Верна гипотеза H1

 

 

Принята гипотеза H1

Ошибка 1-го рода

 

Верное решение

 

 

 

 

Принята гипотеза H0

Верное решение

 

Ошибка 2-го рода

 

 

 

 

Ошибка 1-го рода особо значима в уточняющем (конфирматор- ном) эксперименте, а также в тех случаях, когда принятие неверной гипотезы о различиях имеет практическую значимость. Допустим, принятие ложной гипотезы об интеллектуальных различиях предста- вителей разных социальных страт или этнических групп имеет чрез- вычайно значимые социально-политические следствия.

48

Чем больше число испытуемых и опытов, чем выше статистиче- ская достоверность вывода (принятый уровень значимости), тем меньше вероятность совершения ошибок 1-го рода.

Ошибки 2-го рода отвержение верной исследовательской гипо- тезы и принятие нуль-гипотезы особенно существенна при проведе- нии пробного (эксплораторного) эксперимента.

Отклонение исследовательской гипотезы на начальной стадии может надолго закрыть дорогу исследователям в данной предметной области.

Всвязи с этим уровень статистической достоверности при прове-

дении эксплораторного эксперимента на малых выборках стремятся понизить, т.е. выбирают p = 0,1 или p = 0,05. Исследователь, скорее всего, желает получить подтверждение своим собственным мыслям, поэтому субъективная значимость ошибок 2-го рода значительно ни- же, чем субъективная значимость ошибок 1-го рода.

Вконкретных исследованиях значимость ошибок 1-го и 2-го рода может сильно зависеть от целей, которые преследуются в экспери- менте, от предмета изучения и характера решаемой исследователь- ской задачи и т.д.

Принятие или отвержение статистической гипотезы не является единственным условием принятия или не принятия эксперименталь- ной гипотезы. Если статистическая гипотеза отвергнута, то исследо-

ватель может или завершить эксперимент и предпринять попытку выдвижения новых гипотез, или провести новое исследование на расширенной выборке с использованием модифицированного экспе- риментального плана. «Отрицательный» результат тоже результат,

так как сам эксперимент есть способ выбраковки нежизнеспособных гипотез. Отклонение экспериментальной гипотезы не означает, что теорию, следствием которой она являлась, следует сразу отбросить. Возможно, что неверно сформулирована теоретическая гипотеза или она не достаточно корректно реализована в эксперименте.

2. В случае принятия гипотезы перед исследователем встаёт про- блема обобщения результатов эксперимента: на какие группы испы- туемых могут быть распространены выводы, в каких условиях будут воспроизводиться результаты и не будет ли влиять на результаты ис- следования смена экспериментатора? В психологии эксперименталь- ный результат должен быть инвариантен (неизменен) по отношению не только ко всем объектам данного типа, к пространственно- временным и другим условиям проведения эксперимента, но и к осо-

49

бенностям взаимодействия экспериментатора и испытуемого, а также к содержанию деятельности испытуемого.

При обобщении (генерализации) выводов необходимо обращать внимание на следующее:

1.Особенности выборки. Ограничителями генерализации выступа- ют внепсихологические характеристики популяции: биологические и социокультурные. К основным биологическим характеристикам относятся пол, возраст, раса, конституциональные особенности, физическое здоровье. Социокультурные особенности являются вторым важнейшим ограничением обобщения результатов. Реша- ется проблема возможности распространения данных на предста- вителей других народов и культур в кросскультурных исследова- ниях. Аналогичная работа проводится по уточнению влияния на результаты эксперимента таких дополнительных переменных, как уровень образования и уровень доходов испытуемых, классовая принадлежность и т.д. Для проверки выводов, во-первых, проводят

дополнительные эксперименты на группах представителей той же популяции, не вошедших в первоначальную выборку. Во-вторых,

стремятся максимально увеличить в уточняющих экспериментах численность экспериментальной и контрольных групп.

2.Содержание эксперимента. В психологическом эксперименте наиболее важны не пространственно-временные факторы, а усло- вия деятельности испытуемого и особенности заданий (вариация инструкции, материал заданий, предусмотренные в задании дейст- вия испытуемого, вид мотивации, присутствие или отсутствие «об- ратной связи»). Невозможно на основе данных одного эксперимен- та предсказать, в какой мере они влияют на результат. Исследова- тель должен провести дополнительные экспериментальные иссле- дования, варьируя в них дополнительные переменные, относящие- ся к характеристикам экспериментального задания.

3.Влияние личности экспериментатора. Данная проблема подроб-

но разбиралась в лекции 7.

Возможны две стратегии проведения дополнительных исследо- ваний:

1.ограничение генерализации путем введения дополнительных пе- ременных в план эксперимента;

2.индуктивный путь на основе перепроверки результатов на других рандомизированных экспериментальных выборках.

50