Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский педагогический государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Бурлачук Л.Ф. Психодиагностика.doc

Скачиваний:

109

Добавлен:

04.11.2018

Размер:

4.29 Mб

Скачать

☆

<<< < Предыдущая 33 34 35 36 37 38 39 40 41 42 43 4445 / 7745 46 47 48 49 50 51 52 53 54 55 56 57 > Следующая >>>

3.9. Стандартизация теста

Одним из важных отличий психометрических тестов является то, что они стандартизированы, а это позволяет сравнить показатели, полученные одним испытуемым, с таковыми в генеральной совокупности или соответствующих группах.

1 68 Глава 3. Психометрические основы психодиагностики: основные этапы...

Тем самым достигается адекватная интерпретация показателя отдельного испытуемого. Таким образом, стандартизация теста наиболее важна в тех случаях, когда осуществляется сравнение показателей обследуемых. При этом вводится понятие нормы, или нормативных показателей. Для получения стандартных норм нужно тщательно отобрать большее количество испытуемых в соответствии с ясно обозначенным критерием. При формировании выборки стандартизации следует учитывать ее объем и репрезентативность. В руководствах по тестам чаще всего указывается на то, что для простого уменьшения стандартной погрешности достаточной будет выборка из 500 испытуемых. Однако репрезентативность выборки не зависит от ее объема. Например, для того чтобы получить нормативные показатели для всей популяции детей, обучающихся в начальной школе, потребуется выборка объемом более 10 тысяч, тогда как выборка из такой ограниченной популяции, как шеф-пилоты авиакомпаний, не может быть столь значительной. Репрезентативность выборки, таким образом, параметр более важный, нежели ее объем. В некоторых случаях приходится формировать несколько групп стандартизации или стратифицировать группу стандартизации относительно таких параметров, как возраст, пол, социальный статус. Устанавливать нормы не всегда обязательно. При использовании психологических тестов в научном исследовании нормы не столь важны и достаточно «сырых» показателей теста.

Нормы для каждой группы должны быть представлены в средних величинах и показателе стандартного отклонения. Расчет средней величины элементарен и хорошо известен, а стандартное отклонение определяется с помощью формулы, имеющей вид:

где SD — стандартное отклонение; X² — результат всего опросника всех испытуемых; п — количество испытуемых; 2 — сумма.

Сегодня на практике все больше используется такой тип производной оценки, как стандартные показатели, удовлетворяющий большинству требований, предъявляемых к психологическому измерению. Такие показатели выражают отличие индивидуального результата испытуемого от среднего в единицах стандартного отклонения соответствующего распределения. Стандартные показатели получают двумя путями: линейным и нелинейным преобразованием первичных («сырых») оценок. В случае линейного преобразования сохраняются все свойства исходного распределения «сырых» оценок, и такие показатели называются стандартными или z-показателями. Для вычисления z-показателя находят разность между первичной оценкой и средним для нормативной группы и делят ее на стандартное отклонение нормативной группы. Формула имеет вид:

Здесь необходимо сказать о том, что основной причиной преобразования первичных оценок в некоторую производную шкалу является желание получить показатели, которые сопоставимы между собой вне зависимости от того, по какому

тесту они получены. Линейное преобразование позволяет получить показатели сопоставимые лишь в том случае, когда распределения «сырых» оценок, по которым они рассчитываются, имеют примерно одинаковую форму. Для того чтобы сопоставлять показатели, полученные на основе распределений разной формы, прибегают к нелинейному преобразованию, или к нормализованным стандартным показателям. Процедура нелинейного преобразования достаточно проста и описана в многочисленных руководствах по математической статистике. Такие показатели обычно рассчитывают с помощью таблиц. В этих таблицах приводится процент случаев, приходящихся на участки, которые отстоят от среднего нормальной кривой на некоторое число единиц стандартного отклонения. Сначала определяют процент лиц, чьи показатели превышают каждую «сырую» оценку, а затем по этому проценту в таблице отыскивают соответствующее значение нормализованного стандартного показателя. Эти показатели, как и линейно преобразованные, будут иметь среднее (X), равное 0, и стандартное отклонение (SD), равное 1. Нулевое значение показывает, что испытуемый попадает в точку, соответствующую среднему нормальной кривой, превосходя 50 % группы. В случае, если показатель равен — 1, испытуемый превосходит примерно 16 % группы, а если +1 — превосходит 84 % группы. Нормализованным стандартным показателям можно придать любую удобную форму, например, умножив его на 10 и прибавив произведение к 50, получаем так называемый «Г-показатель» и в этом случае Т, равное 50, соответствует среднему, равному 60 — превышает среднее на одно стандартное отклонение и т. д. С другими, не менее популярными нелинейными преобразованиями «сырых» показателей теста, можно ознакомиться в соответствующей литературе¹.

Созданием стандартизованного теста и его публикацией обычно завершается работа психолога, однако следует помнить и о том, что с течением времени необходим пересмотр (ревизия) теста. Достаточно вспомнить о тестах интеллекта (см. гл. 4), нормы по которым устаревают через каждые 5 лет, и можно предположить, что процесс их старения будет ускоряться. Для наглядности этапы конструирования теста представлены на рис. 3.1.

Пример из практики: определение надежности опросника 16 РРКеттелла. Личностный опросник Раймонда Кеттелла 16 Pi⁷ (16 личностных факторов) относится к наиболее распространенным психодиагностическим инструментам и не нуждается в специальном представлении. Уже без малого 50 лет психологи всего мира используют его для решения разнообразных прикладных и научных задач. Однако как в бывшем СССР, так и ныне во вновь образованных странах этот опросник, несмотря на достаточно большую популярность, используется непрофессионально, с нарушением всех норм и правил, предъявляемых к психологическим тестам.

Кроме различных переводов опросника, которые существенно отличаются один от другого, в русскоязычной литературе часто встречаются и различные

¹ См., напр., БурлачукЛ. Ф., Морозов С. М, Словарь-справочник по психодиагностике. — СПб.: Питер, 1999, а также Гласе Дж., Стэнли Дж. Статистические методы в педагогике и психологии / Пер. с англ. — М.: Прогресс, 1976.

Рис. 3.1. Этапы конструирования теста

«ключи» к его факторам. Опубликованные в многочисленных сборниках и брошюрах варианты опросника не защищены (!) от ошибок и произвольного вмешательства в его текст. Если добавить к этому отсутствие нормативных данных, а также то, что не проводилась проверка гомогенности шкал опросника на отечественных выборках, то непонятно, какого рода результаты получали его многочисленные пользователи, какими диагностическими заключениями они оперировали. За последние пятнадцать лет у нас появились только три (!) работы, в которых ставилась задача проверки факторной структуры 16PFna национальных выборках:

это статьи В. М. РусаловаиО. В. Гусевой (1990), Ю. М. Забродина, В. И. Похиль-ко и А. Г. Шмелева (1987), наконец, украинского психолога А. Г. Виноградова (1997). Читателю нетрудно сравнить это количество публикаций с тем множеством работ, в которых опросник использовался для получения «диагностически значимых результатов». Сказанное позволяет сделать вывод о том, что с помощью опросника 16PFизмеряется нечто, имеющее неясное отношение к факторам личности, выделенным и описанным Кеттеллом.

Занимаясь работой по психометрической адаптации личностных опросников¹, мы не могли обойти вниманием и столь широко распространенный, как 16PF. За основу была взята форма «А» опросника 16PF. Были обследованы 227 человек (135 женщин и 92 мужчины) в возрасте от 16 до 51 года. Средний возраст исследуемых составлял 28 лет. Это были люди, которые проходили отбор на различные должности в коммерческие организации Киева, все они имели высшее или среднее специальное образование (бухгалтеры, коммерческие директоры, менеджеры разного уровня).

Как известно, точность измерения с помощью психодиагностического инструмента определяется его надежностью. С целью выяснить, насколько точен прогноз, даваемый психологом на основании результатов 16PF, данные, первоначально полученные нами, были оценены по авторским ключам на внутреннюю согласованность с помощью коэффициента Кронбаха, вычисляемого по следующей формуле:

где а — коэффициент Кронбаха; г — количество заданий теста; S² — дисперсия по j-му пункту теста; 5^ — дисперсия суммарных баллов по всему тесту.

В табл. 3.6 содержатся данные о внутренней согласованности факторов личности, полученные по авторским «ключам» (приведено буквенное обозначение фактора). Как видно из таблицы, значение коэффициента Кронбаха неудовлетворительно для большинства факторов. А фактор N вообще измеряет нечто, не имеющее никакого отношения к проницательности, расчетливости и наивности (если употреблять обыденное название этого фактора). Лишь некоторые из факторов, например фактор /•'(сургенция—десургенция) и фактор Н пармия—тректия (смелость—робость), надежно измеряют то, что должны измерять. Таким образом, в результате проверки надежности—согласованности оригинальных ключей было показано, что ряд шкал опросника негомогенны. Можно предположить, что это следствия искажения смысла заданий при переводе на русский язык и/или существования известных культурных различий.

Для того чтобы выявить, что же именно стоит за данными, получаемыми с помощью 16PF, мы использовали факторный анализ. Факторы извлекались методом

¹ Автор выражает свою признательность за участие в этой работе своему бывшему аспиранту Виталию Духневичу.

172 Глава 3. Психометрические основы психодиагностики: основные этапы...

Таблица 3.6

Данные о внутренней согласованности

по факторам личности, выделенным Кеттеллом

Обозначение фактора

Коэффициент Кронбаха

1	А	0,335699
2	С	0,293849
3	Е	0,210113
4	F	0,640528
5	G	0,403974
6	Н	0,727452
7	I	0,521693
8	L	0,172452
9	М	0,138720
10	N	0,005232
11	0	0,443746
12	Q^	0,002209
13	Q.2	0,379002
14		0,452439
15	Ол	0,486635

Рис. 3.2. Диаграмма собственных значений, на основе которой принималось решение о количестве факторов

главных компонент, оценка общностей производилась после выделения факторов. Решение о количестве факторов принималось на основании анализа диаграммы собственных значений — scree-plot (рис. 3.2). На так называемом «графике осыпи» (автором которого является Кеттелл) находилась точка перегиба, правее которой, как показали модельные эксперименты автора опросника, обычно расположены так называемые «шумящие» факторы. Этот критерий позволяет выде-

лить гораздо меньшее число факторов, чем применяемый большинством пользователей статистических пакетов метод Кайзера, базирующийся на величине собственного значения фактора. Вращение факторов производилось методом VARIMAX с нормализацией по Кайзеру. Коэффициенты факторных баллов были вычислены методом регрессии. Статистическая обработка производилась с помощью программы SPSS для Windows (версия 5.0). В качестве значимых рассматривались нагрузки заданий, которые по абсолютной величине превосходили 0,3. Данная граница была принята по следующим соображениям: поскольку нагрузка представляет собой коэффициент корреляции задания и фактора, при данном его объеме эта величина является значимой и позволяет объяснить до 10 % вариации задания. Как показывает опыт, установление более высокой границы приводит к резкому падению согласованности шкалы, особенно при кросс-валидизации. При этом заметим, что небольшое количество наших испытуемых, конечно, не репрезентирует генеральную совокупность. Кроме того, нами не проводилось исследование стойкости факторного решения, полученного в исследовании (кросс-вали-дизация). Наконец, задания по фактору В, а также задания 1,2 и 187 были исключены из анализа.

Обычно на таком графике кривая имеет две точки изгиба. Для интерпретации оставляют те факторы, которые размещены перед вторым изгибом кривой. Получается, что в нашем случае следует оставить 7 факторов. Интересно, что приблизительно такое же количество факторов обнаруживается в большинстве исследований структуры личностной лексики в разных языках и совокупностей заданий личностных опросников. Выделенные факторы были интерпретированы следующим образом.

Тревожность — эмоциональная стабильность.
Энергичность, активность — пассивность.
Настойчивость, уверенность в себе — покорность, подверженность влия нию.
Сила Сверх-Я — слабость Сверх-Я (данный фактор соответствует факто ру G Кеттелла).
Обособленность — зависимость от группы (этот фактор соответствует фак тору Q₂ Кеттелла).
Рациональность, практичность — мечтательность.
Импульсивность — сдержанность, самоконтроль.

Интересным представляется тот факт, что лишь три отмеченных фактора соответствуют тем, которые выделены Кеттелом. Это, на наш взгляд, свидетельствует о том, что данные факторы (G, <2з и Q₂) настолько устойчивые характерологические конструкты, что имеет сходство в англоязычной и русскоязычной культурах. Также заслуживает внимание тот факт, что большинство факторов соответствуют факторам, полученным в других работах (Виноградов, 1997). Это еще раз подтверждает надежность полученных результатов.

Нагрузки заданий опросника по семи факторам приведены в табл. 3.7 (включены нагрузки, абсолютное значение которых не менее 0,3).

174 Глава 3. Психометрические основы психодиагностики: основные этапы...

Таблица 3.7

Выделенные факторы и вопросы, их определяющие

Фактор Вопросы с ключевыми Вопросы с ключе-

ответами а выми ответами Ъ

1. Тревожность- 18, 32, 35, 43, 49, 61, 74, 25, 44, 62, 93, 100, эмоциональная стабильность 85, 86, 94, 99, 118, 123, 179

124, 145, 149, 154,161, 164, 170, 174

Энергичность, активность- 10, 33, 97, 110, 111, ИЗ, 27, 35, 61, 72, 82, пассивность 135, 156, 180, 182,184, 186 106
Настойчивость, уверенность в себе- 5, 15, 20, 23, 47, 65, 90, 4, 17, 41, 45, 59, покорность, подверженность влиянию 107, 119, 131, 142,160,173 81,172, 175
Сила Сверх-Я- 12, 40, 48, 63, 68, 73, 75, 9, 84 Слабость Сверх-Я 98,144, 169,176, 185
Обособленность- 56, 71, 79, 88, 121, 146,171 34,122 зависимость от группы
Рациональность, практичность- 11, 26, 62, 72, 87, 157, 158, 23, 36, 37, 58, 83, мечтательность 185 84,112,116,132,

135,138, 163

7. Импульсивность- 7, 24, 29, 47, 66, 67, 69, 80, 37,104, 138, 139 сдержанность 133,136, 154,183

Вопросы, «работающие» на выделенные факторы, были подвергнуты статистической обработке с последующим анализом полученных показателей внутренней согласованности. Результаты представлены в табл. 3.8.

Таблица 3.8

Значение Коэффициента Кронбаха для выделенных факторов

Фактор а

Тревожность — эмоциональная стабильность 0,7878
Энергичность, активность — пассивность 0,7535
Настойчивость, уверенность в себе — покорность, подверженность влиянию 0,8117
Сила «Сверх-Я» — Слабость «Сверх-Я» 0,7203
Обособленность — зависимость от группы 0,6726
Рациональность, практичность — мечтательность 0,7769
Импульсивность — сдержанность 0,6797

Нетрудно убедиться, что значения коэффициента надежности—согласованности Кронбаха достаточно велики для выделенных факторов, а это свидетельствует об однородности построенных шкал. Поскольку не существует формальных способов проверки гипотезы о равенстве нулю коэффициента Кронбаха, в своей работе мы использовали его лишь в качестве дескриптивной меры согласованности заданий исходных и полученных с помощью факторного анализа шкал. Напомним, что для шкал опросников наиболее характерны значения коэффициента Кронбаха в диапазоне 0,6-0,8.

На завершающем этапе исследования нами были рассчитаны среднее и стандартное отклонения для новых и оригинальных ключей¹ (табл. 3.9, ЗЛО).

Таблица 3.9

Нормативные данные для выборки из 227 испытуемых

(новые «ключи»)

Среднее	Стандартное
отклонение	отклонение
2,1507	0,8355
1,5707	0,7552
1,6391	0,8400
1,4560	0,7097
2,0528	0,8491
2,1188	0,8375
2,1360	0,8490

Название фактора

Тревожность — эмоциональная стабильность Энергичность, активность — пассивность Настойчивость, уверенность в себе — покорность, подверженность влиянию Сила «Сверх-Я» — Слабость «Сверх-Я» Обособленность — зависимость от группы Рациональность, практичность — мечтательность Импульсивность — сдержанность

Таблица 3.10

Нормативные данные для выборки

из 227 испытуемых (оригинальные «ключи»)

Фактор	Среднее	Стандартное
	отклонение	отклонение
А	1,5606	0,7704
В	1,6828	0,6108
С	1,8137	0,7763
Е	1,9089	0,7897
F	1,9121	0,8106
G	1,5845	0,7426
Н	1,6498	0,7799
I	1,7908	0,8645
L	2,0663	0,7904
М	2,0976	0,8572
N	1,9311	0,8333
О	2,1389	0,8401
а	1,9105	0,8567
	2,0923	0,8941
а	1,6092	0,7500
	2,1361	0,8414

Результаты проведенного исследования позволили ответить на вопрос о том, насколько мы точны в измерении факторов, постулированных Кеттеллом. Пред-

Для получения стандартного показателя из «сырого» балла вычитается среднее и делится на стандартное отклонение по шкале. Этот показатель в будущем будет использоваться для того, чтобы привести полученные данные к стандартной шкале. В нашем случае это шкала стенов (от 1 до 10, со средним 5,5 и стандартным отклонением 2).

1Т6 Глава 3. Психометрические основы психодиагностики: основные этапы...

варительные нормативные данные могут служить ориентиром для заключений об относительной степени выраженности у испытуемого некоторых личностных черт. Памятуя об ограниченности выборки, отметим, что новые «ключи» и нормы следует использовать с известной осторожностью.

Заключение

Подводя итоги вышеприведенного, достаточно краткого рассмотрения психометрических основ психодиагностики, хотелось бы подчеркнуть, что измерение человеческого поведения — необычайно сложная задача. Основная проблема заключается в том, что речь идет об измерениях во внефизической сфере, сфере гуманитарной науки, а используемый математико-статистический аппарат призван обслуживать (и успешно обслуживает) прежде всего измерение физических явлений. Вполне понятно желание многих исследователей предельно объективировать психологическое измерение, задавая такие требования к тестам, как надежность, дискриминативность, валидность. Соответствие этим требованиям зачастую представляется как условие точности и объективности наших измерений. В то же время зачастую не учитывается, что гуманитарные науки накладывают на процесс измерения множество ограничений. Формализация и количественные методики, математические модели в психодиагностике никогда не смогут заменить разработку теоретических конструктов, фундаментальных принципов исследования. Достаточно четко это прослеживается в развитии понятия валидности теста — его важнейшей характеристике как исследовательского инструмента. Понятие конструктной валидности, вобравшее в себя все подходы к определению валидности, — яркий пример того, что в конструировании тестов нельзя ограничиться математическими расчетами, как бы достоверны и убедительны они ни были. Без полного, насколько это возможно, психологического описания переменной (конструкта), для измерения которой предназначается тест, без формулирования гипотез о его результатах в свете того, что нам известно об этой переменной, процесс создания теста становится упражнением из математической статистики. Разработка тестов — творческий акт исследователя, и именно поэтому известных и завоевавших популярность методик, несмотря на множество изобилующих рецептами «кулинарных» книг по их изготовлению, не так уж и много, что хорошо известно любому психологу-практику.

<<< < Предыдущая 33 34 35 36 37 38 39 40 41 42 43 4445 / 7745 46 47 48 49 50 51 52 53 54 55 56 57 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.11.2019170.5 Кб19Боуэн.doc
#
06.06.201552.39 Кб17Британская интервенция.docx
#
28.03.201667.07 Кб29Бронхит (доклад по ОМЗ).doc
#
18.11.201884.99 Кб2буддизм.doc
#
02.05.201987.04 Кб18Буржуазные революции XVII - XVIII вв. 10 кл.doc
#
04.11.20184.29 Mб109Бурлачук Л.Ф. Психодиагностика.doc
#
06.12.20186.35 Mб28Бурлачук.doc
#
08.12.20184.18 Mб194бурлачук.docx
#
18.08.201936.93 Кб2Бюджет любого предприятия зависит от многих фак...docx
#
28.03.20165 Mб380Вали монография.doc
#
06.06.2015836.61 Кб292Вариант 8.doc