- •Основы психодиагностики Учебное пособие
- •Введение
- •Глава 1. Предмет и задачи психодиагностики
- •1,1. Предмет психодиагностики
- •1.2. Основные задачи психодиагностики
- •Глава 2. История развития психодиагностики
- •Глава 3. Теоретические основы психодиагностики
- •3.1. Теория личностных диспозиций
- •Шкалы и подшкалы, измеряемые опросником neo pi-r
- •3.2. Ситуационизм
- •3.2. Интеракционизм
- •Глава 4. Определение тестов и их классификация
- •III. Расчет нормативных показателей.
- •Глава 5. Этапы психометрической проверки
- •5.1. Основные статистические понятия
- •5.3. Анализ заданий
- •5.4. Надежность теста
- •5.4.1. Надежность как устойчивость результатов
- •5.4.2. Надежность параллельных форм
- •5.4.3. Надежность как точность измерений
- •5.4.4. Надежность относительно постоянства условий
- •5.5. Валидность теста
- •5.5.1. Критериальная валидность
- •5.5.2. Конструктная валидность
- •5.5.3. Содержательная валидность
- •5.5.4. Другие виды валидности
- •Глава 6. Интерпретация тестовых показателей
- •6,1, Нормативно-референтная интерпретация
- •Процедура проведения нормализации по составу
- •6.2. Критериально-референтная интерпретация
- •6.3. Содержательно-референтная интерпретация
- •Заключение
- •Литература
- •Оглавление
- •Глава 1. Предмет и задачи психодиагностики. ………...….5
- •Глава 2. История развития
- •Глава 3. Теоретические основы
- •Глава 4. Определение тестов
- •Глава 5. Этапы психометрической проверки...................... 49
- •Глава 6. Интерпретация
5.4.4. Надежность относительно постоянства условий
Этот вид надежности измерительного инструмента в психодиагностике проявляется в надежности экспериментатора. В любом исследовании экспериментатор может выполнять три функции: организатора исследования, оценщика и интерпретатора.
Постоянство экспериментатора как организатора исследования предполагает, что его личностные особенности, социальное положение и другие характеристики не оказывают существенного влияния на обследуемых лиц и, соответственно, на результаты тестирования. Достигается это за счет стандартизации тестового материала, инструкций, условий проведения тестирования.
Постоянство подхода оценщика касается ведения протоколов и подсчета результатов теста. При наличии стандартных бланков ответов, ключей объективность оценки повышается, что приводит и к повышению надежности.
Постоянство подхода экспериментатора как интерпретатора обеспечивается, если одинаковые оценочные данные, полученные от испытуемых, приводят к одинаковым заключениям. В психометрике такое положение обеспечивается наличием норм, стандартных профилей оценки или критериев.
Большинство тестов, используемых для массовых обследований, достаточно жестко стандартизированы, поэтому их проведение, обработка и интерпретация сводят дисперсию ошибок, вызванных влиянием экспериментатора, практически к нулю. Однако некоторые тесты, используемые в клинической практике (тесты креативности и проективные тесты), оставляют много свободы исследователю, особенно в части интерпретации полученных результатов. Это существенно повышает роль надежности относительно экспериментатора по сравнению с более традиционными ее видами.
В практике психометрической проверки тестов обязательным условием является проверка надежности как устойчивости и как точности результатов. Наиболее популярным способом является проверка ретестовой надежности и надежности по однородности.
Коэффициент надежности. Поскольку во всех видах определения надежности в качестве ее коэффициента выступает коэффициент корреляции, то уровень его значимости определяется принятым в математической статистике путем и будет зависеть от объема выборки. Коэффициент надежности как коэффициент корреляции может изменяться в пределах от -1 до + 1, однако тест считается надежным, когда его коэффициент находится в пределах от 0,6 до -1. Случаи, где коэффициент надежности меньше, чем 0,6, должны рассматриваться особо [7]. Некоторые авторы тем не менее считают, что для большинства известных методик редко удается получить коэффициент надежности выше 0,7- 0,8.
Коэффициент надежности, как и любой статистический показатель, имеет доверительный интервал, в котором он может оказаться при его вычислении для генеральной совокупности. Для коэффициента надежности он равен:
CLz = Z (г) +z крит. ,
где - стандартная ошибка коэффициента надежности. Стандартная ошибка высчитывается по формуле:
.
На практике значение имеет только нижняя граница доверительного интервала коэффициента надежности, которая равна для выборок больше 30 человек: Rt = 1,96 . Превышение коэффициента надежности нижней границы доверительного интервала означает, что тест надежен и при неблагоприятных условиях.
Величина коэффициента надежности подвержена влиянию самых разнообразных факторов, среди которых ведущее значение имеет количественный и качественный состав выборки. Традиционно считается, что увеличение объема выборки ведет к снижению погрешности. Поэтому выборки для вычисления надежности должны быть достаточно большими. Минимальный объем выборки для расчета надежности должен быть не меньше 150-200 человек. Качественный состав выборки должен полностью отражать генеральную совокупность.
Важным свойством выборки, влияющим на надежность теста, является диапазон индивидуальных различий в группе. Если уровень выраженности какой-либо способности (скорость чтения) у всех членов группы будет одинаковым, то вероятнее всего корреляция этой способности с любыми другими будет очень низкой. Отсюда предсказать положение индивида по какой-либо другой способности на основе знания его показателей о скорости чтения будет практически невозможно [3].
Изменчивость выборки и степень ее однородности являются важными факторами, воздействующими на коэффициент надежности. В частности, если для определения надежности теста была использована выборка школьников 5 - 11-х классов, то нельзя полагать, что использование его на выборке девятиклассников даст высокие результаты. В случае использования теста на более однородной выборке, чем выборка стандартизации, коэффициент надежности необходимо рассчитывать заново.
Коэффициент надежности может изменяться не только от степени индивидуальных различий в выборке, но и от среднего уровня измеряемой способности [3]. Поэтому при конструировании тестов часто используется прием разбиения выборки стандартизации на более однородные подгруппы по разным признакам (полу, возрасту, уровню образования и т.п.).
Надежность является важной характеристикой теста, но сама по себе ценности не имеет. Поэтому следует помнить, что ее ценность состоит в том, что она необходима для достижения другой важной характеристики теста - его валидности.
Вопросы для самопроверки
1. В чем смысл понятия "погрешность измерения"?
2. Каковы основные виды надежности теста?
3. В каких пределах могут колебаться значения коэффициента ретестовой надежности?
4. В каких случаях чаще всего понижается надежность относительно экспериментатора?
5. В чем смысл метода расщепления?