Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
госсы.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.52 Mб
Скачать
  1. Надежность психологического измерения: тесты, опросники и другое. Способы установления надежности (на примере своей научной работы).

Надежность – устойчивость, или согласованность результатов теста, получаемых при повторном его применении к тем же испытуемым в различные моменты времени, при использовании разных наборов эквивалентных заданий или же при изменении других условий обследования.

Надежность теста показывает, в какой степени индивидуальные различия в тестовых показателях могут быть отнесены на счет истинных различий в изучаемых свойствах, а в какой могут быть приписаны случайным ошибкам. То есть меры надежности позволяют оценить, какую долю общей дисперсии (общей изменчивости) тестовых показателей составляет дисперсия ошибок.

Любое условие тестирования, которое не имеет отношения к цели теста, представляет собой источник дисперсии ошибок. Но и при оптимальных условиях тестирования ни один тест не является абсолютно надежным инструментом. Сообщаемая мера надежности характеризует тест только в случае его проведения в стандартных условиях и с людьми, имеющими сходство с теми, кто входил в состав нормативной выборки.

Надёжность методики – это критерий, который говорит о точности психологических измерений, то есть позволяет судить о том, насколько внушают доверие полученные результаты.

Надежность характеризует тесты свойств, но не состояний. Свойства:

-Воспроизводимость рез-тов исследования.

-Точность измерения.

-Устойчивость результатов.

Степень надёжности методик зависит от многих причин. Среди негативных факторов наиболее часто называются следующие:

- нестабильность диагностируемого свойства;

- несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечётко сформулированы указания по предъявлению методики испытуемым и т.д.);

- меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещённость помещения, наличие или отсутствие посторонних шумов и т.д.);

различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.);

- колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом – утомление и т.д.);

- элементы субъективности в способах оценки и интерпретации результатов (когда ведётся протоколирование ответов испытуемых, оценивают ответы по степени полноты, оригинальности и т.д.).

Одним из важнейших средств повышения надежности методики является единообразие процедуры обследования, его строгая регламентация: одинаковая обстановка, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми и так далее.

При оптимальных условиях тестирования ни один тест не является абсолютно надежным инструментом. Поэтому каждый тест следует сопровождать сведениями о его надежности. Сообщаемая мера надежности характеризует тест только в случае его проведения в стандартных условиях с людьми, имеющими сходство с теми, кто входил в состав нормативной выборки. Следовательно, при описании теста нужно точно указывать и характеристики этой выборки, вместе с типом измеренной на ней надежности.

Типы надежности:

  1. Ретестовая надежность. Самый очевидный и понятный метод определения надежности результата теста – его повторное проведение. В этом случае коэффициент надежности просто равен корреляции (коэффициент корреляции выражает степень соответствия или связи между двумя множествами показателей) между показателями, полученными теми же испытуемыми в каждом из двух случаев проведения теста.

  2. Надежность взаимозаменяемых форм. Одних и тех же испытуемых могут тестировать в первый раз с помощью одной формы, а второй раз – с помощью другой, эквивалентной формы. Корреляция между показателями, полученными по двум формам теста, представляет его коэффициент надежности. Заметим, что такой коэффициент надежности служит мерой, как временной устойчивости, так и согласованности ответов на различные выборки заданий (или форм теста). Таким образом, этот коэффициент служит смешанной характеристикой двух типов надежности. Однако поскольку оба ее типа важны для большинства целей тестирования, надежность взаимозаменяемых форм оказывается полезной мерой для оценки многих тестов.

  3. Надежность эквивалентных половин теста. Меру надежности можно определить и на основании однократного применения единственной формы теста, пользуясь для этого различными процедурами расщепления теста на две равноценные половины. При таком способе каждый испытуемый получает два показателя благодаря разделению теста на две эквивалентные части. Очевидно, что надежность, найденная методом расщепления, дает нам меру согласованности выборочных проверок содержания. Временная устойчивость показателей в такой характеристике надежности не представлена, поскольку она предполагает только один сеанс тестирования. Этот тип коэффициента надежности иногда называют коэффициентом внутренней согласованности, так как для его определения требуется лишь однократное проведение единственной формы теста.

  4. Надежность по Кьюдеру–Ричадсону и коэффициент альфа. Основан на оценке согласованности ответов по всем заданиям теста. На эту внутреннюю согласованность влияют два источника дисперсии ошибок: 1. Выборочная представленность содержания (как в случае надежности взаимозаменяемых форм и эквивалентных половин теста) и 2. неоднородность выборочной области проведения. Чем однороднее эта область, тем выше внутренняя согласованность.

  5. Надежность оценщика. Некоторые типы тестов, – особенно тесты креативности и проективные личностные тесты, – представляют довольно много свободы пользователю, оценивающему ответы испытуемого и выставляющему за них определенное количество баллов. При работе с такими тестами потребность в мере надежности оценщика столь же велика, как и в более привычных коэффициентах надежности. Надежность оценщика можно определить, располагая выборкой протоколов выполнения теста, оцениваемого двумя специалистами независимо друг от друга. Между двумя множествами полученных таким образом показателей вычисляется обычный коэффициент корреляции, который и служит искомой мерой надежности оценщика.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]