Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 7 Психометрические основы психодиагностики.docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
70.5 Кб
Скачать

4.Виды надёжности.

Существует множество характеристик надёжности, так как имеется много условий влияющих на результаты теста, практически применяется несколько характеристик.

1.Надежность как согласованность содержания. Сущность этого вида демонстрирует ставший уже хрестоматийным пример. Каждому известно, что на экзамене бывают "легкие" и "трудные" вопросы: в первом случае мы сдаем на отлично, во втором - зачастую, "проваливаемся". Так отражает ли в таком случае и одна и вторая экзаменационная оценка наши "истинные" знания? Ведь давно известно, что экзамен — это лотерея. Но тест не может быть лотереей!

Таким образом, при создании теста стремятся добиться, чтобы результат обследуемого как можно меньше зависел от того, какой "билет он вытащил", какой именно конкретный набор заданий был использован в тесте, какие именно задания выбрал и успел выполнить обследуемый. Иными словами, задания должны быть максимально однородны по содержанию и не давать каких-либо преимуществ отдельным обследуемым.

Например, коэффициент надежности как согласованности содержания, равный 0.72, позволяет считать, что 72% индивидуальных различий в выполнении этого теста обусловлены "истинными" различиями между обследуемыми, а 28% — вызваны тем, что его задания неоднородны и часть обследуемых лучше справляется с одними из них, а часть - с другими. При таком "экзамене" не все "билеты" равноценны.

Наиболее распространены три основных способа получения коэффициента надежности как согласованности содержания: а) метод расщепления, б) метод взаимозаменяемых форм и в) метод Кьюдера-Ричардсона.

1. Оценка однородности (гомогенности) или внутренней согласованности теста.

Оценка внутренней согласованности определяется различными методами.

а) Надёжность частей теста характеристика устойчивости результатов путём анализа совокупности тестовых заданий (например, субтестов) или единичных пунктов теста. В основе этого вида надёжности лежит принцип расщепления, суть которого заключается в образовании двух равноценных частей теста. Это достигается либо разделением теста пополам (на начало и конец), либо на чётные и нечётные задания (если задания ранжированы по степени трудности), либо по принципу близости значений индексов трудности и дискриминативности (для тестов достижений) и другие способы. Обоснованием метода является вывод о том, что при нормальном или близком к нему распределению оценок в полном тесте, выполнение любого случайного набора из частей даёт аналогичное распределение.

Вычисляется коэффициент надёжности. Если тест полностью однороден, то показатели по эти двум наборам заданий должны быть одинаковыми, точнее между ними должен быть высокий коэффициент корреляции; расхождения свидетельствуют о том,_что они не совсем аналогичны.

б) Разделение заданий теста на равноценные половины является лишь частным случаем, вполне возможно расщепление на 3 - 5 и более частей, а так же на отдельные субтесты или иные структуры теста. В предельном случае число частей равно числу пунктов теста. В таком случае говорят об анализе внутренней согласованности или степени однородности состава заданий с точки зрения измеряемого качества. В этом случае коэффициент корреляции (r) вычисляется как коэффициент Кьюдера-Ричардсона или через коэффициент альфа (соответствующие формулы приведены у Бурлачука стр. 86 -87). Таким образом, измеряется мера связи всех пунктов теста друг с другом.

Надёжность по однородности является наиболее распространённым и точным способом оценки надёжности.

[(xi-x) (yi-y)] 6∙ ∑d2

r ху = ——————— rs = 1 - ————

(n – 1) δ x δ у n3n