Оценка надежности теста методом проверки внутренней согласованности

Некоторые проблемы, связанные с мотивацией, памятью и полученным опытом, возникающие при оценке надежности методом повторного тестирования, можно обойти путем использования метода проверки внутренней согласованности теста. При этом проверяется согласованность ответов на отдельные вопросы теста, а не постоянство результатов, полученных при тестировании в разное время. Один из часто применяемых подходов заключается в том, что несколько испытуемых проходят тестирование один раз, после чего тест делят на две части, результаты которых подсчитываются отдельно. У каждого испытуемого теперь по два результата, и их используют для расчета коэффициента корреляции.

Испытуемые — см. стр. 46.

Обычно деление теста на две части производится следующим образом: в одну половину включают вопросы с нечетными, а в другую — с четными номерами. Полученный коэффициент корреляции г между двумя наборами «результатов» называется коэффициентом внутренней согласованности или иногда — разделительным (split-half) коэффициентом. (Фактически такая процедура дает оценку надежности теста, в котором наполовину меньше вопросов, поэтому для оценки надежности всего теста в результаты следует внести статистические поправки.)

При использовании процедуры проверки внутренней согласованности удается обойти проблемы, возникающие из-за двукратного проведения одного и того же теста, но у этого метода есть и свои собственные недостатки. За исключением тех случаев, когда в тесте очень много вопросов, разделительный коэффициент, как правило, бывает заниженным. Кроме того, необходимо, чтобы два «теста» имели одинаковую сложность. Вероятность того, что две «половинки» теста будут иметь различную сложность, уменьшится, если включать в каждую половину четные или нечетные вопросы, а не делить вопросы на «первую» и «вторую» части по порядку (как некогда было принято). Однако и этот способ деления не гарантирует эквивалентности частей теста по сложности.

Оценка надежности методом проверки внутренней согласованности основана на предположении о том; что независимо от способа разбиения теста на две части эти части имеют одинаковую сложность. Это предположение трудно проверить, поэтому осторожный исследователь при проверке надежности теста воспользуется одной из статистических формул, которые дают так называемую общую (generic) оценку внутренней согласованности теста — коэффициент надежности, не зависящий от конкретного способа разбиения теста, использованного при расчете. Наиболее широкой известностью пользуются K-R формулы 20 и 21 (Richardson & Kuder, 1939) и альфа-коэффициент Кронбаха (Cronbach, 1951). Подробное обсуждение сильных и слабых сторон подобных процедур можно найти в работе Кортина (Cortina, 1993).

Оценка надежности теста методом эквивалентных форм

Кроме метода проверки внутренней согласованности можно воспользоваться альтернативной процедурой, которая основана на использовании двух различных тестов. Если в основе обоих тестов лежит один и тот же материал и они эквивалентны по форме и степени сложности, можно провести оценку надежности с помощью процедуры использования эквивалентных форм. Каждому испытуемому предлагаются оба теста, и вычисляется коэффициент корреляции между полученными результатами (r), который называется коэффициентом эквивалентности. В этом названии содержится указание на главный недостаток этого метода — трудность конструирования эквивалентных форм теста. Тест считается надежным, если при использовании одного и того же измерительного инструмента получаются одинаковые результаты. Если же разные формы теста не эквивалентны, то не используется один и тот же измерительный инструмент, и, соответственно, оценка надежности будет занижена.

Конструирование эквивалентных форм теста может быть трудным и занимающим много времени делом. Кроме того, перед тем как разные формы теста можно будет применить для оценки надежности теста, они должны быть проверены на эквивалентность с использованием другой выборки. Однако после того, как тест показал свою адекватность и надежность, может оказаться полезным наличие под рукой эквивалентных форм теста. Например, если тестирование производится в группе, то можно устранить один из потенциальных источников ошибок измерения, предложив разные формы теста испытуемым, сидящим друг рядом с другом.

До сих пор мы обсуждали метод эквивалентных форм, исходя из традиционной ситуации, когда конструируются две или несколько форм теста, которые будут проводиться в письменном виде. Однако сейчас все чаще используются компьютерные варианты тестов, которые когда-то были разработаны для письменного исполнения, в связи с чем в этой ситуации происходят интересные изменения. Если тестирование производится на компьютере, будет ли тест измерять ту же величину, что и идентичный (как предполагается) тест, осуществляемый обычными способами? Как показывает лабораторный эксперимент, описанный в рубрике «Исследования крупным планом», ответ на этот вопрос может оказаться отрицательным.

Лабораторный эксперимент — см. стр. 49-50,

Независимая/зависимая переменная — см. стр. 49.

Применяя General Aptitude Test Battery («Батарея тестов общих способностей», GABT), а также разработанный Департаментом труда США тест общего интеллекта, который предлагался многим тысячам испытуемых, Ван де Вийвер и Харсвельд (Van de Vijver & Harsveld, 1994) исследовали один простой вопрос: влияет ли форма проведения теста GABT (независимая переменная) на его результаты (зависимая переменная)? Для их испытуемых даже при условии контроля над прошлым опытом работы с компьютером был получен положительный ответ на этот вопрос. Вывод авторов о том, что эквивалентность вариантов теста должна быть продемонстрирована, а не принята в качестве предположения, служит подходящим завершением обсуждения вопроса об оценке надежности методом эквивалентных форм.

Резюмируя сказанное, повторим, что существует три распространенных метода оценки надежности теста. Каждый из них имеет определенные достоинства и недостатки. С точки зрения процедуры проведения оценки наиболее простым является метод проверки внутренней согласованности, поскольку испытуемые проходят тестирование один раз. Однако для более коротких тестов предпочтительным может оказаться метод повторного тестирования или метод эквивалентных форм. В заключение следует отметить; что выбор какого-либо одного метода может в какой-то степени зависеть от цели исследователя.

<<< < Предыдущая 27 28 29 30 31 32 33 34 35 36 37 3839 / 31939 40 41 42 43 44 45 46 47 48 49 50 51 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.02.2016231.42 Кб23ЛЕКЦИЯ 7 Методы анализа РЦБ.doc
#
13.11.201923.78 Кб4Лекция по ФОПИ 1.docx
#
13.02.2016108.03 Кб27лекция Предмет задачи методы Возр Психол.doc
#
13.02.2016379.9 Кб17Леонардо ДаВинчи - Воспоминание детства.doc
#
05.05.20191.48 Mб6Леонова ПД функциональных состояний.doc
#
12.07.201915.84 Mб29Линда Джуэлл Индустриально-организационная псих....doc
#
13.02.201610.67 Кб16Литература.docx
#
13.02.201619.35 Кб36М а н и п у л и р о в а н и е м или.docx
#
13.11.201981.41 Кб10матмет_прог.doc
#
06.12.2018187.39 Кб61МЕДИС - 6-7.doc
#
17.11.2018280.06 Кб3Мет.рек. курс. работ.doc