Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Линда Джуэлл Индустриально-организационная псих....doc
Скачиваний:
29
Добавлен:
12.07.2019
Размер:
15.84 Mб
Скачать

Оценка надежности теста методом проверки внутренней согласованности

Некоторые проблемы, связанные с мотивацией, памятью и полученным опытом, воз­никающие при оценке надежности методом повторного тестирования, можно обойти путем использования метода проверки внутренней согласованности теста. При этом проверяется согласованность ответов на отдельные вопросы теста, а не постоянство результатов, полученных при тестировании в разное время. Один из часто применяе­мых подходов заключается в том, что несколько испытуемых проходят тестирование один раз, после чего тест делят на две части, результаты которых подсчитываются от­дельно. У каждого испытуемого теперь по два результата, и их используют для расчета коэффициента корреляции.

Испытуемые — см. стр. 46.

Обычно деление теста на две части производится следующим образом: в одну поло­вину включают вопросы с нечетными, а в другую — с четными номерами. Полученный коэффициент корреляции г между двумя наборами «результатов» называется коэф­фициентом внутренней согласованности или иногда — разделительным (split-half) коэффициентом. (Фактически такая процедура дает оценку надежности теста, в кото­ром наполовину меньше вопросов, поэтому для оценки надежности всего теста в ре­зультаты следует внести статистические поправки.)

При использовании процедуры проверки внутренней согласованности удается обойти проблемы, возникающие из-за двукратного проведения одного и того же тес­та, но у этого метода есть и свои собственные недостатки. За исключением тех случа­ев, когда в тесте очень много вопросов, разделительный коэффициент, как правило, бывает заниженным. Кроме того, необходимо, чтобы два «теста» имели одинаковую сложность. Вероятность того, что две «половинки» теста будут иметь различную слож­ность, уменьшится, если включать в каждую половину четные или нечетные вопро­сы, а не делить вопросы на «первую» и «вторую» части по порядку (как некогда было принято). Однако и этот способ деления не гарантирует эквивалентности частей тес­та по сложности.

Оценка надежности методом проверки внутренней согласованности основана на предположении о том; что независимо от способа разбиения теста на две части эти части имеют одинаковую сложность. Это предположение трудно проверить, поэтому осторожный исследователь при проверке надежности теста воспользуется одной из статистических формул, которые дают так называемую общую (generic) оценку внут­ренней согласованности теста — коэффициент надежности, не зависящий от конкрет­ного способа разбиения теста, использованного при расчете. Наиболее широкой извест­ностью пользуются K-R формулы 20 и 21 (Richardson & Kuder, 1939) и альфа-коэф­фициент Кронбаха (Cronbach, 1951). Подробное обсуждение сильных и слабых сторон подобных процедур можно найти в работе Кортина (Cortina, 1993).

Оценка надежности теста методом эквивалентных форм

Кроме метода проверки внутренней согласованности можно воспользоваться альтер­нативной процедурой, которая основана на использовании двух различных тестов. Если в основе обоих тестов лежит один и тот же материал и они эквивалентны по форме и степени сложности, можно провести оценку надежности с помощью проце­дуры использования эквивалентных форм. Каждому испытуемому предлагаются оба теста, и вычисляется коэффициент корреляции между полученными результатами (r), который называется коэффициентом эквивалентности. В этом названии содер­жится указание на главный недостаток этого метода — трудность конструирования эквивалентных форм теста. Тест считается надежным, если при использовании одно­го и того же измерительного инструмента получаются одинаковые результаты. Если же разные формы теста не эквивалентны, то не используется один и тот же измери­тельный инструмент, и, соответственно, оценка надежности будет занижена.

Конструирование эквивалентных форм теста может быть трудным и занимающим много времени делом. Кроме того, перед тем как разные формы теста можно будет применить для оценки надежности теста, они должны быть проверены на эквивален­тность с использованием другой выборки. Однако после того, как тест показал свою адекватность и надежность, может оказаться полезным наличие под рукой эквива­лентных форм теста. Например, если тестирование производится в группе, то можно устранить один из потенциальных источников ошибок измерения, предложив раз­ные формы теста испытуемым, сидящим друг рядом с другом.

До сих пор мы обсуждали метод эквивалентных форм, исходя из традиционной ситуации, когда конструируются две или несколько форм теста, которые будут про­водиться в письменном виде. Однако сейчас все чаще используются компьютерные варианты тестов, которые когда-то были разработаны для письменного исполнения, в связи с чем в этой ситуации происходят интересные изменения. Если тестирование производится на компьютере, будет ли тест измерять ту же величину, что и идентич­ный (как предполагается) тест, осуществляемый обычными способами? Как показы­вает лабораторный эксперимент, описанный в рубрике «Исследования крупным пла­ном», ответ на этот вопрос может оказаться отрицательным.

Лабораторный эксперимент — см. стр. 49-50,

Независимая/зависимая переменная — см. стр. 49.

Применяя General Aptitude Test Battery («Батарея тестов общих способностей», GABT), а также разработанный Департаментом труда США тест общего интеллекта, который предлагался многим тысячам испытуемых, Ван де Вийвер и Харсвельд (Van de Vijver & Harsveld, 1994) исследовали один простой вопрос: влияет ли форма прове­дения теста GABT (независимая переменная) на его результаты (зависимая перемен­ная)? Для их испытуемых даже при условии контроля над прошлым опытом работы с компьютером был получен положительный ответ на этот вопрос. Вывод авторов о том, что эквивалентность вариантов теста должна быть продемонстрирована, а не принята в качестве предположения, служит подходящим завершением обсуждения вопроса об оценке надежности методом эквивалентных форм.

Резюмируя сказанное, повторим, что существует три распространенных метода оценки надежности теста. Каждый из них имеет определенные достоинства и недо­статки. С точки зрения процедуры проведения оценки наиболее простым является метод проверки внутренней согласованности, поскольку испытуемые проходят тес­тирование один раз. Однако для более коротких тестов предпочтительным может оказаться метод повторного тестирования или метод эквивалентных форм. В заклю­чение следует отметить; что выбор какого-либо одного метода может в какой-то сте­пени зависеть от цели исследователя.