Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гуревич К.М. Дифференц-я психол. и психодиагн....doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.05 Mб
Скачать

Раздел 1. Основные требования к конструированию и проверке психологических тестов 231

И второй, и четвертый способы выдают совсем особую информацию — это ин­формация о том, насколько близки — по существу — две различные «формы» тес­та, два его варианта. Исследователь может считать, что если эти две формы при испытаниях дали одинаковые или близкие результаты на избранной им выборке, то из этого следует, что при разработке теста найден достаточно отчетливый пси­хологический признак для испытания. В этом случае вновь ставится вопрос о го­могенности, но уже не для одного теста, а для теста и варианта, для двух более или менее эквивалентных «форм».

Выходит, что понятие «надежность» имеет совершенно различный смысл в за­висимости от того, какой из способов исследователь возьмет. Поэтому нельзя при­знать удовлетворительным решение, при котором утверждается, что все четыре способа представляют собою оценки повторений показателей по тесту и в одних случаях тот, а в других — иной из способов обеспечивает получение лучшей меры (надежности). Но дело не в лучшей или худшей мере надежности, дело в том, что это меры разной по существу надежности. Скорее можно согласиться с авторами «Стандартных требований...», которые полагают, что коэффициент надежности в современном понимании — это родовой показатель, охватывающий несколько ее дифференцированных видов, и каждый вид имеет свой особый смысл (Standards for Educational and Psychological Test, 1974). Однако о том, что обусловливает эти различные виды надежности, от чего зависит малая или большая дисперсия, вли­яющая на коэффициенты этих различных видов надежности, — обо всем этом в «Стан­дартных требованиях...» ничего не говорится.

По-видимому, было бы совершенно нелогичным, давая характеристику надеж­ности, сообщить какой-то коэффициент без раскрытия того, каким способом он определен и почему автор считает, что надежность в данном случае должна быть представлена именно таким коэффициентом. Очевидно, необходимо достаточно обоснованно истолковать эти различные по своей сущности коэффициенты.

Что же устанавливается при сопоставлении результатов по двум половинкам теста (способ расщепления)? Более всего оснований считать, что так устанавлива­ется надежность самого теста как диагностического инструмента. Несомненно, что следует считать надежным только тот тест, который состоит из однородных и при­том равно трудных задач. Оценка успешности работы испытуемых выводится из общего числа правильно выполненных ими заданий. Если тест отвечает своему назначению как диагностический инструмент, то можно полагать, что в любой из произвольно выбранных его половинок испытуемый должен правильно выполнить примерно одинаковое число задач. Правильность этого предположения исследо­ватель проверяет, вычисляя коэффициент корреляции между результатами, пока­занными испытуемыми по двум половинкам теста.

А сравнение результатов, показанных испытуемыми при первом и втором, по­вторном, тестировании имеет совсем другой смысл. Оно говорит о том, насколько устойчиво, стабильно то свойство психики (функция, умение, способность и пр.), для диагностирования которого был применен тест. Оставим пока открытым во­прос о том, чем объясняется устойчивость или изменчивость диагностируемого свойства. Важно, что коэффициент корреляции, вычисляемый в этом случае, указывает на степень стабильности диагностируемого свойства. Об этом будет

232 Часть 3. Проблемы психологической диагностики

свидетельствовать сохранение каждым испытуемым своего порядкового места в выборке (в рангах или в сигмальных единицах) при первом и повторном приме­нении теста через определенный промежуток времени.

В такой интерпретации ясно обнаруживается, что разные способы установле­ния надежности относятся по существу к разным объектам. При вычислении ко­эффициента между результатами, показанными в каждой из двух половинок теста, устанавливается надежность самого теста, при вычислении того же коэффициента между результатами первого и второго испытания устанавливается стабильность диагностируемого свойства.

Весьма возможно, что невысокая надежность теста самого по себе (способ срав­нивания половинок) окажет неблагоприятное воздействие и на результаты как первого, так и повторного испытаний. Поэтому следует заранее позаботиться о том, чтобы такое воздействие было устранено или сведено к минимуму. Для этого нуж­но соблюдать естественную очередность установления надежности: сначала нужно проверить надежность теста, добиться путем устранения ненадежных задач над­лежащего его качества, как измерительного инструмента, а затем переходить к уста­новлению надежности диагностируемого свойства.

Что же касается способов установления надежности теста, заключающихся в сопоставлении двух параллельных или эквивалентных форм-вариантов, то вы­воды из таких сопоставлений скорее можно понять как аргумент в пользу психо­логической значимости единого принципа, положенного исследователем в ос­нову создания того и другого варианта теста. Принцип проверяется путем срав­нения результатов успешности испытуемых, выполнявших две подготовленные исследователем формы или два варианта теста. С точки зрения применения теста эти способы естественнее всего толковать как изучение возможности взаимоза­меняемости вариантов теста. Но сколько-нибудь убедительного ответа на вопрос о надежности каждого из вариантов эти способы, по-видимому, не могут дать. О не­определенности выводов, получаемых при сопоставлении двух форм или вариан­тов теста для установления надежности, пишут и авторы «Стандартных требова­ний...» (Standards for Educational and Psychological Test, 1974). Поэтому, по край­ней мере до тех пор, пока не будет предложено новых толкований этих способов, применение их для установления надежности представляется необоснованным.

Выше было сказано, что способ разделения теста на две половины позволяет охарактеризовать надежность самого теста как диагностического инструмента, а способ повторного тестирования дает материал для суждения о надежности (или стабильности) исследуемого свойства психики. Употребление слов «надежность теста и надежность свойства психики» не должно маскировать важнейшей специ­фической черты психологических тестов — их результаты, итоги работы испытуе­мых всегда являются продуктом взаимодействия испытуемого (со всеми присущи­ми ему к моменту испытания особенностями) и ситуации психологического испы­тания. Здесь испытуемому представляется тест с его конкретной наполненностью: словами, рисунками, заданиями, требующими логико-перцептивных действий, от выполнения которых зависит успешность его работы. Надежность теста и на­дежность (стабильность) диагностируемого психического свойства не существу­ют «вообще», они всегда выступают как продукт контакта конкретной ситуации