Скачиваний:
40
Добавлен:
10.02.2015
Размер:
102.4 Кб
Скачать

3.2.5. Пятидесятые годы: новые акценты

в исследовании валидности

Первоначально психодиагностика рассматривалась всего лишь как прикладная психология. Акцент делался на предсказании релевантных критериев. В 1955 г. в статье Кронбаха и Миля проблема тестовой валидности была впервые поставлена как теоретическая. Мессик использовал согласованные тестовые показатели как источник теоретически и эмпирически обоснованных утверждений, характеризующих личность, ситуации, институты и даже объекты. Кроме того, в этих утверждениях учитывались также социальные ценности и нормы. Таким образом, понятие валидности в психодиагностике развивалось.

В истории развития концепции валидности можно проследить, что становилось основным предметом рассмотрения в тот или иной период и каким образом аккумулировались требования. Первый акцент был сделан на предсказании поведения. Вначале доминировал прагматический, а не теоретический интерес (Angoff, 1988). Интересовали задачи, пригодные для тех или иных профессий. Это стало отправной точкой как при разработке тестов, так и при определении критериев. Критерий необходимо определять объективно, и тесты должны быть стандартизованы. Для применения в образовании были разработаны критериально-ориентированные тесты. Следующий акцент был сделан на развитии понятия конструктной валидности. Aнгофф (1988) назвал это понятие изобретением “магического средства”.

Развитие концепций валидности сопровождалось совершенствованием статистических методов, что в свою очередь оказывало влияние и на становление понятия валидности. Хорошо известный пример - это многометодная матрица свойств Кэмпбелла и Фиске (1959). Оценивалась валидность при изучении различных черт при помощи разнообразных методов. Интерес был сконцентрирован на рассмотрении валидности черт. Предполагалось, что различные черты должны расходиться (дивергировать), а сходные - конвергировать, то есть речь шла о конвергентной и дискриминантной валидности. Допускалось, что отдельные черты будут нечувствительны к используемым методам. Применение этой матрицы было очень популярным и рассматривалось как метод конструктной валидизации. Магнуссон (1961, 1967) описал этот метод в своей книге по теории тестов и назвал его процедурой "полной конструктной валидизации".

В истории дифференциации и интеграции концепции валидности присутствует некоторая волнообразность. Данное очень старая проблема, и она была предметом размышлений у греческих философов. Концепция допускает существование обоих подходов - и холистического, и атомистического.

В последнее десятилетие было добавлено еще одно новое значение понятия валидности. Так что можно говорить о дальнейшей дифференциации этого понятия. Представляется интересным, что само это понятие как бы привносит некое единство (или объяснение) в разнообразие коэффициентов прогностической валидности одного и того же теста. Данное понятие представляет собой обобщение валидности. Исследование прогностической валидности одного и того же теста по различным, но связанным между собой критериям обнаруживает его разную ценность. Таким образом, по-видимому предпочтительнее подсчитывать новые коэффициенты валидности для каждого критерия. Шмидт и Хантер (1977) полагают, что существует один “истинный” коэффициент прогностической валидности и что расхождения коэффициентов валидности теста по различным, но сходным критериям представляют собой дисперсию ошибки. Они указали на 7 источников дисперсии ошибки:

- ненадежность в оценивании критерия;

- ненадежность теста;

- ограничение интервала;

- ошибки при составлении выборки;

- тип критерия и значимость;

- ошибки при подсчете и письме;

- небольшие различия в структуре факторов между задачами определенного типа.

Авторы попытались оценить источники этих систематических ошибок. Были проведены исследования, в которых подсчитывались коэффициенты валидности для сходных тестов и критериев. Подсчитывалась дисперсия в распределении коэффициентов валидности. Из этой дисперсии вычитались все показатели дисперсии, связанные с перечисленными источниками ошибок. Таким образом может быть подсчитан истинный коэффициент валидности прогностического критерия. Подобные расчеты действительно проводились авторами. Например, авторы оценивали некоторые из возможных источников ошибок в предсказании успешности работы механиков службы сервиса с помощью тестов на понимание принципов механики, а также при определении возможной эффективности труда работников службы быта с помощью интеллектуальных тестов. Этот тип исследования может быть рассмотрен как мета-исследование. В психодиагностике разработаны также статистические методы для оценки источников ошибок (Schmidt, Law, Hunter, Rothstein, Pearlman, McDaniel, 1993). Но остается вопрос о том, как могут быть использованы знания о способах оценки истинного коэффициента корреляции и представления о возможных источниках ошибок. Используется ли реально эта информация практическими психологами или же они до сих пор обречены на то, чтобы подсчитывать коэффициенты валидности для каждой группы и для каждого критерия?

Подведем итоги. Итак, в истории развития представлений о валидности первым предметом рассмотрения была прогностическая валидность. Постепенно представления о валидности становились все более дифференцированными, и в качестве объединяющей их силы выступила концепция конструктной валидности. Сравнительно недавно была разработана обобщенная концепция валидности для объяснения различий между коэффициентами прогностической валидности сходных тестов по сходным критериям.

Соседние файлы в папке Ян Терлак