3.2. Валидность
Другим после надежности ключевым критерием оценки качества методик является валидность. Вопрос о валидности методики решается лишь после того, как установлена
достаточная ее надежность, поскольку ненадежная методика не может быть валидной. Но самая надежная методика без знания ее валидности является практически бесполезной.
Валидность теста — понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает. Проверка валидности методик называется валидизацией. Валидность — комплексная характеристика, включающая сведения о том, пригодна ли методика для измерения того, для чего она была создана, и какова ее действенность, практическая полезность. В первом случае валидность имеет отношение к самой методике, т. е. это валидность измерительного инструмента. Такая проверка называется теоретической валидизацией. Во втором случае валидность уже относится не столько к методике, сколько к цели ее использования. Это прагматическая валидизация.
Провести теоретическую валидизацию методики — это значит доказать, что методика измеряет именно то психическое свойство, качество, которое она по замыслу исследователя должна измерять. Например, если какой-то тест разрабатывался для того, чтобы диагностировать умственное развитие детей, надо проанализировать, действительно ли он измеряет умственное развитие, а не какие-то другие особенности (личность, характер и т. п.). Такая проверка показывает, насколько замысел автора и результаты методики совпадают.
Не столь сложно провести теоретическую валидизацию новой методики, если для изучения данного свойства уже имеется методика с доказанной валидностью. Наличие корреляции между новой и аналогичной, уже проверенной, методикой указывает на то, что разработанная методика измеряет то же психологическое качество, что и эталонная. Если же такой путь проверки невозможен, то только постепенное накопление разнообразной информации об изучаемом свойстве, анализ теоретических предпосылок и экспериментальных данных, значительный опыт работы с методикой позволят раскрыть ее психологический смысл.
Что касается прагматической валидизации, то она подразумевает проверку методики с точки зрения ее практической эффективности, значимости, полезности, поскольку диагностической методикой имеет смысл пользоваться только тогда, когда доказано, что измеряемое свойство проявляется в определенных жизненных ситуациях, в определенных видах деятельности.
Для проведения прагматической валидизации методики обычно используется независимый внешний критерий — показатель проявления изучаемого свойства в повседневной жизни. Таким критерием могут быть успеваемость (для тестов способностей к обучению, тестов достижений, тестов интеллекта), производственные достижения (для методик профессиональной направленности), эффективность реальной деятельности — рисование, моделирование и т. д. (для тестов специальных способностей), субъективные оценки (для тестов личности). Сопоставив у одних и тех же лиц результаты, полученные при применении диагностической методики, с данными, полученными по внешнему критерию, можно сделать вывод о валидности методики. Оценка может носить как количественный, так и качественный характер. При количественной обработке коэффициент валидности порядка 0,30—0,50 считается удовлетворительным.
Существует несколько видов валидности, обусловленных особенностями диагностических методик, а также временным статусом внешнего критерия. Многие авторы чаще всего называют следующие:
1. Валидность по содержанию. Этот прием используется, например, в тестах достижений. Обычно в тесты достижений включается не весь материал, который прошли учащиеся, а какая-то его небольшая часть (3—4 вопроса). Можно ли быть уверенным в том, что правильные ответы на эти немногие вопросы свидетельствуют об усвоении всего материала? На это и должна ответить проверка валидности по содержанию: проводится сопоставление успешности по тесту с экспертными оценками учителей (по данному материалу). Валидность по содержанию также подходит к критериально-ориентированным тестам. Иногда этот прием называют логической валидностью.
2. Валидность по одновременности, или текущая валидность, определяется с помощью внешнего критерия, по которому информация собирается одновременно с экспериментами по проверяемой методике. Другими словами, собираются данные, относящиеся к настоящему времени: успеваемость в период испытания, производительность в этот же период и т. д. С ними коррелируют результаты успешности по тесту.
3. Предсказывающая валидность (прогностическая валидность). Определяется также по внешнему критерию, но информация по нему собирается некоторое время спустя после испытания. Внешним критерием обычно бывает выраженная в каких-либо оценках способность человека к тому виду деятельности, для которой он оценивался по результатам диагностических испытаний.
4. Ретроспективная валидность. Она определяется на основе критерия, отражающего события или состояние изучаемого качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики. Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют успешному обучению, можно сопоставить прошлые оценки успеваемости, прошлые экспертные заключения и т. д. у лиц с высокими и низкими на данный момент диагностическими показателями.