
13.2.2. Проверка надежности
Одним из важнейших этапов психометрической проверки психологического теста является проверка его надежности [2, 3, 8, 45, 46, 63, 68]. Надежность психологического теста это такая его характеристика, которая отражает точность психодиагностического измерения, а также устойчивость результатов теста к действию посторонних случайных факторов.
Понятие надежности основывается на вычислении так называемой "ошибки измерения", которая указывает пределы колебаний измеряемой величины, возникающих под воздействием различных факторов. Колебания результатов измерений могут быть связаны с систематическими и случайными факторами. К причинам систематических ошибок можно отнести какое-либо отклонение от стандарта проведения теста, неточность в процедуре обработки и т.п. Случайные ошибки возникают по самым разнообразным объективным и субъективным причинам. Их величина в основном и характеризует точность метода.
В большинстве работ, освещающих вопросы психометрики, проблемы надежности понимаются единообразно. И это сходство проявляется, прежде всего, в том, что авторы рассматривают общую дисперсию данных тестового обследования как результат влияния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры. Поэтому в самом широком смысле надежность теста - это характеристика того, в какой степени различия испытуемых по тестовым результатам, являются отражением действительных различий в измеряемых свойствах, а в какой мере они могут быть приписаны случайным факторам.
Однако, очень высокая надежность теста - не всегда благо. Добиваясь высокой надежности психодиагностической методики, исследователи неизбежно теряют в чувствительности применяемого инструментария. Чем в меньших пределах изменяется измеряемая величина, тем меньше дифференцирующая (а значит диагностирующая) способность опросника. Компромисс между надежностью и чувствительностью достигается за счет оптимального количества вопросов.
Как правило, наиболее характерные источники ошибки измерения могут быть спровоцированы либо неоднородностью содержания теста, либо временными, ситуационными колебаниями в состоянии испытуемого. Поэтому использующиеся на практике методы подсчета надежности опираются на определение согласованности результатов и их временной устойчивости. Исходя из этого, чаще всего применяют два основных вида проверки надежности: это надежность по однородности и надежность по устойчивости.
Проверка надежности по однородности может осуществляться методом расщепления, таким образом, мы проверяем надежность эквивалентных половин теста. В данном случае тест может быть разделен на две равные части. Полученные показатели по двум частям теста коррелируются обычным методом. Но эта корреляция отражает лишь надежность половины теста. Для вычисления надежности всего теста по методу расщепления используют формулу Спирмека - Брауна. Проблема, с которой сталкиваются исследователи при применении метода расщепления, связана с тем, как разделить тест, чтобы добиться максимальной эквивалентности его половин. Всякий тест можно членить многими способами. Как полагает А.Анастази: "В большинстве тестов первая и вторая половина оказались бы неэквивалентными вследствие различий в характере и уровне трудности заданий, а также в связи с кумулятивными эффектами вхождения в работу, практики, утомления, скуки и любых других факторов, воздействие которых нарастает от начала к концу геста" [3, с. 114]. Поэтому экономичнее использовать метод оценки надежности опирающийся на однократное тестирование, но на основе оценки согласованности ответов по всем заданиям теста, так называемой внутренней согласованности. Именно такая процедура применялась в описываемом случае.
Необходимо отметить, что математическая обработка зависит от размерности шкалы ответов ответов: в случае дихотомической формы ответов (да - нет; согласен - несогласен) для подсчета внутренней согласованности используют формулу подсчета коэффициента надежности Кьюде-ра-Ричардсона; при более дифференцированной форме представления результатов отдельных заданий (трех-, пяти-, семибалльные шкалы) оценка надежности по однородности может быть получена путем использования формулы известной, как коэффициент альфа [46].
Проверка на надежность по однородности методики диагностики стиля принятия управленческих решений осуществлялась отдельно для двух основных диагностических конструктов: поведение в проблемной ситуации и властность. Выборка, на которой проводилась эта проверка, состояла из 126 человек. Возраст опрашиваемых от 24 до 60 лет, пол - 64 мужчины и 62 женщины, стаж управленческой деятельности от полугода до 30 лет. Использовался коэффициент "альфа Кронбаха". Результаты проверки представлены в табл. 13.2.
Таблица 13.2
Надежность по однородности шкал опросника "Стиль принятия управленческих решений"
Название шкалы |
Коэффициент а Кронбаха |
Властность |
0.834 |
Поведение в проблемной ситуации |
0.806 |
Оценка надежности по устойчивости результатов тестирования проводилась путем повторного опроса одних и тех же респондентов. В этом случае коэффициент надежности просто равен корреляции между показателями, полученными теми же испытуемыми в каждом из двух случаев проведения теста. Интервал между первичным и вторичным тестированием составлял 5-6 месяцев. Такой срок оптимален по двум причинам: если проводить ретест раньше испытуемые могут просто вспомнить ответы, а если позже, то возможно изменение результатов связанное с возрастной, профессиональной, карьерной динамикой. В тестировании участвовали 60 руководителей в возрасте от 30 до 60 лет, процентное соотношение мужчин и женщин было равным.
Подсчет коэффициента корреляции между общими баллами по обеим шкалам по итогам первичного и ретестового испытаний производился с помощью формулы произведений моментов Пирсона. Результаты проверки опросника на устойчивость представлены в таблице 13.3.
Таблица 13,3.
Ретестовая надежность шкал опросника "Стиль принятия управленческих решений"
Название шкалы |
Коэффициент корреляции |
Р |
Властность |
0.79 |
0.01 |
Поведение в проблемной ситуации |
0.71 |
0.01 |
Примечание: л = 60.