- •Учебное пособие
- •Введение
- •Этапы проведения научного исследования
- •Получение качественной эмпирической информации
- •Генерализуемость
- •Процедура формирования репрезентативной выборки
- •Объем выборки
- •Краткие характеристики выборок разного объема
- •Гендерное распределение показателя
- •Направления анализа эмпирических данных
- •Измерение и его уровни
- •Частотное распределение по уровням образования
- •Частотное распределение уровня образования
- •Частотное распределение уровня образования
- •Частотное распределение уровня образования
- •Шкала равных интервалов Терстоуна
- •Распределение судейских оценок для высказывания
- •Свойства измерительных шкал разного уровня
- •Нормальное распределение
- •Описательная статистика
- •Описательная статистика
- •Статистические критерии
- •Возможности и ограничения статистических критериев1
- •Распределение эмпирических данных по уровням
- •Теоретическое случайное и независимое распределение
- •Сопоставление двух распределений
- •Алгоритм
- •Сферы применения основных статистических критериев
- •Дисперсионный анализ
- •Эмпирические данные для обсуждения дисперсионного анализа
- •Диаграмма 1. "Ящик с усами"
- •Результаты дисперсионного анализа
- •Взаимосвязь параметров и корреляции
- •Л инейная функци-ональная связь
- •Эмпирические частоты
- •Теоретические частоты
- •Измерение связи и значимости для числовых
- •Эмпирические данные для показателей а и в
- •Многомерные методы анализа эмпирической информации
- •Кластерный анализ
- •Факторный анализ
- •Для теста Леонгарда-Шмишека
- •Собственные значения для факторов
- •Факторное решение после вращения
- •Построение прогнозных моделей в психологии
- •Регрессионные модели
- •Дискриминантные модели
- •Основные способы статистического анализа эмпирических данных
- •Компьютерный анализ данных
- •Литература
- •119606 Москва, пр-т Вернадского, 84
Статистические критерии
Потребность в статистических критериях возникает из-за того, что, как правило, эмпирические исследования проводятся на основе информации о выборке, а далее надо сделать вывод, относящийся к генеральной совокупности. Например, из генеральной совокупности в 10 тыс. человек сделана выборка объемом 1 тыс. человек. Как бы "правильно" ни была построена выборка, при распространении полученных в ходе исследования выводов с нее на всю генеральную совокупность, возможны ошибки. В частности, все измеряемые в выборочном исследовании показатели, например, среднее по выборке значение возраста оказываются только приближенными оценками реальных показателей генеральной совокупности (того же среднего возраста). Задача прикладной статистики состоит в оценке вероятности таких ошибок и определении их величины.
Рассмотрим, возможность применения "правила двух сигм" к оценке вероятности ошибки оценки числового показателя, измеряемого в эмпирическом исследовании на следующем примере.
Пусть перед началом формирующего эксперимента (или тренинга) среди представителей некоторой организации было проведено измерение какого-то психологического показателя (например, удовлетворенности) и его средняя по выборке величина составила М = 0,43. Исследование проводилось не среди всех членов организации, а только в выборке из 100 человек, причем для них уровень удовлетворенности был распределен по нормальному закону. Кроме того известно, что среднее квадратичное отклонение S = 1,12.
Далее, в течении месяца, шел формирующий эксперимент (тренинг, направленный на повышение чувства удовлетворенности или, скажем, структурная реорганизация, учитывающая психологическую совместимость членов коллектива) и после этого проводился еще один замер удовлетворенности, в котором получены следующие параметры М = 0,68; S= 1,12.
Возникает вопрос – действительно ли формирующий эксперимент оказал существенное воздействие на сотрудников организации или полученный результат – это следствие несовершенства (например, небольшого размера) нашей выборки. Таким образом, можно выдвинуть две гипотезы:
1. Н0 (нулевая гипотеза) – реально за месяц никаких изменений не произошло и средние значения до и после эксперимента на самом деле совпадают.
2. Н1 (альтернативная гипотеза) – за месяц действительно произошли изменения и удовлетворенность сотрудников организации возросла.
Проверим эти гипотезы.
Если распределения оценок удовлетворенности для нашей выборки нормально, то можно воспользоваться "правилом двух сигм". В нашем случае, для первого замера интервал двух сигм, куда попадет 95,5% всех случаев определяется по формуле:
–
нижняя
граница –
–
верхняя
граница –
Итак, в интервале (0,21; 0,65) будут находится почти 96% оценок удовлетворенности в первом замере. Поскольку во втором замере было получено М = 0,68, это значение выходит за рамки очерченного интервала. Поэтому если мы принимаем альтернативную гипотезу Н1 (есть значимое различие уровней удовлетворенности до и после формирующего эксперимента), то ошибиться мы можем не более, чем в 4% случаев (100 – 96 = 4), выходящих за пределы интервала двух сигм.
В нашем примере можно сделать вывод, что на уровне значимости 5% формирующий эксперимент оказался результативным и привел к росту чувства удовлетворенности у сотрудников организации.
Непосредственно использовать "правило двух сигм" каждый раз, когда необходимо оценить ошибку статистических выводов, связанную с выборочностью эмпирических исследований, было бы не очень удобно. Поэтому была разработана специальная технология, в которой ключевым элементом является статистический критерий. Сразу отметим, что для разных содержательных задач используются различные виды статистических критериев. Так, уже известно, что для сопоставления эмпирического распределения с нормальным можно применять критерий Колмогорова-Смирнова. Точно так же существует специальный критерий, который используется для сопоставления двух средних значений и т. д.
Таким образом, статистическим критерием называется решающее правило, позволяющее принять истинные статистические гипотезы и отклонить ложные с высокой вероятностью (обычно, соответствующей заранее заданному уровню значимости). В прикладной статистике существует определенная традиция формулирования гипотез, отличающихся от общенаучного их понимания и называющихся статистическими. Статистические гипотезы формулируются по специальным правилам и подразделяются на нулевые и альтернативные.
Нулевая гипотеза – это гипотеза об отсутствии различий, обозначается как Н0, поскольку согласно ей между значениями признаков Х1 и Х2 отсутствуют различия, т. е. Х1 – Х2 = 0. Поскольку обычно встает задача доказательства значимости различий, то нулевую гипотезу в большинстве эмпирических исследований необходимо опровергнуть.
Альтернативная гипотеза – в противоположность нулевой, это гипотеза о значимости различий. Обычно обозначается как Н1. Обычно это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.
Ошибка, состоящая в отклонении нулевой гипотезы Н0, в то время как она верна, называется ошибкой первого рода. Вероятность такой ошибки называется уровнем значимости и часто обозначается как α.
Ошибка, состоящая в принятии нулевой гипотезы когда она неверна, называется ошибкой второго рода. Мощность критерия – это его способность не допустить ошибку второго рода.
Традиционно в исследованиях оцениваются именно ошибки первого рода и называются они уровнем значимости. На практике исследователям удобнее оказалось задавать вероятность таких ошибок на фиксированном уровне. Это прежде всего связано с использованием для вычислений специальных таблиц, которые опубликованы для всех наиболее распространенных критериев. В этих таблицах уровень значимости принято задавать (в поведенческих науках) как 1 и 5 процентный (иногда, особенно в таблицах, он обозначается в долях от 1, т. е. как 0,05 и 0,01). Смысл 1% уровня значимости состоит в том, что статистически обеспечивается вероятность ошибки не более 1%. Это можно интерпретировать следующим образом. Сделаем из нашей генеральной совокупности 100 выборок, тогда в 99 из них мы получим безошибочные выводы и только в 1 выборке возможны ошибки.
Статистические критерии кроме способа (алгоритма) расчета могут так же обозначать и результат расчета, т. е. конкретное значение критерия. Кроме содержательной классификации критериев существует их более общее подразделение на параметрические и непараметрические.
Параметрические критерии включают в алгоритм расчета параметры распределения, т. е. средние и дисперсии (например, t-критерий Стъюдента и F-критерий Фишера).
Непараметрические критерии основываются на оперировании частотами или рангами и не включают в расчеты параметры распределения (критерий χ2"хи квадрат").
В качестве примера работы с непараметрическим критерием рассмотрим расчет критерия χ2 – "хи-квадрат".
При этом к эмпирическим данным предъявляются следующие требования:
– выборка состоит из независимых наблюдений;
– ни одна из ожидаемых частот не должна быть слишком мала (минимум – 5, в противном случае надо укрупнять интервал, объединяя несколько соседних градаций шкалы).
Таблица 12
