Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Марков_Математические методы в в психологии.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
696.32 Кб
Скачать

Статистические критерии

Потребность в статистических критериях возникает из-за того, что, как правило, эмпирические исследования проводятся на основе информации о выборке, а далее надо сделать вывод, относящийся к генеральной совокупности. Например, из генеральной совокупности в 10 тыс. человек сделана выборка объемом 1 тыс. человек. Как бы "правильно" ни была построена выборка, при распространении полученных в ходе исследования выводов с нее на всю генеральную совокупность, возможны ошибки. В частности, все измеряемые в выборочном исследовании показатели, например, среднее по выборке значение возраста оказываются только приближенными оценками реальных показателей генеральной совокупности (того же среднего возраста). Задача прикладной статистики состоит в оценке вероятности таких ошибок и определении их величины.

Рассмотрим, возможность применения "правила двух сигм" к оценке вероятности ошибки оценки числового показателя, измеряемого в эмпирическом исследовании на следующем примере.

Пусть перед началом формирующего эксперимента (или тренинга) среди представителей некоторой организации было проведено измерение какого-то психологического показателя (например, удовлетворенности) и его средняя по выборке величина составила М = 0,43. Исследование проводилось не среди всех членов организации, а только в выборке из 100 человек, причем для них уровень удовлетворенности был распределен по нормальному закону. Кроме того известно, что среднее квадратичное отклонение S = 1,12.

Далее, в течении месяца, шел формирующий эксперимент (тренинг, направленный на повышение чувства удовлетворенности или, скажем, структурная реорганизация, учитывающая психологическую совместимость членов коллектива) и после этого проводился еще один замер удовлетворенности, в котором получены следующие параметры М = 0,68; S= 1,12.

Возникает вопросдействительно ли формирующий эксперимент оказал существенное воздействие на сотрудников организации или полученный результат – это следствие несовершенства (например, небольшого размера) нашей выборки. Таким образом, можно выдвинуть две гипотезы:

1. Н0 (нулевая гипотеза)реально за месяц никаких изменений не произошло и средние значения до и после эксперимента на самом деле совпадают.

2. Н1 (альтернативная гипотеза)за месяц действительно произошли изменения и удовлетворенность сотрудников организации возросла.

Проверим эти гипотезы.

Если распределения оценок удовлетворенности для нашей выборки нормально, то можно воспользоваться "правилом двух сигм". В нашем случае, для первого замера интервал двух сигм, куда попадет 95,5% всех случаев определяется по формуле:

нижняя граница –

верхняя граница –

Итак, в интервале (0,21; 0,65) будут находится почти 96% оценок удовлетворенности в первом замере. Поскольку во втором замере было получено М = 0,68, это значение выходит за рамки очерченного интервала. Поэтому если мы принимаем альтернативную гипотезу Н1 (есть значимое различие уровней удовлетворенности до и после формирующего эксперимента), то ошибиться мы можем не более, чем в 4% случаев (10096 = 4), выходящих за пределы интервала двух сигм.

В нашем примере можно сделать вывод, что на уровне значимости 5% формирующий эксперимент оказался результативным и привел к росту чувства удовлетворенности у сотрудников организации.

Непосредственно использовать "правило двух сигм" каждый раз, когда необходимо оценить ошибку статистических выводов, связанную с выборочностью эмпирических исследований, было бы не очень удобно. Поэтому была разработана специальная технология, в которой ключевым элементом является статистический критерий. Сразу отметим, что для разных содержательных задач используются различные виды статистических критериев. Так, уже известно, что для сопоставления эмпирического распределения с нормальным можно применять критерий Колмогорова-Смирнова. Точно так же существует специальный критерий, который используется для сопоставления двух средних значений и т. д.

Таким образом, статистическим критерием называется решающее правило, позволяющее принять истинные статистические гипотезы и отклонить ложные с высокой вероятностью (обычно, соответствующей заранее заданному уровню значимости). В прикладной статистике существует определенная традиция формулирования гипотез, отличающихся от общенаучного их понимания и называющихся статистическими. Статистические гипотезы формулируются по специальным правилам и подразделяются на нулевые и альтернативные.

Нулевая гипотеза – это гипотеза об отсутствии различий, обозначается как Н0, поскольку согласно ей между значениями признаков Х1 и Х2 отсутствуют различия, т. е. Х1Х2 = 0. Поскольку обычно встает задача доказательства значимости различий, то нулевую гипотезу в большинстве эмпирических исследований необходимо опровергнуть.

Альтернативная гипотеза – в противоположность нулевой, это гипотеза о значимости различий. Обычно обозначается как Н1. Обычно это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.

Ошибка, состоящая в отклонении нулевой гипотезы Н0, в то время как она верна, называется ошибкой первого рода. Вероятность такой ошибки называется уровнем значимости и часто обозначается как α.

Ошибка, состоящая в принятии нулевой гипотезы когда она неверна, называется ошибкой второго рода. Мощность критерия – это его способность не допустить ошибку второго рода.

Традиционно в исследованиях оцениваются именно ошибки первого рода и называются они уровнем значимости. На практике исследователям удобнее оказалось задавать вероятность таких ошибок на фиксированном уровне. Это прежде всего связано с использованием для вычислений специальных таблиц, которые опубликованы для всех наиболее распространенных критериев. В этих таблицах уровень значимости принято задавать (в поведенческих науках) как 1 и 5 процентный (иногда, особенно в таблицах, он обозначается в долях от 1, т. е. как 0,05 и 0,01). Смысл 1% уровня значимости состоит в том, что статистически обеспечивается вероятность ошибки не более 1%. Это можно интерпретировать следующим образом. Сделаем из нашей генеральной совокупности 100 выборок, тогда в 99 из них мы получим безошибочные выводы и только в 1 выборке возможны ошибки.

Статистические критерии кроме способа (алгоритма) расчета могут так же обозначать и результат расчета, т. е. конкретное значение критерия. Кроме содержательной классификации критериев существует их более общее подразделение на параметрические и непараметрические.

Параметрические критерии включают в алгоритм расчета параметры распределения, т. е. средние и дисперсии (например, t-критерий Стъюдента и F-критерий Фишера).

Непараметрические критерии основываются на оперировании частотами или рангами и не включают в расчеты параметры распределения (критерий χ2"хи квадрат").

В качестве примера работы с непараметрическим критерием рассмотрим расчет критерия χ2 – "хи-квадрат".

При этом к эмпирическим данным предъявляются следующие требования:

– выборка состоит из независимых наблюдений;

– ни одна из ожидаемых частот не должна быть слишком мала (минимум 5, в противном случае надо укрупнять интервал, объединяя несколько соседних градаций шкалы).

Таблица 12