Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Nasledov 7-13.doc
Скачиваний:
14
Добавлен:
01.05.2025
Размер:
2.67 Mб
Скачать

Глава 7. Введение в проблему статистического вывода

тическая значимость, р-уровень значимости является количественной оцен­кой надежности связи: чем меньше эта вероятность, тем надежнее связь.

Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности по­казала, что если она верна, то вероятность случайного появления обнаружен­ных различий составляет не более 5%. Иначе говоря, если бы две выборки мно­гократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средни­ми этих выборок. То есть существует 5%-ная вероятность того, что обнаружен­ные различия носят случайный характер, а не являются свойством совокупности.

В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой ги­потезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:

  • величина связи (различия) больше;

  • изменчивость признака (признаков) меньше;

  • объем выборки (выборок) больше.

Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназна­ченные для соотнесения эмпирических значений статистик с теоретически­ми распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при уве­личении объема выборки.

Чем больше гипотез проверяется, тем выше шанс получить результат чис­то случайно — р-уровень увеличивается пропорционально количеству проверяе­мых гипотез!

Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентич­ной) выборке.

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также

99

Часть II. Методы статистического вывода: проверка гипотез

упомянули критерий ^-Стьюдента. Как следует из логики проверки статисти­ческих гипотез, в качестве основы для применения статистических критери­ев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим рас­пределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследо­ватель вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.

Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы (degrees of free­dom — обозначается как df)— это количество возможных направлений измен­чивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти пока­затели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следу­ющее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.

Назначение критерия — проверка статистической гипотезы путем опреде­ления/ьуровня значимости (вероятности того, что Но верна).

Выбор критерия определяется проверяемой статистической гипотезой.

Критерий включает в себя:

П формулу расчета эмпирического значения критерия по выборочным ста­тистикам; D правило (формулу) определения числа степеней свободы;

  • теоретическое распределение для данного числа степеней свободы;

  • правило соотнесения эмпирического значения критерия с теоретичес­ ким распределением для определения вероятности того, что Но верна.

Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать раз­ные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообра­зия: вычисленное по формуле эмпирическое значение критерия сопоставля­ется с теоретическим распределением для заданного числа степеней свобо­ды, что позволяет определить вероятность того, что Но верна.

ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]