Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Флешка / Пособие к научной конференции2016апрель / Методичка Статистика_РОССТАТ.doc
Скачиваний:
170
Добавлен:
19.06.2017
Размер:
37.39 Mб
Скачать

3.4. Проверка уровня влияния факторов

3.4.1 Однофакторный анализ

Компьютерная программа Statistica10 содержит модульANOVA, который позволяет оценить уровень влияния факторов с помощью дисперсионного анализа (ДА). Метод можно применять для нормально распределенных переменных.

Вызов дисперсионного анализа осуществляется из меню Анализ-Дисперсионный анализ (ДА)- см. рис. 3.5.

Главным является расположение переменных и факторов в таблице данных: каждый фактор должен находиться в своем столбце. Факторы являются группирующими переменными. Величины, на которые они влияют, зависимыми переменными.

Если нужно определить влияние только одного фактора, например, гендерного признака на вес, достаточно выбрать в модуле дисперсионного анализа Однофакторный анализ. Расположить переменные Вес и Пол в разных столбцах (рис. 3.4.1.1).

Важно, что в столбце Вес имеются данные веса и мужчин и женщин.

Обозначения фактора гендерный признак на рис. 3.4.1.1 цифровые (1- Мужской пол, 2- Женский пол), но можно обозначить и буквами.

После выбора Однофакторный анализ (рис.3.4.1.2 слева вверху), необходимо определить зависимую переменную и категориальный предиктор (фактор). Как видно на рис.3.3.1.2 справа – зависимая переменная – вес, фактор – пол. Выбор заканчивается нажатием кнопки ОК.

Результат можно посмотреть, нажав кнопку Все эффекты (рис.3.4.1.2 слева внизу).

После выполнения указанных действий получаем таблицу, где значимые величины выделены красным цветом (рис. 3.4.1.3)

Однофакторный анализ по исследованию значимости гендерного признака на вес показал, что фактор значим, так как строки «свободный член» и «пол» выделены красным

Группа 6

В предпоследней колонке указано значение F-критерия Фишера-Снедекора

3.4.2. Многофакторный (двухфакторный) анализ

.Многофакторный анализ одновременно может определить уровень влияния только двух факторов на нормально распределенную переменную: например, кроме гендерного признака еще и фактора Рост на переменную Вес. После правильного расположения данных в меню (рис.3.3.1.2 слева вверху) выбирают Главные эффекты. Затем определяют зависимую переменную и указывают факторы в списке Независимые предикторы. После нажатия кнопки ОК появится окно, где нужно выбрать кнопку Все эффекты (рис.3.3.1.2 слева внизу).

Рис. 7. Зависимость веса от гендерного признака

Рис. 7. Зависимость веса от гендерного признака

Рис. 7. Зависимость веса от гендерного признака

Рис. 7. Зависимость веса от гендерного признака

Рис. 7. Зависимость веса от гендерного признака

Рис. 7. Зависимость веса от гендерного признака

Как видно из результирующей таблицы (рис.3.4.2.1) строки Рост и Пол выделены красным цветом, значение F– критерия приведено, а в последней колонке указана вероятность ошибки. Таким образом, уровни влияния этив факторов на величину Вес существенны.

3.5 Проверка статистических гипотез

Статистической гипотезойназывается любое предположение о виде или параметрах неизвестного закона распределения. Проверяемую гипотезу обычно называютнулевой(илиосновной)и обозначаютН0. Наряду с нулевой рассматриваютконкурирующую,или альтернативную, гипотезуН1, являющуюся логическим отрицаниемН0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Правило, по которому гипотезаН0 принимается или отвергается, называетсястатистическим критериемилистатистическим тестом. Обычно, по этому правилу вычисляется число по данным выборки (выборочный критерий) и это число сравнивается с критическим табличным значением: если выборочный критерий больше критического – нулевая гипотеза отвергается, в противном случае принимается(нулевая гипотеза признается состоятельной). Возможны четыре случая (табл.1).

Таблица 1. Группы ошибок

Гипотеза Н0

принимается

отвергается

верна

правильное решение

ошибка 1го рода

неверна

ошибка 2го рода

правильное решение

Вероятность α допустить ошибку 1го рода , т.е. отвергнуть гипотезу Н0, когда она верна, называетсяуровнем значимости, илиразмером,критерия.

Вероятность допустить ошибку 2-го рода, , т.е. принять гипотезу Н0, когда она неверна, обычно обозначают β.

Вероятность (1- β), т.е. отвергнуть гипотезу Н0, когда она неверна, называютмощностью критерия.

В медицине и биологии уровень значимость должен быть 0,05, т.е. α<0,05. Тогда доверительная вероятность Рсоставляет 0,95, т.к. Р=1-α.

На практике используют два вида критериев значимости нулевой гипотезы параметрические (зависят от параметра, например, Хср) выборки, имеющей нормальное или близкое к нормальному распределение, и непараметрические, которые не имеют такого ограничения.

Вызов параметров описан в разделе 3 рис.3.5

Проверка гипотез относительно средних(t-критерий Стьюдента). Для примера в программеStatistica10, рассмотрим применение параметрической статистики, т.е. параметрическогоt-критерия Стьюдента.

Вопрос сформулируем так: достоверно ли увеличение веса влиянием пола человека при уровне значимости α=0,05?.

После вызова параметрической статистики нужно выбрать Т-критерии (рис. 3.5.1). Как видно из рисунка(слева) переменные Вес женщин и Вес мужчин расположены в разных колонках. Нулевая гипотеза заключается в том, что пол Вес одинаково ведет себя для лиц мужского и женского пола. Внизу на рис. 3.5.1 показано окно результата: красный цвет в строках и значение t-критерия в красном цвете показывает, что нулевая гипотеза опровергается и влияние пола на величину веса достоверно.