
- •Волошина в.Н., Клочкова о.И., Переломова о.В.
- •Оглавление
- •Общие положения
- •1.Основные разделы официальных сайтов стиатистики
- •1.1. Основные разделы медицинской статистики официального сайта росстаТа рф
- •1.2. Основные разделы медицинской статистики официального сайта ПриморскСтата Приморского края
- •2. Статистический анализ динамических рядов в ms Excel
- •2.1. Общие показатели динамики
- •2.2. Показатели прироста/убыли
- •2.3.Средние показатели динамики
- •2.4. Выявление тенденции (тренда) в рядах динамики.
- •2.4.1. Тренды
- •2.4.2. Прогнозы
- •2.5. Автоматизация расчетов
- •3. Компьютерный анализ данных в программеStatistica10
- •3.1 Параметрическая и непараметрическая статистика
- •3.2 Проверка на нормальность распределения выборки
- •3.3 Множественная регрессия
- •3.4. Проверка уровня влияния факторов
- •3.4.1 Однофакторный анализ
- •3.4.2. Многофакторный (двухфакторный) анализ
- •3.5 Проверка статистических гипотез
- •4. Практические работы
- •4.1 Влияние гендерного признака на величину веса, на коэффициент корреляции между ростом и весом
- •3.Анализ данных
- •3.1. Графический Анализ данных в ms Excel
- •3.2. Анализ данных в Statistica 10
- •4.2 Сравнительный анализ рождаемости среди городского и сельского населения в Приморском крае в программах ms Excel и Statistica 10 по данным Территориальной службы статистики по Приморскому краю
- •1.1.Характеристика данных
- •2. Сравнительный анализ данных
- •2.1. Сравнительный анализ в программе ms Excel
- •2.2. Сравнительный анализ в программе Statistica 10
- •4.3 Сравнительный анализ выбывшего населения из городов Приморского края в программах ms Excel и Statistica 10 по данным Территориальной службы статистики по Приморскому краю
- •3.Анализ данных
- •3.1.Обработка данных в ms Excel
- •4.4. Сравнительный анализ прибывшего населения в города Приморского края в программах ms Excel и Statistica 10 по данным Территориальной службы статистики по Приморскому краю
- •4.5.Сравнительный анализ естественного прироста городского населения в Приморском крае в программах ms Excel и Statistica 10 по данным Территориальной службы статистики по Приморскому краю
- •4.7 Сравнительный анализ смертности городского населения в Приморском крае в программах ms Excel и Statistica 10 по данным Территориальной службы статистики по Приморскому краю
- •Рекомендуемые источники информации
3.4. Проверка уровня влияния факторов
3.4.1 Однофакторный анализ
Компьютерная программа Statistica10 содержит модульANOVA, который позволяет оценить уровень влияния факторов с помощью дисперсионного анализа (ДА). Метод можно применять для нормально распределенных переменных.
Вызов дисперсионного анализа осуществляется из меню Анализ-Дисперсионный анализ (ДА)- см. рис. 3.5.
Главным является расположение переменных и факторов в таблице данных: каждый фактор должен находиться в своем столбце. Факторы являются группирующими переменными. Величины, на которые они влияют, зависимыми переменными.
Если нужно определить влияние только одного фактора, например, гендерного признака на вес, достаточно выбрать в модуле дисперсионного анализа Однофакторный анализ. Расположить переменные Вес и Пол в разных столбцах (рис. 3.4.1.1).
Важно,
что в столбце Вес имеются данные веса
и мужчин и женщин.
Обозначения
фактора гендерный признак на рис.
3.4.1.1 цифровые (1- Мужской пол, 2- Женский
пол), но можно обозначить и буквами.
После выбора Однофакторный анализ (рис.3.4.1.2 слева вверху), необходимо определить зависимую переменную и категориальный предиктор (фактор). Как видно на рис.3.3.1.2 справа – зависимая переменная – вес, фактор – пол. Выбор заканчивается нажатием кнопки ОК.
Результат можно посмотреть, нажав кнопку Все эффекты (рис.3.4.1.2 слева внизу).
После выполнения указанных действий получаем таблицу, где значимые величины выделены красным цветом (рис. 3.4.1.3)
Однофакторный анализ по исследованию значимости гендерного признака на вес показал, что фактор значим, так как строки «свободный член» и «пол» выделены красным
В предпоследней колонке указано значение F-критерия Фишера-Снедекора
3.4.2. Многофакторный (двухфакторный) анализ
.Многофакторный анализ одновременно может определить уровень влияния только двух факторов на нормально распределенную переменную: например, кроме гендерного признака еще и фактора Рост на переменную Вес. После правильного расположения данных в меню (рис.3.3.1.2 слева вверху) выбирают Главные эффекты. Затем определяют зависимую переменную и указывают факторы в списке Независимые предикторы. После нажатия кнопки ОК появится окно, где нужно выбрать кнопку Все эффекты (рис.3.3.1.2 слева внизу).
Рис. 7. Зависимость веса от гендерного
признака
Рис. 7. Зависимость веса от гендерного
признака
Рис. 7. Зависимость веса от гендерного
признака
Рис. 7. Зависимость веса от гендерного
признака
Рис. 7. Зависимость веса от гендерного
признака
Рис. 7. Зависимость веса от гендерного
признака
Как видно из результирующей таблицы (рис.3.4.2.1) строки Рост и Пол выделены красным цветом, значение F– критерия приведено, а в последней колонке указана вероятность ошибки. Таким образом, уровни влияния этив факторов на величину Вес существенны.
3.5 Проверка статистических гипотез
Статистической гипотезойназывается любое предположение о виде или параметрах неизвестного закона распределения. Проверяемую гипотезу обычно называютнулевой(илиосновной)и обозначаютН0. Наряду с нулевой рассматриваютконкурирующую,или альтернативную, гипотезуН1, являющуюся логическим отрицаниемН0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Правило, по которому гипотезаН0 принимается или отвергается, называетсястатистическим критериемилистатистическим тестом. Обычно, по этому правилу вычисляется число по данным выборки (выборочный критерий) и это число сравнивается с критическим табличным значением: если выборочный критерий больше критического – нулевая гипотеза отвергается, в противном случае принимается(нулевая гипотеза признается состоятельной). Возможны четыре случая (табл.1).
Таблица 1. Группы ошибок
Гипотеза Н0 |
принимается |
отвергается |
верна |
правильное решение |
ошибка 1го рода |
неверна |
ошибка 2го рода |
правильное решение |
Вероятность α допустить ошибку 1го рода , т.е. отвергнуть гипотезу Н0, когда она верна, называетсяуровнем значимости, илиразмером,критерия.
Вероятность допустить ошибку 2-го рода, , т.е. принять гипотезу Н0, когда она неверна, обычно обозначают β.
Вероятность (1- β), т.е. отвергнуть гипотезу Н0, когда она неверна, называютмощностью критерия.
В медицине и биологии уровень значимость должен быть 0,05, т.е. α<0,05. Тогда доверительная вероятность Рсоставляет 0,95, т.к. Р=1-α.
На практике используют два вида критериев значимости нулевой гипотезы параметрические (зависят от параметра, например, Хср) выборки, имеющей нормальное или близкое к нормальному распределение, и непараметрические, которые не имеют такого ограничения.
Вызов параметров описан в разделе 3 рис.3.5
Проверка гипотез относительно средних(t-критерий Стьюдента). Для примера в программеStatistica10, рассмотрим применение параметрической статистики, т.е. параметрическогоt-критерия Стьюдента.
Вопрос сформулируем так: достоверно ли увеличение веса влиянием пола человека при уровне значимости α=0,05?.
После вызова параметрической статистики нужно выбрать Т-критерии (рис. 3.5.1). Как видно из рисунка(слева) переменные Вес женщин и Вес мужчин расположены в разных колонках. Нулевая гипотеза заключается в том, что пол Вес одинаково ведет себя для лиц мужского и женского пола. Внизу на рис. 3.5.1 показано окно результата: красный цвет в строках и значение t-критерия в красном цвете показывает, что нулевая гипотеза опровергается и влияние пола на величину веса достоверно.