Оценка нормальности распределения

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский национальный исследовательский технический университет им. А. Н. Туполева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Курс лабораторных работ 2003.docx

Скачиваний:

Добавлен:

12.03.2015

Размер:

8.67 Mб

Скачать

☆

<<< < Предыдущая 18 19 20 21 22 23 24 25 26 27 28 29 3031 / 4231 32 33 34 35 36 37 38 39 40 41 42 > Следующая >>>

Оценка нормальности распределения
1. Необходимость проверки нормальности распределения анализируемых данных

Как известно, существующие методы статистического анализа можно подразделить на две группы – параметрические и непараметрические. Важным условием, определяющим возможность применения параметрических методов, является подчинение анализируемых данных закону нормального (Гауссова) распределения. В то же время непараметрические методы выполнения этого условия не требуют. Применение параметрических методов анализа для ненормально распределенных признаков приводит к выводам, не соответствующим действительности. Во избежание указанной ошибки, любой анализ признаков должен сопровождаться проверкой нормальности их распределения.

Проверка на нормальность распределения анализируемых данных

Оценить соответствие анализируемых данных нормальному закону можно с помощью модуля «Statistics/Distributionfitting». В диалоговом окне этого модуля (рис. 5 .99) в списке непрерывных распределений (ContinuousDistributions) указывается тип распределения (Normal).

Рисунок 5.99. Диалоговое окно «Distribution fitting»

По нажатию кнопки «OK» будет отображено диалоговое окно настройки процесса оценки нормальности «FittingContinuousDistributions» (рис. 5 .100), где по кнопке «Variable» следует выбрать переменные для анализа (например, ID_UNEMPLAYMENT – индекс уровня безработицы).

Рисунок 5.100. Диалоговое окно «Fitting Continuous Distributions»

Нажав кнопку «Plot of observed and expected distributions» (График наблюдаемого и ожидаемого распределений), получим гистограмму распределения данных о индексе уровня безработицы и красную кривую, соответствующую ожидаемому нормальному распределению (у этого ожидаемого распределения те же средняя арифметическая и стандартное отклонение, что и в анализируемой совокупности данных) (рис. 5 .101). Глядя на полученный рисунок, можно сказать, что в целом распределение значений индекса уровня безработицы соответствует нормальному. Это заключение, основанное на визуальном анализе распределения, имеет и более строгое подтверждение в виде результатов теста (Chi-square test, см. в верхней части графика на рис. 5 .101). В данном случае этот тест проверяет нулевую гипотезу о том, что наблюдаемое распределение анализируемого признака не отличается от теоретически ожидаемого нормального распределения. Поскольку вероятность ошибиться, отклонив эту гипотезу оказалась больше 0,05 (Р = 0,29541), мы принимаем, что гипотеза действительно верна. Иными словами, распределение значений индекса уровня безработицы статистически не отличается от нормального распределения.

Рисунок 5.101. Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая

Тесты Колмогорова – Смирнова и Шапиро – Уилка

Следует отметить, что мощность теста при проверке нормальности распределения анализируемых данных относительно невысока (другими словами, его применение достаточно часто приводит к ошибочному выводу о нормальности распределения). Поэтому лучше воспользоваться и другими тестами. Их можно найти в уже рассмотренном выше модуле «Descriptive Statistics». После запуска этого модуля необходимо открыть закладку «Normality» и в поле «Distribution» (Распределение) разыскать опции «Kolmogorov-Smirnov and Lilliefors test for normality» (Тест Колмогорова-Смирнова и Лиллифорса на нормальность) и «Shapiro-Wilk’s W test» (W-тест Шапиро-Уилка). Равно как и критерий, эти тесты проверяют нулевую гипотезу об отсутствии различий между наблюдаемым распределением фактора и теоретическим ожидаемым нормальным распределением. Наиболее предпочтительным, особенно при небольших выборках (N= 3 ÷ 50) является использование W- критерия Шапиро-Уилка, поскольку он обладает наибольшей мощностью в сравнении со всеми перечисленными критериями (т.е. чаще выявляет различия между распределениями в тех случаях, когда они действительно есть). Для выбора того или иного теста, достаточно поставить флажок рядом с его названием. После выбора анализируемой переменной (кнопка «Variables») и нажатия кнопки «Histograms» программа создаст гистограмму распределения значений фактора и ожидаемую нормальную кривую (рис. 5 .102). Результаты выбранных тестов на нормальность автоматически располагаются в заголовке этого графика. ПриР> 0,05 можно заключить, что анализируемое распределение не отличается от нормального. В примере с данными об индексе уровня безработицы для теста Шапиро-Уилка получаемР= 0,45749 (рис. 5 .102), что подтверждает сделанный ранее вывод о нормальности распределения этих данных.

Рисунок 5.102 Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая по критерию Колмогорова-Смирнова и Шапиро-Уилка

<<< < Предыдущая 18 19 20 21 22 23 24 25 26 27 28 29 3031 / 4231 32 33 34 35 36 37 38 39 40 41 42 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.11.201886.02 Кб41Критика.doc
#
20.11.2019560.64 Кб39Культурология учебное пособие.doc
#
12.03.2015278.53 Кб13КУЛЬТУРОЛОГИЯ-основной.doc
#
10.11.2018190.98 Кб7культурология.doc
#
12.03.2015196.46 Кб48Культурология.rtf
#
12.03.20158.67 Mб77Курс лабораторных работ 2003.docx
#
25.09.20192.51 Mб82курс лекций ОТУ.doc
#
23.12.2018145.35 Кб4Курс лекций по дисциплине соц псих.docx
#
12.03.201516.53 Mб238Курс лекций по ДМ.doc
#
04.05.2019830.98 Кб8Курс лекций по маркетингу.doc
#
12.03.20154.57 Mб62КУРС лекций по НГ.doc

Оценка нормальности распределения

Необходимость проверки нормальности распределения анализируемых данных

Проверка на нормальность распределения анализируемых данных

Тесты Колмогорова – Смирнова и Шапиро – Уилка