
- •Часть 3 тула 2009
- •Часть 3
- •Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
- •Введение
- •1 Статистический анализ результатов прямых многократных измерений (случай maлыx выборок). Форма записи результата измерений.
- •1.1. Цель занятия
- •2 Проверка годности первичных результатов измерений
- •2.1. Цель занятия
- •3 Статистическая оценка параметров распределения больших выборок. Построение гистограммы
- •3.1. Цель занятия
- •4 Проверка гипотезы о нормальном распределении случайных величин в выборке
- •4.1. Цель занятия
- •5 Проверка гипотезы о равенстве дисперсий. (оценка равноточности измерений)
- •5.1. Цель занятия
- •5.3. Сравнение нескольких дисперсий по критерию Бартлетта
- •С помощью критерия Бартлетта (rand-здесь выборка и далее её номер)
- •С помощью критерия Кохрена Параметры выборки «Бар»
- •Параметры выборки «Кох»
- •Статистического анализа
- •6 Сравнение двух средних значений нормально распределенных совокупностей
- •6.1. Цель занятия
- •(Дисперсии предполагаются равными)
- •(Дисперсии предполагаются неравными)
- •7 Корреляционный анализ для случая линейной парной связи
- •7.1. Цель занятия
- •Корреляционного анализа
- •7.3. Статистический анализ
- •Последующего корреляционного анализа
- •8 Регрессионный анализ результатов совместных измерений для случая линейной модели
- •8.1. Цель занятия
- •8.3. Статистический анализ
- •9 Однофакторный дисперсионный анализ
- •9.1. Цель занятия
- •Для дисперсионного анализа
- •9.3. Статистический анализ.
- •Данных для последующего дисперсионного анализа
- •Анализа
4 Проверка гипотезы о нормальном распределении случайных величин в выборке
4.1. Цель занятия
Практическое освоение правил проверки согласия опытного распределения с теоретическим нормальным для случая малых выборок (n50) и с помощью χ2- критерия Пирсона для случая больших выборок ( n50).
В настоящее время используют множество критериев (критериев согласия) с помощью которых тестируется нулевая гипотеза о согласии эмпирического распределения случайных величин в выборке с некоторым теоретическим распределением. О том насколько важно знать модель распределения случайных величин в задачах управления, прогнозирования, описания процессов и явлений и их моделирования написано множество научных трудов. Большинство авторов сходятся во мнении, что проверку согласия лучше всего проводить на выборках больших объёмов (практически при объёмах в сотни случайных величин) и использовать для этого χ2 (хи-квадрат) критерий Пирсона. Если с первым трудно не согласиться, хотя существуют критерии проверки и для случая малых выборок, то второе утверждение скорее дань традиции и автор настоящего пособия настроен по отношению к критерию Пирсона несколько скептически.
Но в большинстве ППП при проверке согласия опытного и теоретического распределений использован именно этот критерий (наряду с другими) поэтому рассмотрим процедуру проверки согласия для выборки, описанной в примере 4.2 [1] и для которой в разделе 3 строили гистограмму. Требуется проверить гипотезу о нормальном законе распределения результатов измерений твёрдости методом Бринелля с использованием χ2 - критерия Пирсона для уровня значимости α=0,05.
4.2. Создание электронной таблицы с данными для статистического анализа производится так же, как это описано в разделе 1.
4.3. Статистический анализ. После создания электронной таблицы с тестируемой выборкой последовательно щёлкаем левой кнопкой мыши по Describe (Описательная статистика) / Distributions (Распределения) / Distribution Fitting – Uncensored Data (Тестирование распределения нецензурированных выборок). Цензурированной считается выборка, из которой с использованием специальных критериев отброшены крайние значения, слишком удалённые от центра распределения. В нецензурированных выборках сохраняются все её элементы. Подробнее смотрите монографии [6,7].
Далее в таблице, аналогичной таблицам на рис.2.2 и 3.1, выбираем колонку с тестируемой выборкой и ОК. Дважды щёлкаем по нижней левой таблице, раскрывая её во весь экран, и приступаем к изучению полученных результатов анализа (рис.4.1). Здесь следует обратить внимание на следующие обстоятельства.
Во-первых, нас прежде всего интересуют результаты тестирования. Они находятся под таблицей и свидетельствуют (P-Value = 0,0437451), что вероятность согласия опытного распределения с нормальным очень мала (менее 0,05), а, следовательно, нулевую гипотезу о согласии опытного и теоретического нормального распределений приходится отбросить.
Во-вторых. Внимательно рассмотрим структуру таблицы. И начнём с четвёртой колонки Expected Frequency (Ожидаемая, теоретическая частота появления результатов в данном интервале). Глядя на частоту появления результатов, можно подумать, что речь идёт о тестировании равномерно распределённых результатов. Но это, естественно, не так. Система по умолчанию тестирует именно нормальное распределение. В чём же дело? А дело в том, что ПК удобнее иметь дело не с интервалами равной длины (как это сделано в таблице 4.3 [1] и в большинстве пособий по статистике, ориентированных на «ручной» счёт), а с интервалами равной вероятности [7]. И действительно длины интервалов на рис. 4.1 разные. Длину интервала можно определить простым вычитанием из значения верхней границы интервала группирования (Upper Limit) нижнего значения границы (Lower Limit). Надеемся, что название третьей колонки (Observed Frequency) вопросов не вызовет. Наконец d.f. означает число степеней свободы.
Goodness-of-Fit Tests for Col_1 (результаты тестирования данных колонки1)
Chi-Square Test (χ2 тест)
----------------------------------------------------------------------------
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
----------------------------------------------------------------------------
at or below 255,554 11 13,00 0,31
255,554 268,009 12 13,00 0,08
268,009 277,323 17 13,00 1,23
277,323 285,663 8 13,00 1,92
285,663 294,004 12 13,00 0,08
294,004 303,318 18 13,00 1,92
303,318 315,773 11 13,00 0,31
315,773 333,0 15 9,33 3,44
above 333,0 0 3,67 3,67
----------------------------------------------------------------------------
Chi-Square = 12,9557 with 6 d.f. P-Value = 0,0437451
Рис. 4.1. Проверка согласия опытного распределения с нормальным
по χ2 -критерию Пирсона.
В заключении раздела отметим, что тестировать согласие результатов измерений можно с любой из 24 моделей распределения, которые «зашиты» в систему. Для этого достаточно на таблице (рис. 4.1) щелкнуть правой кнопкой, далее Analysis Options (Анализируемые функции) и на раскрывшемся меню выбрать нужное для тестирования распределение, например, равномерное (Uniform) и сразу ОК (рис. 4.2). И хотя теоретическое число попаданий в каждый интервал осталось прежним (13), но согласия с равномерным распределением в ближайшее столетие не ожидается (P-Value = 8,42769E-8).
Goodness-of-Fit Tests for Col_1
Chi-Square Test
----------------------------------------------------------------------------
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
----------------------------------------------------------------------------
at or below 230,5 5 13,00 4,92
230,5 245,0 2 13,00 9,31
245,0 259,5 5 13,00 4,92
259,5 274,0 23 13,00 7,69
274,0 288,5 17 13,00 1,23
288,5 303,0 26 13,00 13,00
303,0 317,5 14 13,00 0,08
above 317,5 12 13,00 0,08
----------------------------------------------------------------------------
Chi-Square = 41,2308 with 5 d.f. P-Value = 8,42769E-8
Рис. 4.2. Проверка согласия опытного распределения с равномерным
по χ2 -критерию Пирсона.
Наконец, если Вы владеете иными критериями проверки согласия, то их также можно включить в итоговую таблицу для чего достаточно на таблице (рис. 4.1) щелкнуть правой кнопкой, далее Pane Options (Окно опций) и на раскрывшемся меню выбрать нужные критерии проверки.