- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
3.2. Проверка гипотезы о законе распределения
Пусть дана выборка независимых случайных чисел x1,x2, ... ,xn имеющих эмпирическое (экспериментальное, производственное) распределение Fn(x) . Для проверки согласия распределения Fn(x) с теоретическим распределением F(x) используются: критерий Пирсона, l-критерий Колмогорова и nw2-критерий Мизеса-Смирнова. Предварительная оценка вида распределения может быть сделана сравнением эмпирического распределения с теоретическими распределениями.
Рассмотим использование критерия Пирсона или как его иначе называют, критерий c2(хи-квадрат) для проверки гипотезы о соответствии экспериментального распределения случайной величины нормальному закону.
Использование
критерия Пирсона для оценки согласованности
изучаемого распределения с нормальным
основано на сравнении эмпирических
и теоретических (вычисленных в
предположении нормального распределения)
частот.
Вначале находим середины частичных интервалов
.
Варианте
соответствуют
частоты
,
т.е. число
наблюдений,
которые попали в i-й
интервал. В итоге получаем последовательность
равноотстоящих вариант и соответствующим
им частот в виде табл.1.7.
Таблица
|
|
… |
|
|
|
… |
|
Далее вычисляем среднее значение и оценку среднеквадратического отклонения s и нормируем границы интервалов по формулам
,
.
Теоретические вероятности Pi попадания x в интервал (Xi, Xi+1) вычисляем с помощью функции Лапласа Ф(Z) по равенству
Искомые теоретические частоты нормального распределения
Использование критерия Пирсона основано на сравнении эмпирических (наблюдаемых) - и теоретических (вычисленных в предположении нормального распределения) mi.частот. Обычно . и mi. различны.
xi |
x1 |
x2 |
… |
xk |
|
|
|
… |
|
Для проверки гипотезы о соответствии экспериментального закона распределения случайной величины нормальному при уровне значимости q требуется проверить нулевую гипотезу: генеральная совокупность, из которой взята выборка x1,x2, ... ,xn распределена нормально.
В качестве критерия проверни нулевой гипотезы принимается случайная величина
или
где К - число интервалов.
Эта величина случайная, так как в различных опытах она принимает различные, заранее неизвестные значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше значениё критерия, и, следовательно, он в известной мере характеризует близость эмпирического и теоретического распределений. Возведением в квадрат разностей частот устраняется возможность взаимного погашения положительных .и отрицательных разностей.
Если
расчетное (наблюдаемое) значение критерия
оказалось меньше критического
,
которое находят по таблице , приведенным
в приложении , для соответствующего
уровня значимости a
и числа степеней свободы k
, т.е. если
то нет оснований
отвергнуть нулевую гипотезу о нормальности
распределения. В противном случае (при
)
нулевая гипотеза отвергается.
Проверка с помощью критерия Колмогорова осуществляется следующим образом. Выборочная последовательность {xi} упорядочивается в неубывающую последовательность {xk} . Вычисляется абсолютное значение максимального расхождения Dn между производственными и теоретическими распределениями:
По полученному значению Dn рассчитывается величина l=n1/2 Dn. Критические значения для l приведены в таблице , приложения .
Для проверки согласия с помощью критерия Мизеса-Смирнова (nw2-критерий), рассчитывается величина:
Заключение о существенном расхождении между производственными и теоретическими распределениями делается с доверительной вероятностью 95%, если nw2 ³0,4614. Критические значения для nw2-критерия при других значениях доверительной вероятности 1-a приведены в таблице 3.2.1.
nw2-критерий Мизеса-Смирнова
Таблица 3.2.1.
-
1-a
0.5
0.4
0.3
0.2
0.1
nw2кр
0.1184
0.1467
0.1843
0.2412
0.3473
1-a
0.05
0.03
0.02
0.01
0.001
nw2кр
0.461
0.5489
0.6198
0.7435
1.1679
Объем выборки для проверки гипотез о законе распределения с помощью c2-критерия Пирсона и l-критерия Колмогорова должен быть не менее 100. При выборках меньших объемов более чувствительный nw2-критерий. Для более уверенного заключения о законе распределения исследуемой величины целесообразно пользоваться всеми критериями.
