- •1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
- •1.1. Законы распределения дискретных случайных величин
- •1.2. Числовые характеристики дискретных случайных величин, их свойства
- •1.3. Законы распределения непрерывных случайных величин
- •1.4. Числовые характеристики непрерывных случайных величин
- •1.5. Выборочные аналоги интегральной и дифференциальной функций распределения
- •1.6. Лабораторная работа № 1. Методы описательной статистики в пакете STATGRAPHICS
- •1.7. Нормальное распределение и его числовые характеристики
- •2. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ
- •2.1. -распределение
- •2.5. Гамма–распределение
- •2.7. Лабораторная работа № 2. Семейства вероятностных распределений в математических пакетах STATGRAPHICS и MAHTCAD
- •3. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ (МЕТОД МОНТЕ-КАРЛО)
- •3.1. Общие принципы метода статистических испытаний
- •3.2. Датчики базовой случайной величины (БСВ)
- •3.3. Моделирование на ЭВМ стандартной равномерно распределенной случайной величины (базовой случайной величины)
- •3.5. Моделирование непрерывных случайных величин
- •3.6. Лабораторная работа № 3. Моделирование некоторых распределений с помощью базовых случайных величин в пакете MATHCAD
- •4. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ И ИХ СВОЙСТВА
- •4.1. Статистические характеристики вариационных рядов и показатели их качества
- •4.3. Точечные оценки вероятности по частоте, математического ожидания и дисперсии
- •4.5. Методы получения точечных оценок
- •4.6. Сущность интервального оценивания
- •4.7. Приближенные и точные доверительные интервалы для параметров распределений
- •4.8. Лабораторная работа № 4. Оценивание параметров вероятностных распределений в пакетах STATGRAPHICS и MATHCAD
- •5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ СОГЛАСИЯ
- •5.1. Понятие статистической гипотезы. Основные этапы проверки гипотез
- •5.2. Критерий Неймана – Пирсона
- •5.3. Проверка гипотез о числовых значениях параметров нормального распределения
- •5.4. Проверка гипотез о параметрах двух нормальных распределений
- •5.5. Лабораторная работа № 5. Проверка статистических гипотез о числовых значениях нормальных распределений в математических пакетах STATGRAPHICS и MATHCAD
- •5.6. Критерии согласия
- •Решение
- •5.7. Лабораторная работа № 6. Критерии согласия в статистическом пакете STATGRAPHICS
- •5.8. Лабораторная работа №7. Критерии согласия в математическом пакете MATHCAD
- •6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
- •6.1. Постановка задачи
- •6.2. Дисперсионный анализ
- •Решение
- •6.3. Ранговый однофакторный анализ
- •6.4. Критерий Краскела - Уоллиса (Н-критерий)
- •Решение
- •6.5. Лабораторная работа № 8. Однофакторный ранговый и дисперсионный анализ в статистическом пакете STATGRAPHICS
- •7. РЕГРЕССИОННЫЙ АНАЛИЗ
- •7.1. Модели регрессии
- •7.4. Проверка адекватности линейной регрессии
- •7.5. Выбор наилучшей регрессии
- •8. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ
- •8.2. Критерий знаков
- •8.3. Критерий знаков для одномерной выборки
- •8.4. Ранговый критерий (одновыборочный критерий Вилкоксона)
- •8.5. Двухвыборочный ранговый критерий Вилкоксона
Таблицы F - распределения с квантилями для малых вероятноей очень редки, поэтому квантили Fтеор(1) . и Fтеор(2) . были вычислены в пакете
MATHCAD. |
F (1) |
= 0.025 , |
F |
(2) |
= 5.715 . |
|
|
Поскольку |
||||||
|
теор. |
|
теор. |
(1) |
|
|
|
|
|
|
|
(2) |
|
|
|
|
|
|
F |
|
|
< F |
|
< F |
, т.е. |
||||
|
|
|
|
теор. |
|
|
выб. |
теор. |
|
|||||
|
|
|
|
Fвыб. W \ ω , |
то гипотеза |
|||||||||
|
|
|
|
H0 о |
равенстве |
средних в |
||||||||
|
ω |
|
|
исходной |
общей |
выборке, |
||||||||
|
|
|
|
состоящей |
из |
трех |
разных |
|||||||
|
|
|
|
подвыборок, |
принимается |
|||||||||
|
|
|
|
(рис. 6.1). Несмещенными |
||||||||||
|
|
|
|
оценками среднего и дис- |
||||||||||
F (1) |
W \ ω |
F (2) |
|
персии здесь будут величи- |
||||||||||
|
|
|
|
|
|
|
|
3 n j |
|
|
||||
теор. |
|
теор. |
|
|
|
|
|
|
1 |
|
∑∑xij |
|
|
|
|
|
ны |
|
x |
= |
|
= 8.417 и |
|||||||
Рис. 6.1. Критическая область статистики |
|
|
n |
|||||||||||
|
|
|
|
|
|
j =1i=1 |
|
|
||||||
для гипотезы о равенстве средних |
|
s22 = Q2 |
(n − k) = 13.541. |
|||||||||||
|
|
|
|
|||||||||||
6.3.Ранговый однофакторный анализ
Впоследние годы очень сильно были развиты методы математической статистики, для которых не требуются никакие предположения о распределении, за исключением предположения о том, что это распределение непрерывно. Эти методы называются непараметрическими или свободными от распределения.
Если мы ничего не знаем о распределении наблюдений, то непосредственно использовать для проверки нулевой гипотезы количественные
значения наблюдений xij становится затруднительно. В этом случае про-
ще всего опираться в своих выводах только на отношение «больше - меньше» между наблюдениями, так как они не зависят от распределения наблюдений.
В этом случае вся полезная информация содержится в рангах. Получим из исходной выборки вариационный ряд, т.е. расположим выборочные значения в порядке возрастания. Каждой величине из этого ряда сопоставим ее ранг, равный порядковому номеру величины в общем вариационном ряду. Заметим, что если наблюдения однородны, т.е. вся выборка взята из одной и той же генеральной совокупности, то любое распределение рангов равновероятно, а общее число способов группировки рангов,
168
например, при двух подвыборках объемов n и m равно числу способов, которыми можно извлечь m предметов из N = n + m , т.е. Cnm+m .
Соответствующие критерии для проверки нулевой гипотезы называются ранговыми, они пригодны для любых непрерывных распределений наблюдений. Более того, они годятся и тогда, когда измерения xij сдела-
ны в порядковой шкале, например, являются тестовыми баллами или экспертными оценками.
Основные формулы рангового однофакторного анализа выведены в предположении, что среди чисел xij нет совпадений. При наличие совпа-
дений используются средние ранги, при этом теоретическая схема действует как приближенная, и надежность ее выводов снижается. Для учета совпадений вводятся специальные поправки.
Припишем каждому наблюдению xij в общем вариационном ряду его ранг rij . Тогда табл. 5 преобразуется в табл. 6.
|
|
|
|
|
|
Т а б л и ц а 6 |
|
|
|
|
|
|
|
|
|
Обработки |
1 |
3 |
|
|
… |
|
k |
(соответствуют |
|
|
|
||||
уровням факторов) |
|
|
|
|
|
|
|
|
r11 |
r12 |
|
… |
|
r1k |
|
Ранги результатов |
r21 |
r22 |
|
… |
|
r2k |
|
наблюдений |
… |
… |
|
|
… |
|
… |
|
rn 1 |
rn |
2 |
2 |
… |
|
rn k |
|
1 |
|
|
|
|
k |
|
Общая методика проверки статистических гипотез рекомендует сконструировать некоторую статистику, т.е. функцию от рангов rij , которая
легла бы в основу критерия проверки гипотезы. Основное требование к этой статистике следующее: ее распределение при гипотезе H0 должно
заметно отличаться от ее распределения при альтернативах. Например, часто в качестве статистики берут сумму рангов одной подвыборки. Рациональность такой процедуры состоит в том, что если одно распределение (одной подвыборки) смещено относительно другого, то это должно проявиться в том, что маленькие ранги должны в основном соответствовать одной подвыборке, а большие – другой, вследствие чего соответствующие суммы рангов должны быть маленькими или большими в зависимости от того, какая альтернатива имеет место.
169
