- •I. Теоретическая часть
- •II. Расчетно-графическая часть
- •1. Построение вариационного ряда
- •3. Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения): а) определение мер положения:
- •4. Графическое изображение вариационных рядов
- •5. Изучение формы кривой распределения
- •6. Проверка статистических гипотез
- •8. Определение объема выборки
- •III. Порядок выполнения расчетно-графической Работы
- •1.Построение вариационного ряда (Xmin - … - Xmax)
- •2. Группировка вариационного ряда
- •3. Определение мер положения, рассеивания и параметров формы кривой распределения:
- •4. Изучение формы распределения
- •5. Графическое представление сгруппированных рядов данных натурных наблюдений
- •6. Проверка статистических гипотез:
- •7. Построение доверительных интервалов
- •8. Определение объема выборки
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
6. Проверка статистических гипотез
Статистические критерии можно разделить на следующие группы: критерии однородности и критерии согласия. С помощью критериев однородности исследователь пытается на основе отрывочных данных удлинить ряд данных натурных наблюдений. Экспериментатор проверяет на однородность несколько рядов натурных наблюдений с целью объединения их в один. Необходимость использования критериев однородности обусловлена: стремлением получить более совершенные расчетные параметры кривых распределения (с увеличением объема выборки расчетные статистические величины приобретают количественную стабильность, увеличивается существенность каждой характеристики, проявляются закономерности распределения случайных величин). Критериев однородности достаточно много. Наиболее распространенными в практических расчетах являются критерии Фишера и Стьюдента (параметрические критерии, в основе которых лежит предположение о принадлежности случайных величин к нормальному закону распределения), из непараметрических можно выделить критерий Вилкоксона (нет предположений о законах распределения сравниваемых выборок).
Критерии согласия позволяют подобрать к эмпирическому распределению конкретное теоретическое. Наиболее распространенным в практических расчетах является критерий Пирсона или 2.
Цель использования критериев заключается в определении закономерностей возникновения случайных величин, их свойств, которые определяют сущность прогнозов и играют важную роль в управлении природными явлениями.
Использование статистических критериев осуществляется следующим образом:
а) выдвигается нулевая гипотеза (Н0): при использовании критериев, например, однородности — исследуемые ряды однородны. Далее на основании выбранного критерия, пытаемся доказать или опровергнуть выдвинутое предположение (Н0).
б) используя зависимости статистического критерия, получаем расчетное значение критерия.
в) определение области допустимых значений, т.е. тот промежуток на числовой прямой, на котором подтверждается нулевая гипотеза. Область допустимых значений определяется следующим образом:
-
определяют уровень значимости , характеризующий вероятность ошибочного решения, в практических расчетах его принимают равным 0,05. При выбранном уровне значимости доверительная вероятность составляет 95%, что удовлетворяет требованиям практических расчетов;
-
число степеней свободы (данная величина различна в зависимости от используемого критерия, но в большинстве случаев зависит от объема выборки).
С помощью таблиц или расчетных формул при выбранном уровне значимости и числе степеней свободы рассчитывается критическое значение статистического критерия. Критическое значение характеризует границу между областью допустимых значений и критической областью. Попадание расчетного значения в область допустимых значений подтверждает нулевую гипотезу, исследуемые ряды объединяем в один ряд и проводим статистическую обработку (определяем расчетные параметры). При использовании критериев согласия, если расчетное значение статистического критерия попадает в область допустимых значений, утверждаем, что эмпирическое распределение согласуется с конкретным аналитическим законом распределения, и свойства данного закона распределения можно использовать при анализе данных натурных наблюдений.
7. Построение доверительных интервалов
Расчетные параметры статистических характеристик, определенные по выборке, являются смещенными и показывают лишь оценку параметров генеральной совокупности (их иначе называют выборочными параметрами). Из-за случайности выборок оценки параметров являются смещенными, отличающимися от параметров генеральной совокупности. Обозначим точность оценки через . Чем меньше значение точности оценки, тем ближе выборочный расчетный параметр приближается к своему генеральному значению. Нормальный закон распределения характеризуется двумя параметрами: М — математическое ожидание и — среднее квадратическое отклонение; тогда, говоря о точности определения расчетных характеристик, должно выполнятся условие: (М - Хср) < 1 и ( - ) < 2. Точность оценки фактически определяет длину доверительного интервала (отклонение от полученного выборочного значения в обе стороны на ). Необходимую точность можно получить с определенной вероятностью (надежностью), иначе доверительной вероятностью. Доверительная вероятность , точность оценки и объем выборки N связаны между собой. На этой связи строится определение оптимального объема выборки с заданной точностью оценки параметра.
Доверительный интервал для математического ожидания М нормального закона распределения определяется исходя из того, что случайная величина
((М - Хср)/)N
имеет распределение Стьюдента (t-распределение) с числом степеней свободы m = N - 1. Следовательно, на основании табличных значений Приложения 4 по заданному уровню значимости можно определить величину t; N - 1. Длина доверительного интервала определяется по следующей зависимости:
|
, |
(16) |
отсюда
|
. |
(17) |
Далее определим доверительный интервал для среднего квадратического отклонения . Отправной точкой является тот факт, что случайная величина имеющая нормальный закон распределения, при ((N - 1)2)/2 имеет распределение Пирсона (2-распределение) с числом степеней свободы m = N - 1. По таблицам распределения Пирсона (приложение 3) определяем по выбранному уровню значимости (или доверительной вероятности , = 1 - ) и числу степеней свободы два числа с1 и с2:
|
; . |
|
Запишем доверительный интервал для дисперсии:
|
. |
(18) |
Данное неравенство можно переписать в следующем виде:
|
. |
(19) |