Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат-стат-а.doc
Скачиваний:
4
Добавлен:
25.11.2019
Размер:
747.52 Кб
Скачать

§2. Оценки параметров распределения

Определение 2.1. Точечной статистической оценкой генеральной числовой характеристики называется её приближённое значение , найденное на основе выборки.

Примеры.

1)  , .

2)  , .

3) Оценкой генерального начального момента является выборочный начальный момент .

4) Оценкой генерального центрального момента является выборочный центральный момент . Число k называется порядком момента.

Зафиксируем объём выборки n. Каждое извлечение выборки можно рассматривать как эксперимент, исход эксперимента – получение элементами выборки тех или иных конкретных значений. Поэтому является случайной величиной.

Существует много методов получения оценок, которые дают качественно различные результаты. Рассмотрим метод моментов К. Пирсона (1857–1936).

Предполагается, что имеется выборка из исследуемой генеральной совокупности. На ее основе вычисляются m начальных выборочных моментов . Так как вид генерального закона известен, то можно найти m первых начальных генеральных моментов , , , которые выражаются через неизвестные параметры. Выборочные и генеральные моменты одинакового порядка приравниваются:

(2.1)

Решение этой системы дает оценки неизвестных параметров ( ).

Для показательного закона с плотностью

известно . Так как , то система (2.1) в этом случае сводится к одному уравнению , из которого находим

. (2.2)

Для нормального закона с плотностью вероятности

известно, что ; . Тогда, беря 1-й начальный и 2-й центральный моменты, получаем

, (2.3)

где .

Для равномерного закона с плотностью вероятности

имеем: и . Из (2.1) получаем систему: Решив эту систему, находим:

. (2.4)

§3. Проверка статических гипотез.

Определение 3.1. Статистическая гипотеза – это предположение о виде или свойствах генерального распределения или выборки, которое можно проверить статистическими методами на основе имеющейся выборки.

Сначала выдвигается гипотеза о виде закона распределения, который может быть нормальным, показательным, равномерным и т. д. В данном случае гипотеза выдвигается на основе анализа гистограммы. Для этого верхняя граница гистограммы визуально сравнивается с графиками плотностей вероятности известных распределений.

После того, как выбран вид распределения, возникает задача оценивания его параметров, а затем проверки закона в целом.

Критериев (правил) проверки существует много. Мы рассмотрим наиболее часто используемый в практике критерий χ2 (хи-квадрат), введённый английским статистиком К. Пирсоном (1900 г.). Выборка предполагается большой.

Описание критерия χ2.

1. Выдвигаем гипотезу H0 о том, что генеральной функцией распределения является функция F(x).

2. Разбиваем генеральную совокупность, т. е. множество значений изучаемой случайной величины X на k непересекающихся промежутков . В качестве этих промежутков можно взять ранее построенные промежутки группированного статистического ряда.

П

Рис 3.1.

усть , . В случае, когда генеральная совокупность занимает всю положительную полуось , последний промежуток будет полубесконечным: (рис. 3.1).

3. Предполагаем, что параметры гипотетической функции F(x) распределения оценены

по выборке. Тогда мы имеем оценку этой функции. С её помощью находим оценки вероятностей попадания случайной величины X в промежутки по формуле:

.

Отметим, что . Будем предполагать, что все ( ).

4. Пусть далее – частота попадания элементов выборки в промежуток ( ). Частоты берём также из группированного статистического ряда. Находим относительные частоты . При справедливости гипотезы H0 относительные частоты и оценки вероятностей ( ) должны быть близкими. За меру отклонения выборочного и гипотетического распределений с функцией F(x) выбирается величина, обозначаемая :

. (3.1)

Величина – случайная, так как случайными являются частоты . Величина, зависящая от элементов выборки, называется статистикой. Р. Фишером доказано, что статистика распределена асимптотически (т. е. при ) по закону с степенями свободы, где

. (3.2)

Здесь – число оценённых параметров гипотетической функции F(x).

Закон табулирован (см. таблицу в конце файла).

По формуле (3.1) вычисляем число , соответствующее данной выборке. Если гипотеза H0 верна, число должно быть малым.

5

Рис. 3.2

. Выбираем доверительную вероятность , соответствующую нашим представлениям о допустимости величины . В практике и т. д. Хотя должно быть малым, однако вследствие случайных колебаний частот может довольно значительно отличаться от нуля, даже, если гипотеза H0 верна. По таблице для закона находим пороговое число – границу, которая разделяет область допустимых значений и недопустимых (критическую область), рис. 3.2, .

Если , то гипотеза H0 принимается; в случае – отвергается. Величина называется уровнем значимости.

Подведем итог о порядке действий по проверке гипотезы H0.

1. Выдвигается гипотеза H0.

2. По формуле (2) вычисляется выборочное значение статистики хи-квадрат.

3. Выбирается доверительная вероятность (или уровень значимости ) и по таблице вычисляется пороговая квантиль .

4. Сравниваются и . Если , гипотеза H0 принимается; если – отвергается. Случай принятия гипотезы обычно формулируется более осторожно: гипотеза H0 не противоречит экспериментальным данным, и на данном этапе проверки нет оснований ее отвергать.

Замечание 3.1. Любой закон, применяемый для описания и прогнозирования реального явления, является лишь приближённой моделью этого явления. С этих позиций проверка гипотезы о законе распределения может трактоваться как проверка модели, которая «подогнана» под изучаемое явление. Тогда критерий хи-квадрат дает лишь меру соответствия модели и явления. Этой мерой является доверительная вероятность.

Пример 3.1. Дан группированный статистический ряд, включающий наблюдений времени обслуживания клиента в системе массового обслуживания в минутах.

Номер промежутка

1

2

3

4

5

6

7

8

Промежутки

0–6

6–12

12–18

18–24

24–30

30–36

36–42

42–48

Частоты

48

17

13

11

5

3

2

1

100

Построить гистограмму. На основе анализа гистограммы выдвинуть гипотезу о виде закона распределения, за параметры которого принять их точечные оценки. Проверить достоверность выдвинутой гипотезы, используя критерий Пирсона.

► Строим гистограмму частот (рис. 3.3).

Рис. 3.3

Сравнив верхнюю границу гистограмму с графиками плотности вероятности в нормальном, показательном и равномерном законах (рис. 3.4–3.6), выдвигаем гипотезу: данные наблюдения распределены по показательному закону.

Рис. 3.4. График плотности вероятности в нормальном законе

Рис. 3.5. График плотности вероятности в показательном законе

Рис. 3.6. График плотности вероятности в равномерном законе

Вычислим выборочные числовые характеристики и оценку параметра показательного закона распределения:

;

;

;

.

Таким образом, мы выдвигаем следующую гипотезу H0: выборочные данные распределены по показательному закону с плотностью вероятности и функцией распределения:

(3.3)

Проверим эту гипотезу с помощью критерия хи-квадрат, следуя общему правилу проверки.

1. Задаёмся доверительной вероятностью (надежностью) .

2. Вычисляем выборочное значение статистики критерия по формуле . Здесь (см. (3.3)), – границы промежутков ( ). Последний промежуток – полубесконечный. Для удобства вычислений составляем таблицу. Если ожидаемая частота , то соседние интервалы следует объединить (при этом вместо рассматриваемых 8 интервалов получится r интервалов). Два последних столбца и последнюю строку таблицы заполнить в соответствии с вновь составленными интервалами.

*

0

1

2

3

4

5

6

7

8

48

17

13

11

5

3

2

1

0

6

12

18

24

30

36

42

0

6

12

18

24

30

36

42

1

0.572

0.328

0.187

0.107

0.061

0.035

0.020

0

0.428

0.244

0.141

0.080

0.046

0.026

0.015

0.020

42.8

24.4

14.1

8.0

4.6

2.6

1.5

2.0

42.8

24.4

14.1

8.0

10.7

0.63

2.24

0.09

1.13

0.03

0.01

100

1.000

100.0

4.13

Из таблицы получаем = 4.13.

3. По таблице распределения (в конце файла), где – число степеней свободы, находим квантиль .

4. Сравнивая и , устанавливаем, что < , поэтому заключаем, что гипотеза H0 не противоречит экспериментальным данным, и на данном этапе проверки нет оснований ее отвергать.

7