
- •Введение
- •Содержание
- •Описательная статистика
- •Определение распределения
- •Асимметричность, разброс, выбросы
- •Поиск основных выборочных числовых характеристик
- •Определение соответствия массивов распределениям
- •Оценивание параметров
- •Несмещенные точечные оценки соответствующего предположительного распределения
- •Поиск доверительных оценок параметров нормальных распределений и распределения Пуассона
- •Проверка статистических гипотез
- •Заключение
Определение соответствия массивов распределениям
Массив Z соответствует равномерному распределению.
Массив X соответствует нормальному распределению.
Массив Y соответствует нормальному распределению.
Массив D соответствует распределению Пуассона.
Оценивание параметров
В данном разделе представлена оценка рассчитанных параметров.
Несмещенные точечные оценки соответствующего предположительного распределения
Несмещенные точечные оценки случайной
величины Z, предположительно
имеющей равномерное распределение ––
максимум и минимум:
,
.
Несмещенные точечные оценки случайной
величины X, предположительно
имеющей нормальное распределение ––
математическое ожидание и среднее:
,
.
Несмещенные точечные оценки случайной
величины Y, предположительно
имеющей нормальное распределение ––
математическое ожидание и среднее:
,
.
Несмещенные точечные оценки случайной
величины D, предположительно
имеющей распределение Пуассона ––
выборочное среднее:
.
Поиск доверительных оценок параметров нормальных распределений и распределения Пуассона
При поиске доверительных оценок
параметров, следует найти доверительный
интервал
,
который с вероятностью
(по умолчанию) будет содержать в себе
истинное значение математического
ожидания
.
Точность оценки рассчитывается по формуле:
где –
объём выборки;
где
– коэффициент доверия, отыскивающийся
из отношения:
Таким образом, точность оценки значения математического ожидания для случайной величины X, имеющей нормальное распределение будет рассчитываться по формуле:
Следовательно, математическое ожидание с вероятностью 95% будет находиться в следующем доверительном интервале:
Точность оценки значения математического ожидания для случайной величины Y, имеющей нормальное распределение будет рассчитываться по формуле:
Следовательно, математическое ожидание с вероятностью 95% будет находиться в следующем доверительном интервале:
Точность оценки значения выборочной средней для случайной величины D, имеющей распределение Пуассона будет рассчитываться по формуле:
Следовательно, выборочная средняя
с вероятностью 95% будет находиться в
следующем доверительном интервале:
Проверка статистических гипотез
Для случайной величины Z, выдвинем две гипотезы:
H1 – Имеет равномерное распределение;
H2 – Имеет не равномерное распределение.
Заполним следующую таблицу:
Таблица 15
Интервалы |
|
|
|
|
|||||
1 |
1,53 |
1,265 |
37 |
46,805 |
59,20833 |
||||
1,53 |
2,06 |
1,795 |
31 |
55,645 |
99,88278 |
||||
2,06 |
2,59 |
2,325 |
33 |
76,725 |
178,3856 |
||||
2,59 |
3,12 |
2,855 |
39 |
111,345 |
317,89 |
||||
3,12 |
3,65 |
3,385 |
32 |
108,32 |
366,6632 |
||||
3,65 |
4,18 |
3,915 |
28 |
109,62 |
429,1623 |
Затем нужно вычислить следующие величины:
среднее:
;
стандартное отклонение:
;
объём выборки:
;
шаг гистограммы:
.
Теоретические частоты рассчитываются по формуле:
где
–функция Гаусса, рассчитывающаяся по
формуле:
где
,
рассчитывается по формуле:
Вычислим наблюдаемое значение критерия
,
которое определяется по формуле:
Заполним ещё одну таблицу:
Таблица 16
|
|
|
|
-1,41321 |
0,146971 |
33 |
0,484848485 |
-0,812 |
0,286904 |
33 |
0,121212121 |
-0,21078 |
0,390177 |
33 |
0 |
0,390428 |
0,369666 |
33 |
1,090909091 |
0,991641 |
0,243993 |
33 |
0,03030303 |
1,592853 |
0,112194 |
33 |
0,757575758 |
При этом сумма теоретических частот оказалась чуть меньше объёма выборки . Это объяснимо тем, что эмпирическая гистограмма конечна, а нормальная кривая – бесконечная, и небольшой "недобор" теоретических частот приходится на участки, лежащие слева и справа от гистограммы.
Найдём критическое значение
критерия согласия Пирсона по следующей
формуле:
где
– уровень значимости;
где
– количество степеней свободы,
определяющееся по формуле:
где
– количество интервалов;
где
– количество оцениваемых параметров
рассматриваемого закона распределения.
Для нахождения нужно обратиться к таблице критических значений распределения , в которой указаны степени свободы и уровни значимости. Данная таблица представлена на следующем рисунке:
Рисунок 5 –
Критические точки распределения
В текущем случае:
Далее необходимо сравнить и .
Поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу H1 о равномерном распределении случайной величины Z.
Аналогичную последовательность расчётов необходимо проделать и со случайной величиной X.
Таблица 17
Интервалы |
|
|
|
|
|
-4,04 |
-2,24003 |
-3,14002 |
3 |
-9,42005 |
29,57908 |
-2,24003 |
-0,44006 |
-1,34005 |
10 |
-13,4005 |
17,95721 |
-0,44006 |
1,35991 |
0,459925 |
19 |
8,738575 |
4,019089 |
1,35991 |
3,15988 |
2,259895 |
36 |
81,35622 |
183,8565 |
3,15988 |
4,95985 |
4,059865 |
59 |
239,532 |
972,4677 |
4,95985 |
6,75982 |
5,859835 |
35 |
205,0942 |
1201,818 |
6,75982 |
8,55979 |
7,659805 |
27 |
206,8147 |
1584,161 |
8,55979 |
10,35976 |
9,459775 |
7 |
66,21843 |
626,4114 |
10,35976 |
12,15973 |
11,25975 |
3 |
33,77924 |
380,3456 |
12,15973 |
13,9597 |
13,05972 |
0 |
0 |
0 |
13,9597 |
15,75967 |
14,85969 |
1 |
14,85969 |
220,8102 |
Вычисляем следующие величины:
среднее:
;
стандартное отклонение:
;
объём выборки: ;
шаг гистограммы:
.
Заполним ещё одну таблицу:
Таблица 18
|
|
|
|
-2,43879 |
0,020388 |
2,485441 |
0,106529 |
-1,82927 |
0,074867 |
9,126599 |
0,083583 |
-1,21974 |
0,189603 |
23,11349 |
0,732074 |
-0,61022 |
0,331171 |
40,37131 |
0,473315 |
-0,00069 |
0,398942 |
48,633 |
2,209911 |
0,60883 |
0,331451 |
40,40548 |
0,723149 |
1,218355 |
0,189924 |
23,15263 |
0,639335 |
1,827879 |
0,075057 |
9,149792 |
0,505105 |
2,437404 |
0,020457 |
2,493866 |
0,102721 |
3,046928 |
0,003846 |
0,468798 |
0,468798 |
3,656453 |
0,000499 |
0,060778 |
14,51399 |
Как можно заметить
,
это означает, что гипотеза не принимается.
Но в данном случае, результат искажает
выброс в интервале
.
Он содержит всего лишь одно, не характерное
для выборки значение. К тому же, интервал
,
не содержит никаких значений. Исходя
из этого, следует убрать искажающие
статистику данные.
В этом случае:
Поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу H1 о нормальном распределении случайной величины X.
Аналогичную последовательность расчётов необходимо проделать и со случайной величиной Y.
Таблица 19
Интервалы |
|
|
|
|
|||||
-4,04 |
-2,34 |
-3,19 |
3 |
-9,57 |
30,5283 |
||||
-2,34 |
-0,64 |
-1,49 |
10 |
-14,9 |
22,201 |
||||
-0,64 |
1,06 |
0,21 |
19 |
3,99 |
0,8379 |
||||
1,06 |
2,76 |
1,91 |
36 |
68,76 |
131,3316 |
||||
2,76 |
4,46 |
3,61 |
59 |
212,99 |
768,8939 |
||||
4,46 |
6,16 |
5,31 |
35 |
185,85 |
986,8635 |
||||
6,16 |
7,86 |
7,01 |
27 |
189,27 |
1326,783 |
||||
7,86 |
9,56 |
8,71 |
7 |
60,97 |
531,0487 |
||||
9,56 |
11,26 |
10,41 |
3 |
31,23 |
325,1043 |
||||
11,26 |
12,96 |
12,11 |
0 |
0 |
0 |
||||
12,96 |
14,66 |
13,81 |
1 |
13,81 |
190,7161 |
Вычисляем следующие величины:
среднее:
;
стандартное отклонение:
;
объём выборки: ;
шаг гистограммы:
.
Вновь заполним таблицу:
Таблица 20
|
|
|
|
-2,5327 |
0,016144 |
1,887541 |
0,65565 |
-1,94809 |
0,059817 |
6,993876 |
1,292099 |
-1,36348 |
0,157476 |
18,41243 |
0,018751 |
-0,77887 |
0,294564 |
34,44099 |
0,07057 |
-0,19426 |
0,391485 |
45,77326 |
3,82203 |
0,390348 |
0,369678 |
43,22346 |
1,56455 |
0,974958 |
0,248029 |
29,00005 |
0,137938 |
1,559568 |
0,118237 |
13,8245 |
3,368934 |
2,144178 |
0,040047 |
4,682436 |
0,604512 |
2,728789 |
0,009638 |
1,126849 |
1,126849 |
3,313399 |
0,001648 |
0,192678 |
3,382697 |
Ситуация аналогична прошлой:
.
Это означает, что гипотеза не принимается.
В данном случае, результат искажает
выброс в интервале
.
Он содержит всего лишь одно, не характерное
для выборки значение. Интервал
,
не содержит никаких значений. Исходя
из этого, следует убрать искажающие
статистику данные.
В этом случае:
Поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу о нормальном распределении случайной величины Y.
Похожую последовательность расчётов необходимо проделать и со случайной величиной D.
среднее:
;
стандартное отклонение:
;
объём выборки: .
Вновь заполним таблицу:
Таблица 21
|
|
|
|
|
|
6 |
2 |
12 |
0,008378 |
1,675653 |
0,062782 |
7 |
4 |
28 |
0,016834 |
3,366865 |
0,11906 |
8 |
3 |
24 |
0,029597 |
5,91937 |
1,439802 |
9 |
12 |
108 |
0,046253 |
9,25066 |
0,817117 |
10 |
11 |
110 |
0,065055 |
13,01105 |
0,310838 |
11 |
12 |
132 |
0,083182 |
16,63641 |
1,292121 |
12 |
26 |
312 |
0,097496 |
19,49925 |
2,167247 |
13 |
19 |
247 |
0,105483 |
21,09669 |
0,208379 |
14 |
22 |
308 |
0,105973 |
21,19464 |
0,030602 |
15 |
22 |
330 |
0,099368 |
19,87351 |
0,227537 |
16 |
16 |
256 |
0,08735 |
17,47006 |
0,123701 |
17 |
14 |
238 |
0,07227 |
14,4539 |
0,014254 |
18 |
12 |
216 |
0,056471 |
11,29412 |
0,044118 |
19 |
13 |
247 |
0,041803 |
8,36062 |
2,574432 |
20 |
8 |
160 |
0,029398 |
5,879606 |
0,764689 |
21 |
1 |
21 |
0,01969 |
3,937936 |
2,191876 |
22 |
2 |
44 |
0,012588 |
2,517594 |
0,106413 |
23 |
1 |
23 |
0,007698 |
1,539564 |
0,189098 |
Поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу H1 о распределении Пуассона для случайной величины D.
ВЫВОДЫ
Ни одна гипотеза, относительно распределения не была отвергнута, что говорит о её верности, но верность гипотезы не может утверждаться до конца, так как существует 5% вероятность того, что была совершена ошибка 2-го рода, то есть гипотеза могла быть принятой, но на самом деле она будет неправильной.