![](/user_photo/2706_HbeT2.jpg)
- •Федеральное агентство по образованию
- •«Новосибирский государственный технический университет»
- •Отчёт по практической работе № 1
- •Провести разбиение выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
- •Т аблица для вычисления значения статистики x2 утки
- •Т аблица для вычисления значения статистики x2 температура
Т аблица для вычисления значения статистики x2 температура
|
|
|
|
|
|
|
|
|
|
|
||||
№ класса |
Границы интервала |
Наблюдаемая частота Bi |
Теоретическая частота Ei |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
||||
1 |
[26;28,4) |
|
|
4 |
|
|
1,865385 |
|
2,442704 |
|
||||
2 |
[28,4;30,8) |
|
3 |
|
|
5,072752 |
|
0,846937 |
|
|||||
3 |
[30,8;33,2) |
|
|
8 |
|
|
7,611655 |
|
0,019813 |
|
||||
4 |
[33,2;35,6) |
|
7 |
|
|
6,306944 |
|
0,076158 |
|
|||||
5 |
[35,6;38] |
|
|
3 |
|
|
2,88471 |
|
0,004608 |
|
||||
|
|
|
|
25 |
|
|
23,74145 |
|
3,390221 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
Построим кумулятивные линии значений X1 X2 X3 :
Таблица 6
|
|
Значения для кумулятивной линии |
|
|||||||
x1 |
|
4 |
|
7 |
|
12 |
|
20 |
|
25 |
x2 |
|
2 |
|
12 |
|
18 |
|
22 |
|
25 |
x3 |
|
4 |
|
7 |
|
15 |
|
22 |
|
25 |
Рис.1 Кумулятивная линия по пиву
Рис. 2 Кумулятивная линия по уткам
Рис.3Кумулятивная линия по температуре
Далее строим гистограммы эмпирической функции распределения:
Таблица 7
Значения для гистограммы и полигона часот |
||||
|
X1 |
X2 |
X3 |
|
B1/N |
0,16 |
0,08 |
0,16 |
|
B2/N |
0,12 |
0,4 |
0,12 |
|
B3/N |
0,2 |
0,24 |
0,32 |
|
B4/N |
0,32 |
0,16 |
0,28 |
|
B5/N |
0,2 |
0,12 |
0,12 |
|
|
|
|
|
|
B1/(N*h) |
0,009091 |
0,04 |
0,066667 |
|
B2/(N*h) |
0,006818 |
0,2 |
0,05 |
|
B3/(N*h) |
0,011364 |
0,12 |
0,133333 |
|
B4/(N*h) |
0,018182 |
0,08 |
0,116667 |
|
B5/(N*h) |
0,011364 |
0,06 |
0,05 |
|
|
|
|
|
|
|
|
|
|
|
|
х1 |
x2 |
x3 |
|
R1 |
17,6 |
3 |
28,4 |
|
R2 |
35,2 |
5 |
30,8 |
|
R3 |
52,8 |
7 |
33,2 |
|
R4 |
70,4 |
9 |
35,6 |
|
R5 |
88 |
11 |
38 |
|
Рис.4 Гистограмма выборки Х1
Рис.5 Гистограмма выборки Х2
Рис.6 Гистограмма выборки Х3
Сейчас необходимо построить полигон частот:
Рис.7 Полигон частот для выборки Х1
Рис.8 Полигон частот для выборки Х2
Рис.9 Полигон частот для выборки Х3
Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и эксцессов X2- Пирсона
Анализ показателей асимметрии и эксцесса.
Несмещённые оценки показателей ассиметрии и эксцесса находим по формулам:
Таблица 8
Несмещенные оценки |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
Асимметрии |
|
|
|
|
|
|
Эксцесса |
|
|
|
||||||||
G11 |
|
G12 |
|
G13 |
|
|
G21 |
G22 |
|
G23 |
||||||||
-0,2991376 |
|
0,437994 |
|
-0,48639 |
|
|
-0,91746 |
-0,31498 |
|
-0,45384 |
Для проверки гипотезы о нормальности распределения следует также вычислить среднеквадратические отклонения для показателей ассиметрии и эксцесса:
Таблица 9
Среднеквадратические отклонения |
|
||||||||||
Асимметрии |
|
|
|
Эксцесса |
|
||||||
S(G1) |
|
|
|
|
S(G2) |
||||||
0,463683501 |
|
|
|
|
0,901721 |
Проверим следующие условия:
,
Условия выполняются одновременно для каждого из показателей, следовательно, гипотеза о нормальности исследуемых распределений не отклоняется. Однако это не значит, что они достоверны. Для получения более точных результатов используем другой критерий.
Воспользуемся критерием
-Пирсона
для проверки той же гипотезы.
ε
= 0, 05 , число степеней свободы
=
5, 99
Значение статистики вычисляется по формуле:
=
где Вi- наблюдаемая абсолютная частота и Еi- ожидаемая частота, вычисляемая в предположении о нормальном распределении значений фактора x.
Ожидаемая частота попадания в i-ый интервал равна:
Ei
=
=
-
Ф
,
где Ф
- значение функции нормального
распределения, вычисленное в точке z.
Таблица 10
Х1
|
|
|
|
|
|
|
|
|
|
|
|
№ класса |
Границы интервала |
Наблюдаемая частота Bi |
Теоретическая частота Ei |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
[0;35,2) |
|
|
7 |
|
|
6,4745 |
|
0,042652 |
|
|
2 |
[35,2;52,8) |
|
|
5 |
|
|
6,548169 |
|
0,36603 |
|
|
3 |
[52,8;70,4) |
|
8 |
|
|
6,056104 |
|
0,623955 |
|
||
4 |
[70,4;88] |
|
|
5 |
|
|
3,562918 |
|
0,579639 |
|
|
|
|
|
|
25 |
|
|
22,64169 |
|
1,612275 |
|
|
|
|
|
|
|
|
|
|
|
|
|
χ 2 расч.= 1,612275
<
,
значит основная гипотеза не отвергается.
Таблица 11
Х 2
|
|
|
|
|
|
|
|
|
|
|
|
№ класса |
Границы интервала |
Наблюдаемая частота Bi |
Теоретическая частота Ei |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
[1;3) |
|
|
2 |
|
|
3,649675 |
|
0,745663 |
|
|
2 |
[3;5) |
|
|
10 |
|
|
6,99854 |
|
1,287234 |
|
|
3 |
[5;7) |
|
|
6 |
|
|
7,344187 |
|
0,246023 |
|
|
4 |
[7;11] |
|
|
7 |
|
|
5,542365 |
|
0,383356 |
|
|
|
|
|
|
25 |
|
|
23,53477 |
|
2,662276 |
|
|
|
|
|
|
|
|
|
|
|
|
|
χ 2 расч.= 2,662276
< , значит основная гипотеза не отвергается.
Таблица 12
Х3
|
|
|
|
|
|
|
|
|
|
|
|
№ класса |
Границы интервала |
Наблюдаемая частота Bi |
Теоретическая частота Ei |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
[26;28,4) |
|
|
4 |
|
|
1,865385 |
|
2,442704 |
|
|
2 |
[28,4;30,8) |
|
3 |
|
|
5,072752 |
|
0,846937 |
|
||
3 |
[30,8;33,2) |
|
|
8 |
|
|
7,611655 |
|
0,019813 |
|
|
4 |
[33,2;35,6) |
|
7 |
|
|
6,306944 |
|
0,076158 |
|
||
5 |
[35,6;38] |
|
|
3 |
|
|
2,88471 |
|
0,004608 |
|
|
|
|
|
|
25 |
|
|
23,74145 |
|
3,390221 |
|
|
|
|
|
|
|
|
|
|
|
|
|
χ 2 расч.= 3,390221
< , значит основная гипотеза не отвергается.
1. По имеющимся результатам наблюдений для каждого показателя определили основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициент асимметрии и эксцесса).
Среднее значение выпиваемого Робинзоном пива составляет 49,76%
от
объёма фляги. Разброс значений
характеристики
:
(X1)=804,92
он в 252 раза больше разброса значений
характеристики по уткам.
(X2)=3,19
и в 73 раза больше разброса значений
характеристики по температуре
(X3)=10,94.
Полученные результаты говорят о
наибольшей нестабильности первой
характеристики, так как она имеет
наибольшие разбросы. Так как коэффициент
асимметрии для Х1 положительный,
значит доля того, что объём выпитого
пива больше среднего, превышает долю
того, что объём выпитого пива меньше
среднего.
Среднее количество убиваемых Робинзоном уток составляет 5 штук в день. Коэффициент асимметрии положительный, значит, в большинстве случаев количество убитых уток было выше среднего. Кроме того, на количество убитых уток может температура.
Температура же в дни охоты в среднем составляла 32,20С. Этот показатель является сравнительно удобным и точным для прогнозирования.
2. Определили, присутствуют ли в выборке аномальные наблюдения. Указали их номер и значения.
3. Провели разбиение выборки на классы, построили кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
4. Сформулировали и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и χ2-Пирсона.
5. Для проверки гипотезы о нормальности распределения были использованы два критерия: коэффициентов асимметрии и эксцесса и χ2 – квадрат Пирсона. На основе расчетов первого критерия полученных, для всех 3-х характеристик был сделан вывод о том, что гипотезы не отвергаются. Второй показал что гипотезы о нормальности распределения X1 X2 отвергаются с вероятностью 95% а X3 отвергается с вероятностью 80%
Все возникающие противоречия можно объяснить, прежде всего, недостаточным количеством наблюдений выборки.