Пункт 8
Hайдем интервальные оценки параметров нормального закона распределения. Для нахождения доверительного интервала, покрывающего математическое ожидание СВ Х, найдем по таблицам квантилей распределения Стьюдента по заданной доверительной вероятности
1 - = = 0,95
и числу степеней свободы = n – 1= 100-1 = 99
число = 1,984.
Вычислим предельную погрешность интервального оценивания:
= = 1,984= 3,561.
Запишем искомый доверительный интервал для математического ожидания а:
х - < а < х + ,
50,57 – 3,561< а < 50,57 + 3,561,
47,009 < а < 54,131.
Если будет произведено достаточно большое число выборок объема n CB X (измерение высоты у 100 сосен) из одной и той же генеральной совокупности, то в 95% выборок доверительный интервал (47,01;54,13) покроет математическое ожидание а; и только в 5% выборок математическое ожидание может выйти за границы доверительного интервала.
Для нахождения доверительного интервала, покрывающего неизвестное среднее квадратическое отклонение с заданной вероятностью 1 - = = 0,95, найдем по = 0,95 и числу степеней свободы 1 =0,878 и 2 = 1,161
Искомый доверительный интервал равен:
1 * Sx < < 2*Sx,
0,878*17,95 < < 1,161*17,95,
15,760 < < 20,840.
Если будет произведено достаточно большое число выборок объема n CB X из одной и той же генеральной совокупности, то в 95% выборок доверительный интервал (15,76;20,84) покроет среднее квадратическое отклонение , и только в 5% среднее квадратическое отклонение может выйти за границы доверительного интервала (15,76;20,84).
Пункт 9
Проведем корреляционный анализ выборочных данных случайных величин Х и У.
а) составим корреляционную таблицу. Как известно, для СВ Х выбраны следующие интервалы:
( 10,1; 19,9], (19,9; 29,7], (29,7; 39,5], (39,5; 49,3], (49,3; 59,1], (59,1;68,9], (68,9; 78,7], (78,7;88,5], (88,5;98,3].
для СВ У:
(11,5; 14,5], (14,5; 17,5], (17,5; 20,5], (20,5; 23,5], (23,5; 26,5], (26,5;29,5], (29,5; 32,5], (32,5;35,5], (35,5;38,5].
Подсчитываем количество пар исходной выборки (хi ; уi), попадающих в прямоугольники, образованные границами интервалов (Таблица 8). Для этого принадлежность пары (хi ; уi) к определенному прямоугольнику отмечаем внутри этого прямоугольника точкой.
Таблица 8
Таблица для частот nxy пар значений (хi ; уi)
Интервалы для У |
Интервалы для Х |
||||||||
(10,1;19,9] |
(19,9;29,7] |
(29,7;39,5] |
(39,5;49,3] |
(49,3;59,1] |
(59,1;68,9] |
(68,9;78,7] |
(78,7;88,5] |
(88,5;98,3 |
|
(11,5; 14,5] |
|
|
|
|
|
|
|
|
|
(14,5; 17,5] |
|
|
|
|
|
|
|
|
|
(17,5; 20,5] |
|
|
|
|
|
|
|
|
|
(20,5; 23,5] |
|
|
|
|
|
|
|
|
|
(23,5; 26,5] |
|
|
|
|
|
|
|
|
|
(26,5;29,5] |
|
|
|
|
|
|
|
|
|
(29,5; 32,5] |
|
|
|
|
|
|
|
|
|
(32,5;35,5] |
|
|
|
|
|
|
|
|
|
(35,5;38,5] |
|
|
|
|
|
|
|
|
|
В окончательной корреляционной таблице вместо интервалов для СВ Х и СВ У записываем середины интервалов и соответствующие частоты nx и ny.
Таблица 9
Корреляционная таблица эмпирического распределения двумерной СВ(Х;У)
У\Х |
15 |
24.8 |
34.6 |
44.4 |
54.2 |
64 |
73.8 |
83.6 |
93.4 |
ny |
13 |
1 |
1 |
|
|
|
|
|
|
|
2 |
16 |
2 |
3 |
1 |
|
|
|
|
|
|
6 |
19 |
1 |
5 |
4 |
6 |
2 |
|
|
|
|
18 |
22 |
|
1 |
9 |
8 |
1 |
|
|
|
|
19 |
25 |
|
|
1 |
6 |
6 |
7 |
|
|
|
20 |
28 |
|
|
|
1 |
6 |
6 |
7 |
|
|
20 |
31 |
|
|
|
|
1 |
3 |
4 |
3 |
|
11 |
34 |
|
|
|
|
|
1 |
1 |
1 |
|
3 |
37 |
|
|
|
|
|
|
|
|
1 |
1 |
nx |
4 |
10 |
15 |
21 |
16 |
18 |
12 |
4 |
1 |
n=100 |
б) Зная, что х=50,57, у=24,31, Sx = 17,95, Sу = 5, вычисляем сначала выборочный корреляционный момент:
,
где m – число заполненных клеток.
(13*15+15*16*2+15*19+24,8*13+24,8*3*16+24,8*19*5+24,8*22+34,6*16+34,6*4*19+34,6*9*22+34,6*25+44,4*6*19+44,4*8*22+44,4*6*25+44,4*28+54,2*2*19+54,2*22+54,2*5*25+54,2*7*28+54,2*31+64*7*25+64*6*28+64*3*31+64*34+73,8*7*28+73,8*4*31+73,8*34+83,6*3*31+83,6*34+93,4*37)-(24,31*50,57)=1296,612-1229,3567=67,2553
Выборочный коэффициент корреляции:
,
.
Положительный знак выборочного коэффициента корреляции показывает, что с увеличением значений CВ Х (высоты дерева) эмпирические значения CВ У (диаметра) в среднем увеличиваются.
в)Проверим значимость полученного выборочного коэффициента корреляции, т. е. проверим нулевую гипотезу о том, что коэффициент корреляции равен нулю (Н0 : = 0) при альтернативной гипотезе На : = 0.
Вычислим статистику:
tнабл =
Принятие гипотезы На при уровне значимости = 0,05 означает,что выборочный коэффициент корреляции отличается от нуля с ошибкой 5%.
Найдем по таблицам квантилей распределения Стюдента по наиболее употребляемому уровню значимости = 0,05 и числу степеней свободы = n – 2 квантиль t(1 – a; n – 2) = t(0,95; 98) = 1,984.
Так как tнабл=11,2048 > 1,984, то нулевая гипотеза отвергается и коэффициент корреляции значимо отличается от нуля. Это означает, что между СВ Х и СВ У существует корреляционная зависимость.
г) Построим корреляционное поле. Изобразим результаты измерений (хi ; уi) в виде точек в декартовой системе координат (рис. 7).
Рис. 7- Корреляционное поле и линии регрессии.
По виду корреляционного поля видно, что между Х и У имеется прямолинейная регрессивная зависимость.
д) Найдем выборочное уравнение регрессии У на Х:
ух = у + *
Выборочное уравнение регрессии Х на У таково:
ху = х + *
Контроль вычислений:
0,209*2,7 = 0,5643=2
Графики найденных выборочных функции регрессии нанесены на рис.7
ВЫВОД
Была проведена исследовательская работа над случайной двумерной величиной Х- высота сосен, м; У- диаметр сосен у основания, см. Были построены интервальный и дискретный статистически ряды распределения частот и относительных частот, гистограммы и полигоны относительных частот, эмпирические функции распределения. Были вычислены числовые характеристики выборки: выборочную среднюю, выборочную дисперсию, выборочные коэффициенты асимметрии и эксцесса. Для Х и для У несимметричный полигон (гистограмма). Правосторонняя асимметрия данного распределения, и полигон менее крут чем нормальная кривая.
Х и У распределены по нормальному закону, это видно исходя из механизма их образования, по виду гистограммы и полигона относительных частот и по значениям выборочных коэффициентов асимметрии и эксцесса.
Далее были найдены точечные оценки параметров нормального закона распределения, и записаны функции плотности распределения вероятностей для Х и для У.
Проверила с помощью критерия согласия Пирсона гипотезу о том, что выборка извлечена из генеральной совокупности с предполагаемым нормальным законом распределения. Была приняты гипотезы и найдены интервальные оценки параметров нормального закона распределения
И теперь соединив значения Х высота сосен, м. и У- их диаметр у основания, см. провела корреляционный анализ: составила корреляционную таблицу; нашла выборочный коэффициент корреляции; проверила значимость выборочного коэффициента корреляции rв ;построила корреляционное поле и по характеру расположения точек на нем подобрать общий вид функции регрессии; нашла эмпирические функции регрессии У на Х, X на Y и построила их графики.