- •Курсовая работа
- •2. Теоретическая часть.
- •1.Основные задачи математической статистики.
- •1.1. 3Адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным.
- •1.2. Задача проверки правдоподобия гипотез.
- •1.3. Задача нахождения неизвестных параметров распределения
- •2. Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •3. Однофакторный дисперсионный анализ.
- •Границы доверительного интервала для Lk имеют вид
- •3. Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2. Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3.Доверительные интервалы.
- •4. Вычисление s21 s22 с помощью однофакторного дисперсионного анализа и проверка гипотезы h0
2. Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi , yi ,x2i ,y2i , xiyi , (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
=*1,0=xi/n
,
=*0,1=yi
/n.
(1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=(xi
–
)2=x2i
– (x)2i/n
, (2)
Qy=(yi
–
)2=y2i
– (y)2i/n
,
(3)
Qxy=(xi
–
)(yi
–
)=xiyi
– (x
i)(yi
)/n , (4)
Отсюда
D*x= Qx/n , D*y= Qy/n ,
R=*1,1/ (D*x D*y)1/2= Qxy/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=*0
+*1x=
+
r (D*y
/ D*x
)
(x
–
)
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0*
=
-1*
(7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=*0
+*1y
=
+ r (D*x
/ D*y
)
(y
–
)
1*=[n xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*=
-*1
(9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x , x=*0 +*1y
пересекаются
в точке с координатами (
,
)
Функция y=*0 +*1x
Определяет
выборочную (эмпирическую) регрессию Y
на X.
Последняя является оценкой предполагаемой
(теоретической) регрессии по результатам
наблюдений. Разности между наблюдаемыми
значениями переменной Y
при x=xi
, i=1,2,....,n,
и расчетными значениями
i=*0
+*1xi
называются остатками и обозначаются
ei:
ei
= yi
–
i,
i
= 1,2,......,n
. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe
=
e2i=
(yi
–
i)2
(13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi
–
i)2
=
(
i
–
i
)2
+
(yi
–
i)
2
(14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy=
(yi
–
i)2=
y2i
–
n*(
i
)2,
Qr
=
(
i
–
i
)2=*1
Qxy=*21
Qx=
Q2xy/
Qx
(15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристикой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 – (Qe / Qy) (16)
Коэффициент
детерминации R2
равен той
доле разброса результатов наблюдений
(xi,yi),
i
= 1,2,......,n
, относительно горизонтальной прямой
y=
, которая объясняется выборочной
регрессией. ВеличинаR
является оценкой коэффициента корреляции
между результатами наблюдений yi
и вычисленными
значениями
i
, предсказываемыми регрессией , т.е.
R=
p*y
=
ry![]()
В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение:
rxy = ( знак *1 ) R .
Доверительным
интервалом для параметра
называется интервал
,
содержащий истинное значение с заданной
вероятностью
,
т.е.
.
Число
называется доверительной вероятностью,
а значение
- уровнем значимости. Статистики
,
определяемые по выборке из
генеральной совокупности с неизвестным
параметром
,
называются нижней и верхней границами
доверительного интервала.
Границы доверительных интервалов для параметров линейной регрессии имеют вид:
,
,
где
-
квантиль распределения Стьюдента сn-2
степенями свободы.
Границы
доверительного интервала для среднего
значения
,
соответствующего заданному значению
,
определяются формулой:
.
Доверительный
интервал для дисперсии ошибок при
неизвестном
и при доверительной вероятности
имеет вид
,
где
-
квантиль распределения
с
n-2
степенями свободы.
