- •Курсовая работа
- •2. Теоретическая часть.
- •1.Основные задачи математической статистики.
- •1.1. 3Адача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным.
- •1.2. Задача проверки правдоподобия гипотез.
- •1.3. Задача нахождения неизвестных параметров распределения
- •2. Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •3. Однофакторный дисперсионный анализ.
- •Границы доверительного интервала для Lk имеют вид
- •3. Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2. Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3.Доверительные интервалы.
- •4. Вычисление s21 s22 с помощью однофакторного дисперсионного анализа и проверка гипотезы h0
2. Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi , yi ,x2i ,y2i , xiyi , (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
=*1,0=xi/n , =*0,1=yi /n. (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=(xi – )2=x2i – (x)2i/n , (2)
Qy=(yi – )2=y2i – (y)2i/n , (3)
Qxy=(xi – )(yi – )=xiyi – (x i)(yi )/n , (4)
Отсюда
D*x= Qx/n , D*y= Qy/n ,
R=*1,1/ (D*x D*y)1/2= Qxy/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=*0 +*1x= + r (D*y / D*x ) (x – )
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0* = -1*(7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=*0 +*1y = + r (D*x / D*y ) (y – )
1*=[n xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*= -*1(9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x , x=*0 +*1y
пересекаются в точке с координатами (,)
Функция y=*0 +*1x
Определяет выборочную (эмпирическую) регрессию Y на X. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями i=*0 +*1xi называются остатками и обозначаются ei:
ei = yi –i, i = 1,2,......,n . (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = e2i= (yi – i)2 (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi – i)2 = (i – i )2 + (yi – i) 2 (14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy= (yi – i)2= y2i – n*(i )2,
Qr = (i – i )2=*1 Qxy=*21 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристикой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 – (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=, которая объясняется выборочной регрессией. ВеличинаR является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями i , предсказываемыми регрессией , т.е.
R= p*y= ry
В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение:
rxy = ( знак *1 ) R .
Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Числоназывается доверительной вероятностью, а значение- уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.
Границы доверительных интервалов для параметров линейной регрессии имеют вид:
,
, где - квантиль распределения Стьюдента сn-2 степенями свободы.
Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой:
.
Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятности имеет вид , где - квантиль распределения с n-2 степенями свободы.