Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
25
Добавлен:
17.04.2013
Размер:
291.84 Кб
Скачать

2. Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X

y=*0 +*1x и X на Y x=*0 +*1y.

Сначала вычислим суммы

xi , yi ,x2i ,y2i , xiyi , (xi+yi)2

Для контроля правильности вычислений используется тождество

 (xi+yi)2= x2i + 2 xiyi + y2i

Выборочные средние находятся по формулам

=*1,0=xi/n , =*0,1=yi /n. (1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Qx=(xi )2=x2i – (x)2i/n , (2)

Qy=(yi )2=y2i – (y)2i/n , (3)

Qxy=(xi )(yi )=xiyi – (x i)(yi )/n , (4)

Отсюда

D*x= Qx/n , D*y= Qy/n ,

R=*1,1/ (D*x D*y)1/2= Qxy/( Qx Qy)1/2 (5)

Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением

y=*0 +*1x= + r (D*y / D*x ) (x )

Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам

1*=[n  xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)

0* = -1*(7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=*0 +*1y = + r (D*x / D*y ) (y )

1*=[n  xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)

0*= -*1(9)

Для контроля правильности расчетов используют соотношение

(1*1*)1/2= r (10)

Прямые

y=*0 +*1x , x=*0 +*1y

пересекаются в точке с координатами (,)

Функция y=*0 +*1x

Определяет выборочную (эмпирическую) регрессию Y на X. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями i=*0 +*1xi называются остатками и обозначаются ei:

ei = yii, i = 1,2,......,n . (11)

Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле

S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)

Величина Qe определяемая выражением

Qe =  e2i= (yi i)2 (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

 (yi i)2 =  (ii )2 +  (yi i) 2 (14)

Которое записывается в виде

Qy = Qr + Qe , где

Qy=  (yi i)2=  y2i – n*(i )2,

Qr = (ii )2=*1 Qxy=*21 Qx= Q2xy/ Qx (15)

Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле

R2= Qr / Qy =1 – (Qe / Qy) (16)

Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=, которая объясняется выборочной регрессией. ВеличинаR является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями i , предсказываемыми регрессией , т.е.

R= p*y= ry

В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение:

rxy = ( знак *1 ) R .

Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Числоназывается доверительной вероятностью, а значение- уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.

Границы доверительных интервалов для параметров линейной регрессии имеют вид:

,

, где - квантиль распределения Стьюдента сn-2 степенями свободы.

Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой:

.

Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятности имеет вид , где - квантиль распределения с n-2 степенями свободы.

Соседние файлы в папке 14 вар