Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Теория вероятностей и математическая статистика

Файл:

Курсовые / Курсачи ЭКТ 2-2 / 14 вар / мой курсач.doc

Скачиваний:

Добавлен:

17.04.2013

Размер:

291.84 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

2. Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть (x_i,y_i), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X

y=^*₀+^*₁x и X на Y x=^^*₀+^^*₁y.

Сначала вычислим суммы

x_i, y_i ,x²_i ,y²_i , x_iy_i , (x_i+y_i)²

Для контроля правильности вычислений используется тождество

 (x_i+y_i)²= x²_i + 2 x_iy_i + y²_i

Выборочные средние находятся по формулам

=^*_1,0=x_i/n, =^*_0,1=y_i/n_.(1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Q_x=(x_i– )²=x²_i – (x)²_i/n , (2)

Q_y=(y_i– )²=y²_i – (y)²_i/n , (3)

Q_xy=(x_i– )(y_i– )=x_iy_i – (x_i)(y_i )/n , (4)

Отсюда

D^*_x= Q_x/n , D^*_y= Q_y/n ,

R=^*_1,1/ (D^*_x D^*_y)^1/2= Q_xy/( Q_x Q_y)^1/2 (5)

Выборочная линейная регрессия Y на X по выборке (x_i , y_i ), i= 1,......, n определяется уравнением

y=^*₀+^*₁x= + r (D^*_y / D^*_x) (x– )

Коэффициенты ^*₀и ^*₁называются выборочными коэффициентами регрессии. Они вычисляются по формулам

₁^*=[n  x_iy_i – (x_i)(y_i )]/(n x²_i - (x_i)²) = Q_xy/ Q_x (6)

₀^*= -₁^*(7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=^^*₀+^^*₁y = + r (D^*_x / D^*_y) (y– )

₁^^*=[n  x_iy_i – (x_i)(y_i )]/(n y²_i - (y_i)²) = Q_xy/ Q_y (8)

₀^^*= -^^*₁(9)

Для контроля правильности расчетов используют соотношение

(₁^*₁^^*)^1/2= r (10)

Прямые

y=^*₀+^*₁x , x=^^*₀+^^*₁y

пересекаются в точке с координатами (,)

Функция y=^*₀+^*₁x

Определяет выборочную (эмпирическую) регрессию Y на X. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=x_i, i=1,2,....,n, и расчетными значениями _i=^*₀+^*₁x_i называются остатками и обозначаются e_i:

e_i= y_i –_i, i = 1,2,......,n . (11)

Качество аппроксимации результатов наблюдений (x_i,y_i), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле

S²= e²_i/(n-2)=1/(n-2) [ y_i – (^*₀+^*₁x_i)]²=Q_e/(n-2) (12)

Величина Q_eопределяемая выражением

Q_e=  e²_i= (y_i– _i)² (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

 (y_i– _i)² =  (_i – _i)² +  (y_i– _i) ² (14)

Которое записывается в виде

Q_y = Q_r + Q_e, где

Q_y=  (y_i– _i)²=  y²_i– n*(_i )²,

Q_r = (_i – _i)²=^*₁ Q_xy=^*2₁ Q_x= Q²_xy/ Q_x(15)

Величина Q_rназывается суммой квадратов, обусловленной регрессией регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации R² , вычисляемый по формуле

R²= Q_r / Q_y =1 – (Q_e / Q_y) (16)

Коэффициент детерминации R² равен той доле разброса результатов наблюдений (x_i,y_i), i = 1,2,......,n , относительно горизонтальной прямой y=, которая объясняется выборочной регрессией. ВеличинаR является оценкой коэффициента корреляции между результатами наблюдений y_iи вычисленными значениями _i , предсказываемыми регрессией , т.е.

R= p^*_y= r_y

В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииr_xyимеется следующее соотношение:

r_xy = ( знак ^*₁ ) R .

Доверительным интервалом для параметра называется интервал, содержащий истинное значение с заданной вероятностью, т.е.. Числоназывается доверительной вероятностью, а значение- уровнем значимости. Статистики, определяемые по выборке из генеральной совокупности с неизвестным параметром, называются нижней и верхней границами доверительного интервала.

Границы доверительных интервалов для параметров линейной регрессии имеют вид:

, где - квантиль распределения Стьюдента сn-2 степенями свободы.

Границы доверительного интервала для среднего значения , соответствующего заданному значению , определяются формулой:

Доверительный интервал для дисперсии ошибок при неизвестном и при доверительной вероятности имеет вид , где - квантиль распределения с n-2 степенями свободы.

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Соседние файлы в папке 14 вар

#
17.04.2013438.78 Кб19kostik.doc
#
17.04.201337.89 Кб15terv.XLS
#
17.04.201331.74 Кб15Книга1.xls
#
17.04.2013291.84 Кб26мой курсач.doc