Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТЕКСТЫ для лабработы 2 / вариант №12.rtf

Скачиваний:

Добавлен:

14.03.2016

Размер:

3.48 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1511 12 13 14 15 > Следующая >>>

§13. Доверительные интервалы

Введем случайную величину

. (13.1)

Нетрудно проверить, что N(0,1), вследствие чего

Полагая , получим после элементарных преобразований, что с

вероятностью выполняется неравенство

. (13.2)

Интервал называетсядоверительным интервалом, отвечающим доверительной вероятности . Если, к примеру, k=2, доверительная вероятность =0.955. Значению k=3 отвечает вероятность = 0.997 (правило «трех сигм»). Но для использования указанных доверительных интервалов на практике нужно знать стандартное отклонение . Если значение неизвестно, для его оценки используется величина . В этом случае можно ввести случайную величину

которая имеет распределение Стьюдента с n-1 степенью свободы [3]. Не выписывая здесь соответствующей функции распределения, приведем несколько значений доверительной вероятности (k, n), отвечающих доверительному интервалу

. (13.3)

При k=2 и n=3 имеем =0.817; при k=2 и n=7 вероятность =0.908 ;

(3,3)=0.905; (3,5)=0.96. С ростом n различие между распределением Стьюдента и Гауссовым распределением становится меньше, при n=20 этим различием в большинстве случаев можно пренебречь.

Регрессионные модели мы строим по данным наблюдениям (x_i_,y_i), i = 1,2,....n. Пусть значения x = x^* не совпадают с x_i. Чему будет равна величина y = y^* и с какой погрешностью ее можно найти?

Попытаемся ответить на этот вопрос для случая парной линейной регрессии с нулевым свободным членом

y_i =bx_i+ _i,

где _iN(0,), i = 1,2...n.

Параметр b оцениваем методом наименьших квадратов:

_i²= (bx_i– y_i)² min,

(bx_i– y_i)x_i = 0,

= (13.4)

Из формулы (13.4) следует, что оценка является гауссовой случайной величиной с математическим ожиданием

E= ==b

(оценка несмещенная) и дисперсией

D = (13.5)

Величина σ² , как правило, неизвестна и ее следует оценить. Для этого составим сумму квадратов ошибок

_i²= (bx_i– y_i)² = (bx_i–x_i+x_i - y_i)² =

= x_i²(b-)²+ Σ(x_i–y_i)²+ 2x_i(b-)(x_i- y_i). (13.6)

Математическое ожидание E_i² = Е_i²= nσ².

Вычисление математического ожидания в правой части равенства (13.6) дает

x_i² D + EΣ(x_i–y_i)²,

так как математическое ожидание последнего слагаемого равно нулю. Поэтому

nσ² = x_i² D + EΣ(x_i–y_i)².

С учетом формулы (13.5) получим

(n-1)σ² = EΣ(x_i–y_i)².

Теперь ясно, что величина

S ² = Σ(x_i–y_i)² (13.7)

будет несмещенной оценкой для σ². Множитель (n-1) указывает на то, что, располагая только одним наблюдением (x_1,y₁), нельзя получить оценку S ²,так как возникает неопределенность вида 0/0.

Для определения доверительного интервала оценки , отвечающего доверительной вероятностиα, рассмотрим случайную величину

ξ = (b-),

имеющую нормальное распределение N(0,1). Заменив σ оценкой S , придем к случайной величине

η = (b-),

имеющей распределение Стьюдента с (n-1) степенями свободы. Для прогнозируемого значения y* регрессионная модель дает значение

y^* =x^*+ ,

при этом Ey^*= bx^*, Dy^*=( x^*)²D + D = σ².

Заменим дисперсию σ² оценкой S² из (13.7):

(S_y^*)² = S ².

Доверительный интервал для прогнозируемых величин y^* будет определяться распределением Стьюдента. Его границы вычисляются по формуле

y = y^* S_y^*t(n-1, 1-/2),

где - доверительная вероятность (например, = 0,95), (n-1) – число степеней свободы. Статистические пакеты вычисляют эти границы и дают их графическое представление.

Совершенно аналогично рассматривается общий случай множественной линейной регрессии

y =F + .

Можно показать, что

Dy^*= (x^*)^T x^* + ²,

где x_i = (x₁,x₂,...x_n)^*; = cov= ²(F^TF)^-¹. Поэтому

Dy^*= ²[(x^*)^T (F^TF)^-¹x^*+1].

Несмещенной оценкой для ² является число

S ²= . (13.8)

Поэтому оценка среднеквадратичного отклонения y^* будет

S_y^*= S[(x^*)^T (F^TF)^-¹x^*+1]^1/2,

а граница доверительного интервала

y = y^* S_y^*t(n-m, 1-/2).

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1511 12 13 14 15 > Следующая >>>

Соседние файлы в папке ТЕКСТЫ для лабработы 2

#
14.03.2016411.82 Кб21вариант №1.rtf
#
14.03.20161.26 Mб28вариант №10.rtf
#
14.03.20169.42 Mб26вариант №11.rtf
#
14.03.20163.48 Mб29вариант №12.rtf
#
14.03.201644.78 Mб40вариант №13.rtf
#
14.03.201610.31 Mб21вариант №14.rtf
#
14.03.2016536.75 Кб54вариант №15.rtf
#
14.03.2016755.36 Кб39вариант №16.rtf
#
14.03.2016395.35 Кб43вариант №17.rtf