Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Samordina-LR2.pdf
Скачиваний:
17
Добавлен:
11.05.2015
Размер:
2.11 Mб
Скачать

Проведя вычисления и получив левую и правую части неравенства, записанного формулой 9, можно сказать, что в данным случае и коэффициент регрессии , и коэффициент регрессии значимы.

4.4Определение доверительных областей, включающих в истинную регрессию с заданной вероятностью

Вслучае если параметр заменяется его оценкой, то могут возникнуть определенные ошибки из-за погрешности, чтобы быть уверенным, что эти ошибки не выдут за известные пределы, и иметь представление о точности и надежности оценки, используются доверительные интервалы, как говорит [2].

Доверительный интервал для имеет вид:

b t(1+ )=2S b + t(1+ )=2S (14)

Для коэффициента вид доверительного интервала немного изме-

нен.

b t(1+ )=2S b + t(1+ )=2S (15)

Рисунок 15 демонстрирует результат вычислений.

Рис.15. Вычисление доверительных интервалов параметров регрессии

15

4.5Анализ регрессионных остатков

После того, как модель регрессии построена, естественно возникает вопрос об адекватности модели. Под адекватностью модели подразумевается, что никакая другая модель не даст существенного улучшения в предсказании отклика у. Один из методов проверки адекватности модели является анализ остатков. Остатки вычисляются по формуле: ei yi y^i, где yi получено из уравнения регрессии, как утверждает [3].

Если уравнение регрессии верно описывает исходные данные, то остатки должны быть распределены по нормальному закону. Таким образом, необходимо исследовать независимость остатков и нормальность распределения.

Для выявления независимости остатков используется метод ДарбинаВатсона. Первоочередно необходимо найти параметр D по формуле 16.

D =

P

in=2(ei ei 1)2

(16)

 

in=1 ei2

 

 

 

P

 

Его вычисления отображены на рисунке 16. После чего необходимо сравнить его с ключевыми значениями, полученными из рисунка 17.

Рис.16. Проверка независимости остатков статистикой Дарбина-Ватсона

Если D > D2( ) - принимается гипотеза о положительной корреля-

16

ции между остатками.

Если D > 4 D1( ) - гипотеза об отрицательной корреляции между остатками.

Если D2( ) > D > D1( ) или 4 D1( ) > D > 4 D2( ). Очевидно, что в данном случае критерий не позволяет судить о на-

личии или отсутствии корреляционной связи, так как 4 D1( ) > D >

4 D2( ).

Нормальность остатков определяется с помощью критерия согласия Пирсона. Алгоритм вычисления был приведен в пункте 4.1, так что далее будут обозначены основные шаги, без детальных пояснений.

Необходимо найти длину интервала, после чего построить необходимое количество интервалов. В случае, если количество данных, попавших в интервал, менее 5, он не считается значимым и объединяется с соседним.

Для вычисления критерия согласия теоретического используется функция ХИ2ОБР с параметрами уровня значимости =0,05 и

Проверка нормальности остатков выполняется по критерию согласия

2. Так как общий ход решения был представлен в пункте 4.1, то дальней-

Рис.17. Критические значения статистики Дарбина-Ватсона

17

шее решение будет основываться на нем и не содержать в себе пошаговое объяснение.

Первоначально необходимо найти минимальное и максимальное значения для остатков. Их разность называется размахом. По формуле 2 вычисляется ширина интервала. Выполнение вычислений отображено на рисунке 18.

Рис.18. Ширина шага для проверки нормальности остатков

В результате получается, что значимых интервалов всего три, а для вычисления критического значения 2 этого не достаточно. Чтобы получить большее число значимых интервалов, необходимо уменьшить шаг. И в результате вместо 17 интервалов, из которых только три значимы, можно получить 5 значимых интервалов из 47, что показано на рисунке 20.

Рис.19. Нахождение интервалов при шаге h=0,125

18

Рис.20. Нахождение интервалов при шаге h=0,042

После чего необходимо переписать образовавшиеся интервалы, найти их центры и количество попаданий значений в каждый интервал. Величина, характеризующая отношение значения, попавших в каждый интервал, к сумме значений - частота эмпирическая. Для нахождения теоретической частоты используется формула 2*. После чего по формуле 1 вычисляются частичные суммы 2. Значения, полученные при подсчете данных, отображены на рисунке 21. Очевидно, что критическое значение параметра согласия больше, чем полученное экспериментальным путем, таким образом можно судить о нормальности распределения данных.

19

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]