Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Нов.ПМС-2

.pdf
Скачиваний:
337
Добавлен:
21.05.2015
Размер:
2.83 Mб
Скачать

Определим стандартное отклонение свободного члена b0 и доверительный интервал для 0 .

Доверительный интервал для 0 и проверку гипотезы о том, что 0 равно или не равно некоторому заданному числу,

удается построить аналогично тому, как было получено для

1 .

Можем показать, что стандартное отклонение b0 есть

 

 

 

 

 

X i2

 

 

 

.

n ( X i

 

)2

X

Более детально эта формула будет выводиться позже.

Замена на s дает оценку стандартному отклонению b0 . Отсюда получаем 100 (1 ) % доверительные пределы для

0 :

 

 

 

 

 

 

 

 

b t(n 2,1

 

)s

X i2

.

 

n ( X i

 

 

 

 

 

0

 

2

 

 

X )2

 

 

 

 

 

 

Критерий t для нулевой

гипотезы

H0 : 0

00 против

альтернативы H1 : 0

00 ,

 

 

 

 

 

 

 

 

 

 

где 00 – заданное значение,

 

 

 

 

 

 

 

 

 

будет отвергать ее с 100 % уровнем значимости, если 00 попадет за доверительные границы, или не будет ее отвергать, если 00 попадет внутрь интервала.

Проверку гипотезы

H 0 можно выполнить и иначе,

находя величину

 

 

 

 

 

 

t

 

 

(b0 00 )

 

 

 

 

 

 

 

 

s

X i2

 

 

n ( X i

 

)2

 

 

 

X

и сравнивая ее с процентной точкой t(n 2,1 2 ) , так как

111

(n 2) – это число степеней свободы, на котором основана

оценка s 2 для 2 .

Возможно построение совместной доверительной области для 0 и 1 одновременно, если применить формулу, которая будет получена для многомерных величин.

Стандартное отклонение Y

Ранее было показано, что подобранное уравнение регрессии имеет вид

Y Y b1 ( X i X ) ,

где как Y , так и b1 подвержены ошибкам, которые будут влиять на Y .

Далее, если ai и ci

– константы и

 

 

 

 

 

a a1Y1 ... anYn ,

 

 

c c1Y1 ... cnYn ,

 

 

то, в случае некоррелированности Yi

 

и Y j при

условии D(Y ) 2

i , имеем:

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

cov(a, c) (a c

... a

c

n

) 2 .

 

 

1 1

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

Если заменим a на Y , т.е. a Y , то это влечет ai

 

 

 

 

 

 

 

 

 

 

 

 

 

замена c b1 влечет ci

X i

X

 

 

 

, так что

( X i

 

 

 

 

 

 

X )2

 

 

 

 

 

 

cov(Y ,b1 ) 0 ,

i j и при

1n ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т.е. Y и b1

– некоррелированные случайные величины.

 

 

Поэтому дисперсия предсказываемого среднего значения Y

(или Y0 при заданном X 0 ) в зависимости от X есть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

2

 

 

 

D(Y ) D(Y ) ( X X )2 V (b ) =

( X 0 X )

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

( X i X )

2

 

 

 

 

 

 

 

 

 

 

 

Отсюда оценка стандартного отклонения

112

 

 

 

s

 

1

 

( X 0

X

)2

 

.

 

 

 

 

 

Y0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

( X i X )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, эта

 

величина достигает минимума,

когда

 

 

 

 

 

 

 

 

X 0

X

и возрастает, по мере того как мы ―удаляем‖ X 0

от X

в любом направлении.

 

 

 

 

 

 

 

 

 

 

 

 

Другими словами, чем больше разность между

X 0 и

 

 

 

 

средним значением

X , тем больше ошибка, с которой мы

будем предсказывать среднее значение Y для данного X 0 .

Следовательно,

 

 

мы

 

можем ожидать наилучшее

предсказание в центре области наблюдений X и не должны ожидать хорошего предсказания при удалении от центра. Дисперсия и оценка стандартного отклонения, которые мы рассмотрели, относятся к предсказываемому среднему значению Y при данном X 0 . Так как фактические значения Y

варьируют около ―истинного‖ среднего значения с дисперсией2 (не зависимой от D(Y ) ), то предсказанное значение

индивидуального наблюдения будет определяться величиной

Y

, но с дисперсией

 

 

 

 

 

 

 

 

 

 

 

 

2

1

 

( X 0

X

)2

 

 

 

 

[1

 

 

 

 

 

] .

 

 

n

( X i

 

)2

 

 

X

Доверительные пределы можно найти уже рассмотренным способом, Мы вычисляем 95% доверительный интервал для нового наблюдения, который будет симметричен

относительно Y0 и длина которого будет зависеть от оценки этой новой дисперсии

 

t(v,0,975)s

1

1

 

( X 0

 

X

)2

 

 

Y0

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

n

( X i X )2

 

 

 

 

 

 

где v – число степеней свободы, на котором основана оценка

s 2 (здесь это число равно (n 2) ).

Доверительный интервал для

среднего из q новых

113

 

наблюдений Y0 находится аналогично, исходя из следующего.

Пусть Y0

есть средне из q новых наблюдений при X 0 . Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, 2 ) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

~ N(

0

X

0

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y0 ~ N( 0

1 X 0 , D(Y0 )) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и (Y0-– Y0-)/s2

 

 

 

 

 

так что Y Y ~ N(0, 2 D(Y ))

 

распределено

 

 

 

0

0

0

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

как t(v) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где v – число степеней свободы,

на котором основана

s 2 , оценка 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому вероятность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

[| Y

Y

| t(v,0,975)s 2

 

1 1

 

 

 

( X

0 X )

 

] =0,95.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

q

 

 

( X i X )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так что мы можем построить доверительный интервал для Y0

относительно Y0 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( X 0

 

 

)2

 

 

 

 

 

 

 

 

 

t(v,0,975)s

1

 

1

 

 

 

X

 

 

 

 

 

 

 

 

 

Y0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

q

 

( X i X )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эти пределы, конечно, шире, чем для среднего значения Y

при данном

X 0

так как

 

 

ожидается, что 95% будущих

наблюдений при

X 0 (для q 1 )

или будущих средних из q

наблюдений (для q >1) лежат внутри них.

F-критерий значимости регрессии

F -критерий известен из математической статистики и может быть использован для исследования моделей регрессии. Так как Yi – случайные величины, то любая функция от них

тоже будет случайной величиной. Например, две функции:

MSR – средний квадрат, обусловленный регрессией, и s 2

средний квадрат, обусловленный остаточной вариацией, тоже будут случайными. Они представлены в таблице дисперсионного анализа. Эти функции имеют свои

114

собственные распределения, средние, дисперсии и моменты. Их средние значения будут:

E(MSR ) 2 1 ( X i X )2 , E(s2 ) 2 ,

где E означает среднее или математическое ожидание случайной величины.

Положим, что ошибки i – независимые случайные величины с распределением N (0, 2 ) . Можно показать, что если 1 0 , то величина MSR , умноженная на свое число степеней свободы (в данном случае на 1), подчиняется 2 - распределению с тем же самым числом степеней свободы. Более того, (n 2)s2 2 тоже имеет 2 -распределение с (n 2) степенями свободы.

Так как эти две случайные величины независимы, то из статистической теории вытекает, что отношение

 

F

MSR

 

 

 

 

 

 

 

 

s 2

 

 

 

 

 

 

 

 

 

 

 

 

 

подчиняется

F – распределению

 

с 1

и (n 2) степенями

свободы при

условии, что 1

0 .

Этот

 

факт

можно

использовать как критерий выполнимости равенства 1

0 .

Мы должны сравнить отношение

F

MSR

 

с

100 (1 ) %

s 2

 

 

 

 

 

 

 

 

табличной точкой F(1, n 2) , чтобы посмотреть, можно ли на

основе имеющихся данных рассматривать β1 как число, отличное от нуля.

Для объяснения доли разброса мы определили, что

R 2 (Yi Y )2 ,(Yi Y )2

где суммирование ведется по i 1,2,...n . Тогда R 2 измеряет

долю общего разброса относительно среднего Y , объясняемую регрессией. Ее часто выражают в процентах, умножая на 100. Фактически R – это корреляция между Y и

115

Y , и ее обычно называют множественным коэффициентом

корреляции. Коэффициент R 2 самое большее может достигнуть величины 1 (или 100%), когда все значения X различны. Если в данных имеются повторяющиеся опыты, то величина R 2 не может достигнуть 1, как бы хороша ни была модель. Это объясняется вариацией в данных из-за ―чистой‖ ошибки опыта (ошибки воспроизводимости).

9.6. Проверка адекватности модели линейной регрессии

Обсудим методы анализа точности описания данных предложенной моделью. Рассмотрим, что такое

неадекватность и «чистая» ошибка.

Построенная линия регрессии – это расчетная линия, основанная на предположениях. Эти предположения мы должны рассматривать как предварительные. Мы можем при некоторых обстоятельствах (условиях) проверить, корректна ли наша модель. Мы будем изучать проявления предполагаемой некорректности модели.

 

 

 

 

X X i . Это

Вспомним, что

ei Yi

Yi

остатки при

величины, на которые действительные наблюдаемые значения Yi отличаются от Yi , вычисленных по уравнению. Было

показано, что ei 0 . Остатки содержат информацию о том,

почему построенная модель недостаточно правильно объясняет наблюдаемый разброс зависимой переменной Y .

Пусть

i

E(Yi )

обозначает

величину

среднего для

«истинной» модели при X X i . Тогда можем записать

 

 

 

 

 

 

 

 

 

 

Y Yi

(Yi Yi ) E(Yi

Yi ) E(Yi Yi

) =

 

 

 

 

 

 

 

 

Bi ,

 

=[(Yi

Yi

)

( i E(Yi

))

( i E(Yi ))] = qi

 

 

 

 

 

 

 

 

 

где qi (Yi

Yi )

( i E(Yi )) , Bi

i E(Yi ) .

 

 

Величина Bi – это ошибка смещения при

X X i . Если

 

 

 

 

i и Bi

0 . Если же модель не верна,

модель верна, то E(Yi )

 

 

 

 

116

 

 

 

 

0

 

 

 

 

то E(Yi ) i и Bi

, и его значение зависит от «истинной»

модели и значения X i .

 

 

 

Переменная

qi

это

случайная величина, имеющая

нулевое среднее, т.к.

 

 

 

 

 

 

 

 

 

E(qi ) E(Yi Yi )

( i E(Yi )) =

 

 

 

 

 

 

 

= i

E(Yi

) ( i

E(Yi )) 0 ,

и это верно независимо от того, будет ли модель правильна,

т.е. E(Yi ) i .

Можно показать, что qi коррелированны, и величина q12 ... qn2 имеет математическое ожидание, или среднее значение, (n 2) 2 ,

где 2 V (Yi ) – дисперсия ошибки.

Исходя из этого, можно показать, что остаточный средний квадрат, т.е. величина

1

n

 

 

(Yi

)2

 

Yi

n 2

i 1

 

 

 

 

 

имеет математическое ожидание, или среднее значение, 2 , если предложенная модель корректна, и

n

 

 

2 Bi2

(n 2) ,

 

i 1

 

 

если модель не корректна.

 

 

Если модель корректна, т.е.

Bi 0 , то остатки будут

коррелированными случайными

отклонениями

qi , и

остаточный средний квадрат можно использовать как оценку дисперсии ошибки 2 .

Если модель не корректна, т.е. Bi 0 , то остатки содержат оба компонента: случайный qi и систематический Bi . Мы можем рассматривать их как случайную ошибку разброса и систематическую ошибку смещения. В простейшем

117

случае подбора прямой, как правило, можно определить ошибку смещения, непосредственно, исследуя график с данными (см. рис. 9.4 а, б, в, г).

Рис.9.4 а На рис.9.4 а представлен случай 1, когда проверяется

модель Y 0 1 X . В этом случае нет неадекватности,

линейная

регрессия

значима,

используется

модель

Y b0 b1 X

Рис.9.4 б На рис.9.4 б представлен случай 2, когда проверяется

модель Y 0 1 X . В этом случае нет неадекватности, линейная регрессия незначима, используется модель

Yi Y b1 ( X i X )

118

Рис.9.4 в На рис.9.4 в представлен случай 3, когда проверяется

модель Y 0 1 X . В этом случае неадекватность значима, линейная регрессия незначима, следует проверить модель Y 0 1 X 2 X 2 .

Рис.9.4 г На рис.9.4 г представлен случай 4, когда проверяется

модель Y 0 1 X . В этом случае неадекватность значима, следует проверить модель Y 0 1 X 2 X 2 .

Если модель более сложна или включает больше переменных, то это невозможно (т.е. невозможно определить ошибку смещения из данных). Если существует априорная

оценка 2 (под «априорной оценкой» мы понимаем оценку, полученную на основе ранее выполненных опытов), то можно увидеть (или проверить по F -критерию), значимо ли

119

остаточная сумма квадратов превышает нашу априорную оценку. Если это так, то говорят, что имеет место неадекватность и следует пересмотреть модель.

Если априорной оценки нет 2 , но измерения Y повторялись (два или более раза) при одинаковых значениях X , то мы можем использовать эти повторения для получения оценки 2 .

Такую оценку называют «чистой» ошибкой, потому что если сделать X одинаковыми для двух наблюдений, то только случайные вариации могут влиять на результаты и создавать разброс между ними. Эти различия обеспечивают получение

оценки 2 , которая более надежна, чем оценки, получаемые из других источников. По этой причине имеет смысл ставить опыты с повторением.

Когда в данных содержатся повторные опыты, нужны дополнительные обозначения для множества наблюдений Y при одном и том же значении X .

Пусть мы имеем m различных значений X и к j -му из этих значений X i , где i 1,2,...m , относятся n j наблюдений. Тогда мы говорим, что

Y11,Y12 ,...Y1n

n1 повторных наблюдений при X 1 ,

Y21,Y22 ,...Y2n

n2

повторных наблюдений при X 2 ,

Y ju u -е наблюдение при X j , u 1,2,...n j ,

Ym1 ,Ym2 ,...Ymn nm повторных наблюдений при X m .

 

 

 

 

m

n

m

 

 

 

 

Всего получается n 1= n j наблюдений.

 

 

 

 

j 1 u 1

j 1

 

 

 

 

Вклад суммы квадратов, связанной с «чистой» ошибкой

для n1 наблюдений при X 1 ,

будет равен внутренней сумме

квадратов Y1u

 

 

 

 

 

 

 

относительно их среднего Y1 , т.е.

n

 

 

 

n

 

 

 

 

n

 

n

(Y1u

 

 

 

 

 

2 = Y1u2

( Y1u )2 n1 . (9.27)

Y1

)2 Y1u2 n1Y1

u 1

 

 

 

u 1

 

 

 

 

u 1

 

u 1

 

 

 

 

 

 

120