книги из ГПНТБ / Гришин В.К. Статистические методы анализа результатов измерений учеб. пособие
.pdf
|
|
|
|
|
|
|
|
|
(21.2) |
|
|
і - * |
|
|
|
|
|
|
|
Откуда, требуя, |
чтобы сумма |
|
|
при этих |
оценках |
дости |
|||
гала |
минимума, |
получаем уравнение |
для их определения: |
|
|||||
дії |
, |
|
|
|
|
|
|
|
|
ИЛИ |
|
|
т-1 |
|
|
|
|
|
|
|
|
|
У. . |
|
|
|
|||
|
|
|
L |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(21.5) |
|
Решение системы линейных уравнений (21.5) можно |
найти, |
|||||||
например, методом |
построения матрицы SK, |
, |
обратной SKK, |
||||||
т . е . удовлетворяющей равенству |
|
|
|
|
|
|
|||
|
т.-і |
-і |
|
|
/ |
при |
к = |
к" |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
н ' |
|
|
|
|
|
|
і |
Л |
при К* |
C2I.6) |
||
KmQ |
|
|
[ |
0 |
К' |
|
|||
|
|
|
|
|
|
|
|
||
Тогда |
оценки |
о< |
вычисляются как |
|
|
|
|
гл-т
5 - - L я ; ' v .
Оценки |
о( |
являются несмещенными, т . е . |
кк
vчем нетрудно убедиться, усредняя (21.7) по всем возможным случайным значениям у. :
Особый интерес представляет система "ортогональных" оазисных функций, удовлетворяющих условию
|
|
^ M ^ W W - ^ ^ , |
, |
|
( 2 1 . 8 ) |
|||
|
|
І-1 |
|
|
|
|
|
|
где |
|
|
|
Л- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/ у , - £ ц £ * ( х 4 ) . |
|
|
( 2 1 . Р ) |
|||
|
Базисные функции, удовлетворяющие уоловию ортогональ |
|||||||
ности |
на системе |
гТ. |
точек |
X . |
, значительно |
облег- |
||
чают |
процедуру вычисления коэффициента |
с( |
. Для ортого |
|||||
нальных функций, |
которые мы будем обозначать |
как |
£Ск(х), |
|||||
матрицы |
І / , . |
и |
Э , |
являются |
диагональными, т . е . |
Поэтому |
х ~ |
|
|
£ ч ^ ч ) |
( 2 1 Л 1 ) |
Как мы увкдим в дальнейшем, представление, |
основанное |
|
на ортогональных |
функциях, т . е . |
|
обладает рядом |
ценных свойств (упрощение расчетов является |
||||
их следствием), |
что и позволяет |
отдать |
ему |
"решительное" |
|
предпочтение. |
|
|
|
|
|
|
З А Д А Ч А |
|
|
|
|
Базируясь |
на эмпирических |
средних |
Ljf, |
. . ., |
построить |
линейную регрессию.
Решение. Сначала определим ортогональные базисные поли номы. Полагаем
о7
Z4 * х - х .
Используя определения ортогональности, записываем
Отсюда
X = ) Ш.Х1 ; ц = ' у<
Следовательно, |
линия |
perреоси» |
имеет вид |
? = |
<*0 + |
( х " * |
Ь |
где |
|
|
|
і
і
§ 22. Дисперсия коэффициентов регрессии Для оценки дисперсий коэффициента регреосии вычиолим
величину |
|
|
|
|
|
|
|
tf« |
= ' |
Я |
г |
• |
(22.1) |
Согласно |
(21.7 |
) |
имеем |
|
|
|
|
|
|
і |
|
|
|
Учитывая далее |
соотношения |
|
|
|
получаем
KS
поскольку б |
US |
=• 6 і - |
|
|
|
Таким образом, |
оценки коэффициента |
регрессии |
в общем |
||
случае оказываются |
коррелированными. Однако для ортогональ |
||||
ных базисных функций матрица |
S |
является |
диагональ |
||
ной, и оценки |
не коррелированы, |
т . е . |
|
|
О |
= |
• |
" |
NK |
(22.4) |
Как мы отмечали, коэффициенты корреляции, равные и данном случае
указывают, насколько |
близка |
к линейной |
свяьь меаду Ы |
(§ 2). Если значения |
| p^^j |
близки |
к единице, выбринкое |
представление |
m - i |
|
|
f(X)~ |
2jXKBjx)- |
(22.6) |
нельзя считать удачным. Корреляция увеличивает диолерсию оценок и создает дополнительные вычислительные трудности.
Коррелированное^ оС^ означает, что соответствующие |
члены |
||||||
в представлении (22.6) |
дублируют в большей или меньшей |
|
|||||
степени друг друга. Поэтому соответствующую комбинацию |
|
||||||
ОІ б |
+ |
о ( 6 |
разумно |
заменить новой функцией |
Ы б .что |
||
к |
к |
s |
s |
|
|
Є £ |
|
кромо |
прочего щиводит к "экономии" средств опасения. |
|
|||||
|
Для ортогональных |
базисных функций |
оценки |
©(^ |
не кор- |
||
релировани, |
так что такое представление |
является наиболее |
D K O I I O U l t l J M .
Нооощо говори, заранее, еще до начала обработки, дотшлыю трудно указать наилучшее описание.
Эта проблема в значительной степени решается, если коэффици ентам регрессии придавать наглядный характер. Например, один параметр может характеризовать положение пика кривой,
другой |
- |
его ширину |
и т . д . Так, из двух |
запиоей |
линейной |
|||||
регрессии |
» Ыд |
+ ctff X |
и |
|
в Д |
+ у3 4 (х - X ) |
пред |
|||
почтение |
следует отдать второй, |
поскольку |
коэффициент |
ра |
||||||
характеризует только |
наклон |
линии, а средняя высота ее опре |
||||||||
деляется |
только значением |
Д |
|
(ом.задачу § 21). Анало |
||||||
гично, |
дли описания |
пораболичеокой |
кривой |
ф(х) |
целесооб |
|||||
разно |
выбрать представление |
у = О * &(% ~ с ) ' . в котором |
||||||||
каждый из параметров |
Q , & |
и |
С |
|
характеризует |
|||||
различные |
свойства кривой. |
|
|
|
|
|
|
|
||
Обратимся теперь непосредственно к оценке |
диоперскй |
коэффициента регрессии. Вследствие (22.2), оценка дисперсии 6V. сводится к нахождению оценок объединенной дисперсии
б, определяемой согласно (20.8).
Первую оценку для б Я |
мы можем получить непосред |
ственно из исходного соотношения |
„ * |
~1 |
1 |
|
S |
= б = |
•> |
(22.7) |
|
|
|
|
р |
К |
|
|
так как значения |
С |
ш |
б. |
/Xt |
, |
или хотя бы закон изменения |
|
e>L |
от точки к точке,предполагались известными. |
||||||
|
Фактически \ эта оценка |
сводится к вычислению первой |
|||||
квадратичной формы |
М |
, |
поскольку последняя содержит не |
||||
смещенные оценки |
дисперсий |
g ? 1 |
результатов в каждой из |
||||
точек |
наблюдения |
ХА |
. |
Согласно (8.15) |
Так что неонеценной оценкой |
€ > 2 может служить соотноше |
ние |
|
м |
|
1 > - Л
С помощью мы можем сформулировать основные требования
к точности наблюдений в отдельных точках, необходимой для того, чтобы погрешность в определении коэффициента регрес сии, независимо от вида кривой, не превышала некоторой ве-
личини (для построения системы ортогональных базисных функ
ций не |
нужно знать эмпирические |
значения |
у. |
) . |
|
||||||||
|
Вторая |
несмещенная оценка |
€ > г |
мохет |
быть получена |
||||||||
с помощью квадратичной формы |
|
|
|
|
|
|
|||||||
|
|
М г |
- |
У~Ц (у. - |
£j*K |
|
ZK(\)) |
, |
(22.9) |
||||
среднее |
значение которой равно ( |
|
сАк |
-независимы) |
|
||||||||
|
|
Мг |
« ^ . ( у Г ? . / = |
|
б*(п.-т). |
|
|
||||||
|
|
|
|
|
і |
|
|
|
<5 |
|
|
|
|
Поэтому |
второй |
несмещенной |
оценкой |
является |
|
||||||||
|
|
5 * = - П = 1 _ |
-JL. |
|
|
|
, |
(22.10) |
|||||
|
|
2 |
|
|
|
п. - пг |
|
|
|
|
|
|
|
где |
коэффициент |
«К |
находится |
в соответствии с (21.11 ) . |
|||||||||
|
Соотношение (22.10) включает разброс точек относительно |
||||||||||||
эмпирической |
кривой регрессии. Поэтому |
St |
является,в |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
г 2 |
|
известной мере,более |
объективной |
оценкой, |
чем |
. |
|
||||||||
|
Полученные оценки обладают свойством стохастической неза |
||||||||||||
висимости. В процессе |
вычисления |
|
St |
и |
St |
, ш |
раз |
||||||
били |
исходную |
квадратичную |
сумму |
М |
, которая,очевидно, |
||||||||
имеет |
|
|
распределение |
с f=%Jt-i |
степенями свободы, |
||||||||
на |
М4 |
и |
М2 |
( |
ом. {20.5 |
) и'( 20.7 |
) ) . Последнюю |
||||||
сумму после |
преобразования |
^. - ^ |
« (у. |
- |
p j + (p> - у.) |
мы |
|||||||
разбиваем еще на две чаоти: |
|
|
|
|
|
|
|
|
|
і |
|
|
|
|
|
|
|
|
к.о |
|
|
|
|
|
что |
нетрудно |
показать, |
используя |
свойства |
ортогональности |
|||||||||||
Функций |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8аметим теперь, что число степеней свободы квадратичной |
|||||||||||||||
формы |
М4 |
|
равно |
^ |
= |
~ 1 |
(имеется |
|
М |
соотно |
||||||
шений ^ Х |
|
^УІУ |
|
) ' fll ч и с |
л о |
степеней |
свободы каждой |
|||||||||
ив оумм в (22.9) |
равно,соответственно, |
ft |
ж п - т |
(суще |
||||||||||||
ствует |
Щ |
связей, |
накладываемые |
на |
у. |
при оценке |
||||||||||
о(к |
) |
и |
f9 |
= т . |
|
|
|
|
|
|
|
|
|
|
|
|
|
Отсюда, |
поскольку |
$ = / f |
+ ft |
+ 4s • |
» т |
и "»ем утверж |
|||||||||
дать |
(используя еще pas теорему о разложении |
|
X - роопреде |
|||||||||||||
ления), |
что |
М |
и суммы в (22.8) |
имеют |
рС-раопреде |
|||||||||||
ления о / , " |
£ \ - |
п . ; |
ft»n-m. |
|
и |
£t= Гп. |
|
степенями |
||||||||
свободы. |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В чаотности, |
оценки |
|
|
л |
і>г |
могут |
быть |
пред |
|||||||
ставлены |
в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
s l ' t ' - r - |
; |
|
s; |
|
|
|
|
> |
|
|
и г л * ) |
||||
|
|
|
|
* |
|
|
|
|
|
|
Та |
|
|
|
|
|
|
Соотношения |
(22.12) |
дают |
нам право |
воспользоваться |
|||||||||||
методами |
§ |
15 для сравнения оценок |
of |
|
и |
о , . |
|
|||||||||
|
Такое |
сравнение |
позволяет |
эффективно |
контролировать |
|||||||||||
ход |
эксперимента, |
так как несовпадение |
оценок ( |
|
> |
S* |
||||||||||
|
|
> |
|
S |
|
) |
может служить |
показателем |
|
различного |
рода погрешностей, допускаемых в процессе измерений.
Одна из причин, |
вызывающих значимое превышение S*> S*, |
|
может заключаться в систематических ошибках, |
недостаточно |
|
корректно учтенных в |
регрессионном анализе. В частности, |
|
систематические ошибки могут нарушать условия |
независимости |
|
. В этом случае |
необходимо при описании |
результатов |
отдельно указать дисперсии независимых случайных колебаний
эмпирических средних |
ij. |
и отдельно - |
дисперсии |
корре |
||
лированных колебаний для всех |
<J\ |
(систематические |
ошиб |
|||
ки, см. 5 25). |
|
|
|
|
|
|
Обратное значимое |
неравенство |
> |
51 |
может ука |
зывать прежде всего на нарушения условий опыта при переходе от одной точки наблюдения к другой.
Другая причина - недостаточно полное описание кривой регрессии. Естественным шагом к устранению последнего недо статка является расширение описания:
|
т |
р(х,т) |
> { 2 2 Л Ъ ) |
хотя иногда целесообразно перейти к новой системе базионых функций (например, от разложения по степеням косинуоа - к полиномам Лежандра).
Собственно, такая процедура последовательного расширения (к сожалению, такое расширение не всегда ведет к улучшению представления) в описании кривой регрессии является' необходи мой, если теоретическое представление не известно точно. И здесь мы хотим подчеркнуть еще раз очевидное удобство, сіяван-