Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Гришин В.К. Статистические методы анализа результатов измерений учеб. пособие

.pdf
Скачиваний:
27
Добавлен:
23.10.2023
Размер:
4.93 Mб
Скачать

 

 

 

 

 

 

 

 

 

(21.2)

 

 

і - *

 

 

 

 

 

 

Откуда, требуя,

чтобы сумма

 

 

при этих

оценках

дости­

гала

минимума,

получаем уравнение

для их определения:

 

дії

,

 

 

 

 

 

 

 

 

ИЛИ

 

 

т-1

 

 

 

 

 

 

 

 

 

У. .

 

 

 

 

 

 

L

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(21.5)

 

Решение системы линейных уравнений (21.5) можно

найти,

например, методом

построения матрицы SK,

,

обратной SKK,

т . е . удовлетворяющей равенству

 

 

 

 

 

 

 

т.-і

 

 

/

при

к =

к"

 

 

 

 

 

 

 

 

 

 

 

 

 

н '

 

 

 

 

 

і

Л

при К*

C2I.6)

KmQ

 

 

[

0

К'

 

 

 

 

 

 

 

 

 

Тогда

оценки

о<

вычисляются как

 

 

 

 

гл-т

5 - - L я ; ' v .

Оценки

о(

являются несмещенными, т . е .

кк

vчем нетрудно убедиться, усредняя (21.7) по всем возможным случайным значениям у. :

Особый интерес представляет система "ортогональных" оазисных функций, удовлетворяющих условию

 

 

^ M ^ W W - ^ ^ ,

,

 

( 2 1 . 8 )

 

 

І-1

 

 

 

 

 

 

где

 

 

 

Л-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

/ у , - £ ц £ * ( х 4 ) .

 

 

( 2 1 . Р )

 

Базисные функции, удовлетворяющие уоловию ортогональ­

ности

на системе

гТ.

точек

X .

, значительно

облег-

чают

процедуру вычисления коэффициента

с(

. Для ортого­

нальных функций,

которые мы будем обозначать

как

£Ск(х),

матрицы

І / , .

и

Э ,

являются

диагональными, т . е .

Поэтому

х ~

 

 

£ ч ^ ч )

( 2 1 Л 1 )

Как мы увкдим в дальнейшем, представление,

основанное

на ортогональных

функциях, т . е .

 

обладает рядом

ценных свойств (упрощение расчетов является

их следствием),

что и позволяет

отдать

ему

"решительное"

предпочтение.

 

 

 

 

 

 

З А Д А Ч А

 

 

 

 

Базируясь

на эмпирических

средних

Ljf,

. . .,

построить

линейную регрессию.

Решение. Сначала определим ортогональные базисные поли­ номы. Полагаем

о7

Z4 * х - х .

Используя определения ортогональности, записываем

Отсюда

X = ) Ш.Х1 ; ц = ' у<

Следовательно,

линия

perреоси»

имеет вид

? =

<*0 +

( х " *

Ь

где

 

 

 

і

і

§ 22. Дисперсия коэффициентов регрессии Для оценки дисперсий коэффициента регреосии вычиолим

величину

 

 

 

 

 

 

 

tf«

= '

Я

г

(22.1)

Согласно

(21.7

)

имеем

 

 

 

 

 

 

і

 

 

 

Учитывая далее

соотношения

 

 

 

получаем

KS

поскольку б

US

=• 6 і -

 

 

 

Таким образом,

оценки коэффициента

регрессии

в общем

случае оказываются

коррелированными. Однако для ортогональ­

ных базисных функций матрица

S

является

диагональ­

ной, и оценки

не коррелированы,

т . е .

 

 

О

=

"

NK

(22.4)

Как мы отмечали, коэффициенты корреляции, равные и данном случае

указывают, насколько

близка

к линейной

свяьь меаду Ы

(§ 2). Если значения

| p^^j

близки

к единице, выбринкое

представление

m - i

 

 

f(X)~

2jXKBjx)-

(22.6)

нельзя считать удачным. Корреляция увеличивает диолерсию оценок и создает дополнительные вычислительные трудности.

Коррелированное^ оС^ означает, что соответствующие

члены

в представлении (22.6)

дублируют в большей или меньшей

 

степени друг друга. Поэтому соответствующую комбинацию

 

ОІ б

+

о ( 6

разумно

заменить новой функцией

Ы б .что

к

к

s

s

 

 

Є £

 

кромо

прочего щиводит к "экономии" средств опасения.

 

 

Для ортогональных

базисных функций

оценки

©(^

не кор-

релировани,

так что такое представление

является наиболее

D K O I I O U l t l J M .

Нооощо говори, заранее, еще до начала обработки, дотшлыю трудно указать наилучшее описание.

Эта проблема в значительной степени решается, если коэффици­ ентам регрессии придавать наглядный характер. Например, один параметр может характеризовать положение пика кривой,

другой

-

его ширину

и т . д . Так, из двух

запиоей

линейной

регрессии

» Ыд

+ ctff X

и

 

в Д

+ у3 4 (х - X )

пред­

почтение

следует отдать второй,

поскольку

коэффициент

ра

характеризует только

наклон

линии, а средняя высота ее опре­

деляется

только значением

Д

 

(ом.задачу § 21). Анало­

гично,

дли описания

пораболичеокой

кривой

ф(х)

целесооб­

разно

выбрать представление

у = О * &(% ~ с ) ' . в котором

каждый из параметров

Q , &

и

С

 

характеризует

различные

свойства кривой.

 

 

 

 

 

 

 

Обратимся теперь непосредственно к оценке

диоперскй

коэффициента регрессии. Вследствие (22.2), оценка дисперсии 6V. сводится к нахождению оценок объединенной дисперсии

б, определяемой согласно (20.8).

Первую оценку для б Я

мы можем получить непосред­

ственно из исходного соотношения

„ *

~1

1

 

S

= б =

•>

(22.7)

 

 

 

 

р

К

 

так как значения

С

ш

б.

/Xt

,

или хотя бы закон изменения

e>L

от точки к точке,предполагались известными.

 

Фактически \ эта оценка

сводится к вычислению первой

квадратичной формы

М

,

поскольку последняя содержит не­

смещенные оценки

дисперсий

g ? 1

результатов в каждой из

точек

наблюдения

ХА

.

Согласно (8.15)

Так что неонеценной оценкой

€ > 2 может служить соотноше­

ние

 

м

 

1 > - Л

С помощью мы можем сформулировать основные требования

к точности наблюдений в отдельных точках, необходимой для того, чтобы погрешность в определении коэффициента регрес­ сии, независимо от вида кривой, не превышала некоторой ве-

личини (для построения системы ортогональных базисных функ­

ций не

нужно знать эмпирические

значения

у.

) .

 

 

Вторая

несмещенная оценка

€ > г

мохет

быть получена

с помощью квадратичной формы

 

 

 

 

 

 

 

 

М г

-

У(у. -

£j*K

 

ZK(\))

,

(22.9)

среднее

значение которой равно (

 

сАк

-независимы)

 

 

 

Мг

« ^ . ( у Г ? . / =

 

б*(п.-т).

 

 

 

 

 

 

 

і

 

 

 

<5

 

 

 

Поэтому

второй

несмещенной

оценкой

является

 

 

 

5 * = - П = 1 _

-JL.

 

 

 

,

(22.10)

 

 

2

 

 

 

п. - пг

 

 

 

 

 

 

где

коэффициент

«К

находится

в соответствии с (21.11 ) .

 

Соотношение (22.10) включает разброс точек относительно

эмпирической

кривой регрессии. Поэтому

St

является,в

 

 

 

 

 

 

 

 

 

 

 

 

г 2

 

известной мере,более

объективной

оценкой,

чем

.

 

 

Полученные оценки обладают свойством стохастической неза­

висимости. В процессе

вычисления

 

St

и

St

, ш

раз­

били

исходную

квадратичную

сумму

М

, которая,очевидно,

имеет

 

 

распределение

с f=%Jt-i

степенями свободы,

на

М4

и

М2

(

ом. {20.5

) и'( 20.7

) ) . Последнюю

сумму после

преобразования

^. - ^

« (у.

-

p j + (p> - у.)

мы

разбиваем еще на две чаоти:

 

 

 

 

 

 

 

 

 

і

 

 

 

 

 

 

 

 

к.о

 

 

 

 

что

нетрудно

показать,

используя

свойства

ортогональности

Функций

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8аметим теперь, что число степеней свободы квадратичной

формы

М4

 

равно

^

=

~ 1

(имеется

 

М

соотно­

шений ^ Х

 

^УІУ

 

) ' fll ч и с

л о

степеней

свободы каждой

ив оумм в (22.9)

равно,соответственно,

ft

ж п - т

(суще­

ствует

Щ

связей,

накладываемые

на

у.

при оценке

о(к

)

и

f9

= т .

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда,

поскольку

$ = / f

+ ft

+ 4s

» т

и "»ем утверж­

дать

(используя еще pas теорему о разложении

 

X - роопреде­

ления),

что

М

и суммы в (22.8)

имеют

рС-раопреде­

ления о / , "

£ \ -

п . ;

ft»n-m.

 

и

£t= Гп.

 

степенями

свободы.

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

В чаотности,

оценки

 

 

л

і>г

могут

быть

пред­

ставлены

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

s l ' t ' - r -

;

 

s;

 

 

 

 

>

 

 

и г л * )

 

 

 

 

*

 

 

 

 

 

 

Та

 

 

 

 

 

 

Соотношения

(22.12)

дают

нам право

воспользоваться

методами

§

15 для сравнения оценок

of

 

и

о , .

 

 

Такое

сравнение

позволяет

эффективно

контролировать

ход

эксперимента,

так как несовпадение

оценок (

 

>

S*

 

 

>

 

S

 

)

может служить

показателем

 

различного

рода погрешностей, допускаемых в процессе измерений.

Одна из причин,

вызывающих значимое превышение S*> S*,

может заключаться в систематических ошибках,

недостаточно

корректно учтенных в

регрессионном анализе. В частности,

систематические ошибки могут нарушать условия

независимости

. В этом случае

необходимо при описании

результатов

отдельно указать дисперсии независимых случайных колебаний

эмпирических средних

ij.

и отдельно -

дисперсии

корре­

лированных колебаний для всех

<J\

(систематические

ошиб­

ки, см. 5 25).

 

 

 

 

 

 

Обратное значимое

неравенство

>

51

может ука­

зывать прежде всего на нарушения условий опыта при переходе от одной точки наблюдения к другой.

Другая причина - недостаточно полное описание кривой регрессии. Естественным шагом к устранению последнего недо­ статка является расширение описания:

 

т

р(х,т)

> { 2 2 Л Ъ )

хотя иногда целесообразно перейти к новой системе базионых функций (например, от разложения по степеням косинуоа - к полиномам Лежандра).

Собственно, такая процедура последовательного расширения (к сожалению, такое расширение не всегда ведет к улучшению представления) в описании кривой регрессии является' необходи­ мой, если теоретическое представление не известно точно. И здесь мы хотим подчеркнуть еще раз очевидное удобство, сіяван-

Соседние файлы в папке книги из ГПНТБ