Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы теории эксперимента / Теория и методы экспpdf.pdf
Скачиваний:
226
Добавлен:
17.04.2015
Размер:
1.32 Mб
Скачать

6.4.Регрессионный анализ

Как и корреляционный анализ, регрессионный включает в себя построение уравнения регрессии (например, методом наименьших квадратов) и статистическую оценку результатов.

При проведении регрессионного анализа принимаются следующие допущения:

1.Входной параметр х изменяется с весьма малой ошибкой. Появление ошибки в определении у объясняется наличием в процессе не выявленных переменных и случайных воздействий, не вошедших

вуравнение регрессии.

2.Результаты наблюдений выходной величины – независимые нормально распределенные случайные величины.

3.При проведении параллельных опытов выборочные дисперсии должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений, а это

возможно осуществлять при наличии однородных дисперсий (т.е. принадлежности экспериментальных данных к одной генеральной совокупности).

После того, как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в установлении адекватности уравнения и проверке значимости коэффициентов уравнения.

6.4.1. Проверка адекватности модели

Регрессионная модель называется адекватной, если предсказываемые по ней значения у согласуются с результатами наблюдений. Так, построив линейную модель, мы хотим убедиться, что никакая другая модель не даст значительного улучшения в описании предсказания значений у. В основе процедуры проверки адекватности модели лежат предположения, что случайные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковыми дисперсиями.

Сформулируем нуль-гипотезу Н0: «Уравнение регрессии адекватно».

119

Альтернативная

гипотеза

 

Н1:

«Уравнение

регрессии

неадекватно».

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки этих гипотез принято использовать F-критерий

Определяется«µ

 

 

 

 

 

 

 

 

 

 

 

 

 

«µ å æ

 

Фишера.

При

 

этом общую дисперсию (дисперсию выходного

параметра)

 

 

сравнивают

 

с

 

остаточной

дисперсией

 

 

.

 

 

 

 

 

 

 

 

 

 

«µ

 

 

 

 

 

 

 

 

 

 

 

экспериментальное значение F- критерия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Который в данном случае

показывает, во сколько раз уравнение

 

 

«µ å æ

 

 

 

 

 

 

( ª

 

( Ù çè ¹x

 

 

g

 

опытов

лучше,

чем среднее

регрессии

 

предсказывает

результаты

 

 

 

 

 

 

 

 

 

Если

 

 

§ то уравнение регрессии

адекватно.T

 

Чем

больше значение

 

 

превышает

 

 

для

выбранного α и числа степеней

свободы

 

 

 

тем

 

 

 

 

 

 

§

 

 

эффективнее уравнение регрессии.

 

 

 

3 = 3 = 9

 

 

Рассмотрим

 

случай,

когда

 

для

 

 

повышения надежности

и

достоверности осуществляется не одно, а m параллельных опытов (примем, что это число одинаковым для каждого фактора). Тогда общее число экспериментальных значений величины у составит

N=n*m.

В этом случае оценка адекватности модели производится

следующим образом:

среднее из серии параллельных опытов:

ª8T (8é

 

1. определяется

2.

рассчитываются

значения

параметра

 

по уравнению

 

3

 

 

 

ªTV(˜ =

регрессии

 

 

 

 

3.

рассчитывается

дисперсия адекватности:«êÒ

(Þ W 4.

определяются

выборочные дисперсии для

параллельных

опытов

«

ªàÀšà#µ˜ ]u

 

 

 

 

 

 

#

 

 

 

 

120

 

5. Определяется дисперсия

воспроизводимости «ìå í

ªT

« é

Число степеней

свободы

этой

дисперсии равно Y

36=.

 

 

 

 

 

 

 

 

 

 

Определяется экспериментальное значение критерия Фишера:

«êÒî«ìå í

3 =

 

 

 

8.

Если

3 = 9 37,

 

в

 

7.

Определяется теоретическое значение критерия Фишера

§, где

 

 

 

 

 

 

 

 

 

случае –§нет.

то уравнение

регрессии адекватно,

 

 

 

 

 

 

L

 

противном

 

 

 

 

 

6.4.2. Проверка значимости коэффициентов уравнения

Надежность

оценок

регрессии

 

 

 

 

 

 

уравнения

регрессии

можно

охарактеризовать их

доверительными интервалами

 

в которых с

 

0

 

 

значение

этого

заданной вероятностью находится истинное

 

10

 

 

параметра.

Наиболее просто построить доверительные интервалы для

0

коэффициентов линейного уравнения регрессии, т.е. коэффициенты

.

Для линейного уравнения среднеквадратическое отклонение i-ого

коэффициента уравнения регрессии

«t

можно определить по закону

накопления ошибок

 

 

 

 

 

 

 

 

 

 

 

 

 

 

á08

 

 

 

 

 

 

«t ïR ð

á(

ñ «8

 

 

 

 

 

8T

 

 

 

 

 

 

 

простейшего уравнения

¹µ ¹µ

™ ¹µ ¹ìå í

 

При условии, что

регрессии

( 0*

0 "

:

 

, получим для

 

 

 

 

 

 

 

 

«ìå í ªT

"

" ¦

 

«tò © ªT

"

= ¥ªT

 

121

«tš ©

 

«ìå í

 

 

 

 

 

Проверка значимости

 

ªT "

= ¥ªT " ¦

 

 

коэффициентов выполняется по критерию

Стьюдента. При этом в качестве нуль-гипотезы проверяется: i-ый коэффициент уравнения регрессии отличен от нуля.

Построим доверительный интервал для коэффициентов

уравнения регрессии

10 x¤ #ë«t

 

где число степеней

Стьюдента определяется

 

свободы в критерии

по соотношению n-l. Потеря l=k+1 степеней свободы обусловлена тем, что все коэффициенты рассчитываются зависимо друг от друга.

Тогда доверительный интервал для каждого из коэффициентов

уравнения регрессии составит

 

Чем уже

доверительный интервал, тем с

большей уверенность можно говорить

 

0 = 10 0 10

 

о значимости этого коэффициента.

Основное правило при построении доверительного интервала для

коэффициентов: «Если абсолютная величина коэффициента

регрессии больше, чем его доверительный интервал, то этот коэффициент значим». Другими словами, если

Œ0 Œ g Œ10 Œ то 0

коэффициент значим, в противном случае – нет.

Незначимые коэффициенты исключаются из уравнения регрессии, а остальные коэффициенты пересчитываются заново, так как они зависимы и в формулы для их расчета входят разноименные переменные.

Задача сводится к определению критерия, позволяющего установить, принадлежать ли эти выборки одной генеральной совокупности?

122