Учебн. пособия-ОНИ / 1. Данько В.М._Алчевск-06
.pdf
m – число дублей в каждом опыте; yij – j-е значение дубля в i-том опыте;
уi – среднее значение отклика в i-то м опыте.
Вобщем случае неравномерного дублирования
|
åN åm (yij − yi ) 2 |
||
S2 (y)= |
i=1 j=1 |
|
(16.3) |
N |
|
||
|
(mi − 1) |
||
å |
|||
|
i=1 |
|
|
где mj – число дублей в i-том опыте.
Первая предпосылка регрессионного анализа предполагает по-
стоянство дисперсии воспроизводимости: σ2 (е) = сonst. После про-
ведения опытов, когда строчные дисперсии S2 (yi ) становятся извест-
ными, появляется возможность выяснить, обусловлены ли вариации
S2 (yi ) случайными причинами, или же в каждом опыте дисперсии помех действительно различны.
В случае равномерного дублирования для этой цели использует-
ся критерий Кохрена |
|
|
|
|
|
|
|
||
|
|
|
S2 (y |
i |
) |
|
|
|
|
G = |
|
max |
< Gf ,N,α |
(16.4) |
|||||
N |
|
|
|||||||
|
|
|
åS |
2 (yi ) |
|
||||
i=1
где S2 (yi )max – максимальная дисперсия в одном из опытов;
Gf ,N,α – табличное значение критерия Кохрена;
f = m-1 – число степеней свободы этого критерия.
Если условие (16.4) выполняется, то ряд дисперсий считается
111
воспроизводимым (однородным).
При неравномерном дублировании однородность строчных дисперсий проверяется по критерию Бартлетта
|
|
æ |
|
N |
N |
|
ö |
|
B = 2,3026 |
ç |
2 |
(y)åfi - åfi lgS |
2 |
÷ |
(16.5) |
||
çlgS |
|
|
(yi )÷ |
|||||
|
|
è |
|
i=1 |
i=1 |
|
ø |
|
где fi = mi - 1– число степеней свободы в i-том опыте.
Найденное по (16.5) значение |
|
|
|
сравнивается с критерием c2 |
||||||||||
|
|
B |
||||||||||||
при заданном уровне значимости |
|
|
α |
|
и |
|
|
числе степеней свободы |
||||||
f = N − 1 . Ряд дисперсий считается воспроизводимым, если: |
||||||||||||||
|
|
|
|
£ c2α,f . |
|
|
|
|
||||||
|
|
|
B |
|
|
|
|
|||||||
Значение критерия Бартлетта по (16.5) всегда довольно сильно |
||||||||||||||
завышено. Поэтому если оно сравнимо с |
c2α,f или немного его пре- |
|||||||||||||
вышает, то необходимо провести его уточнение: |
||||||||||||||
|
|
|
|
|
* = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B |
|
|
, |
|
|
|
||
|
|
|
|
B |
c |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где поправочный коэффициент с равен |
|
|
|
|
|
|
||||||||
|
æ N |
ö |
|
|
|
|
|
1 |
|
|
|
|||
ç |
|
|
|
÷ |
- |
|
|
|
|
|
|
|||
ç |
å1/ fi ÷ |
|
N |
|
|
|
||||||||
|
èi=1 |
ø |
|
|
|
åfi |
||||||||
c = |
|
|
|
|
|
|
|
|
i=1 |
|
(16.6) |
|||
|
3 |
|
|
|
|
|
|
|||||||
|
|
(N - 1) |
|
|
|
|
||||||||
и снова сравнить B* с c2α,f .
Абсолютная погрешность определения отклика в i-том опыте находится как доверительная оценка истинного значения случайной величины при неизвестной точности измерений
112
|
|
|
|
|
t(p,f ) |
|
|
|
|
|
i = |
|
A − yi |
|
< |
|
S2 (yi ) |
|
(16.7) |
||
|
|
|
||||||||
|
|
|
|
|
|
|
||||
|
|
|
m |
|||||||
|
|
|
|
|
|
|
|
|||
где t(p,f ) - значение критерия Стьюдента при уровне значимости α и
числе степеней свободы f = m − 1 .
Следует учитывать, что этот критерий двухсторонний и поэтому
α = 0,5q, где q = 1-р.
Полученные значения абсолютных погрешностей позволяют
сказать, что в i-том опыте значение отклика равно уi = yi± |
i . |
|
Относительная погрешность определения отклика в i-том опыте |
||
равна |
|
|
εi = |
i 100% , |
(16.8) |
|
yi |
|
где yi = среднее значение отклика в i-том опыте.
16.2 Статистический анализ регрессионной модели
После проведения регрессионного анализа получается модель объекта исследований в виде некоторой функции. В простейшем случае линейной регрессии она имеет вид
y= a0 + a1x1 + a2x2 + L+ anxn .
Вобщем случае не все коэффициенты регрессии аi в этой модели значимы, т.к. при выборе факторов обычно нет полной информации
остепени влияния каждого на отклик и поэтому приходится вводить в
эксперимент и те факторы, которые при данной точности исследования могут оказаться не существенными. Эти факторы теперь можно отсе-
ять проверкой значимости коэффициентов регрессии.
Регрессионный анализ всегда дает не нулевые величины коэф-
фициентов регрессии даже у заведомо не значимых факторов. Это про-
113
исходит из-за влияния случайных помех или наличия корреляции между факторами. Но обычно коэффициенты регрессии при таких факторах малы. Поэтому нужно проверить, достаточно ли они малы для того, чтобы можно было считать их отличие от нуля результатом вышеуказанных причин. Для отсеивания не значимых аi с некоторой вероятностью р используется t-критерий Стьюдента. Если
|
|
|
|
|
ai |
|
|
т |
|
|
|
|
ti |
= |
|
|
³ t |
,α |
|
(16.9) |
|||
|
Sai |
|
f1 |
|
|||||||
|
|
|
|
|
|
|
|
||||
то данный коэффициент регрессии значим. Здесь f |
1 |
= N(m - 1), а S2 – |
|||||||||
|
|
|
|
|
|
|
|
|
|
ai |
|
дисперсия i-го коэффициента регрессии |
|
|
|
|
|||||||
S2 |
= |
S2 (y) |
|
|
(16.10) |
||||||
|
m |
|
|
|
|||||||
|
ai |
|
|
|
|
|
|
|
|||
|
|
|
|
|
m |
åxij |
|
|
|
||
j=1
где xij – j-е значение i-го фактора. Этот критерий является односторонним.
Статистическая незначимость интерпретируется как отсутствие влияния данного фактора на отклик в исследованном интервале его изменения.
Если эксперимент активный и его план соответствует т.н. условию ортогональности, то незначимые коэффициенты регрессии просто удаляются из модели без пересчета остающихся. Если это условие не выполняется, что обычно и бывает в пассивных экспериментах, то отсеивание не значимых факторов следует начинать с того, у которого величина t - критерия минимальна. Этот фактор удаляется из матрицы экспериментальных данных и регрессионный анализ проводится повторно. В полученной регрессионной модели снова находят фактор с
114
минимальным t-критерием и повторяют вышеописанную процедуру до тех пор, пока в модели не останутся только значимые факторы.
Причины не значимости того или иного коэффициента регрессии могут быть принципиально различными. Данный фактор может действительно не влиять на отклик. Но незначимость может быть следствием и того, что его влияние не проявилось на фоне сильных помех. Поэтому процедуру отсеивания не автоматизируют, оставляя возможность анализа аргументов в пользу сохранения некоторых незначимых факторов в модели.
Проверка адекватности модели производится для того, чтобы выяснить, правильно ли выбран вид функции регрессии. При этом используется принцип сопоставления с «шумом». Проверке подвергается обычно модель со всеми значимыми аi. Она возможна, если:
1. С помощью дублирования опытов получена оценка дисперсии эксперимента S2 (y) .
2 Выполнено условие N > d+1, где d –число коэффициентов регрессии в модели. Если N ≤ d+1, то проверять адекватность нет смысла, поскольку поверхность откликов, соответствующая регрессии, будет проходить точно через все экспериментальные точки.
Идея проверки адекватности состоит в том, что сопоставляются
дисперсия неадекватности Sнеад2 и оценка дисперсии эксперимента
S2 (y) . При равномерном дублировании опытов
|
N m |
2 |
|
|
&&& |
|
|
||
|
å å(yij − yi ) |
|
|
|
Sнеад2 = |
i=1j=1 |
|
, |
(16.11) |
mN(d + 1) |
|
|||
|
|
|
|
|
115 |
|
|
|
|
где &y&&i – расчетное по уравнению регрессии значение отклика в і-том опыте.
При неравномерном дублировании
|
|
N |
2 |
|
|
|
&&& |
|
|
||
|
|
åmi (yi − yi ) |
|
||
S2 |
= |
i=1 |
|
, |
(16.12) |
N |
|
||||
неад |
|
|
|
|
|
|
|
åmi − (d + 1) |
|
||
i=1
где уі – среднее экспериментальное значение отклика в і-том опыте.
Если модель не адекватна, то Sнеад2 будет оценивать и некото-
рую дополнительную компоненту рассеивания, обусловленную погрешностью аппроксимации
Sнеад2 = S2 (y)+ Sап2
Т.о. если Sнеад2 не случайным образом больше S2 (y) , то модель
неадекватна. Следовательно, нужно проверить гипотезу
H0 : σнеад2 = σ2 (y) |
|
|
||||
H1 : σнеад2 |
> σ2 (y) |
|
|
|||
Для проверки используется критерий Фишера |
|
|||||
F = |
Sнеад2 |
|
≤ Fт |
, |
(16.13) |
|
S2 (y) |
||||||
|
ν1,ν2 ,α |
|
|
|||
где ν1– число степеней свободы дисперсии не адекватности
ν1 = mN - (d+1);
ν2– число степеней свободы дисперсии эксперимента
ν2 = N(m-1).
Этот критерий является односторонним.
116
Проверка работоспособности модели необходима вследствие того, что даже адекватная модель со всеми значимыми коэффициентами регрессии может оказаться практически бесполезной из-за своей низкой точности. Производится по коэффициенту детерминации
|
|
|
N |
|
|
|
|
|
å(yi - yi ) |
||
|
|
|
|
&&& 2 |
|
|
|
R2 = |
i=1 |
|
(16.14) |
|
|
N |
|
||
|
|
|
(yi - y)2 |
||
|
|
å |
|||
|
|
|
i=1 |
|
|
где |
&&& |
- значение отклика в i-том опыте по регрессионной модели; |
|||
y |
|||||
y – среднее значение отклика в эксперименте.
По определению R2 может изменяться от 0 до 1. Если R2 =0, то тогда изменение отклика полностью обусловлено случайными причи-
нами, а влияния факторов эксперимента нет. Если R2 = 1, то нет влияния случайных причин и линия регрессии проходит точно через все
экспериментальные точки. Чем ближе R2 к 1, тем модель лучше. Кри-
тическое значение R2 определяется из того условия, что ошибка предсказания отклика по уравнению регрессии должна быть в 2 раза мень-
ше, чем по y . Отсюда следует условие работоспособности: R2 ³ 0,75 .
Далее следует расчет коэффициента корреляции модели (см.
п. 13.1).В случае МРА рассчитывается множественный коэффициент корреляции R (см. п. 13.2). Если R ≥ 0,9, то это значит, что модель полна и учитывает все существенно влияющие на отклик факторы. Если R< 0,87– модель не полна и следует эксперимент повторить, введя в
него ранее не учтенные факторы.
Определение точности регрессионной модели производится
117
так же, как и точности эксперимента, но вместо дисперсии эксперимента используется дисперсия неадекватости.
Абсолютная погрешность определения отклика по регрессионной модели:
′ = |
|
′ − y |
|
< |
t(p,f ) |
|
S2неад |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|||
|
|
|
mN |
|
|||||
|
|
|
|
|
|
|
|||
где t(p,f ) - значение критерия Стьюдента при уровне значимости α и
числе степеней свободы при равномерном дублировании f = mN(d + 1) .
Следует учитывать, что этот критерий двухсторонний и поэтому
α = 0,5q, где q = 1-р.
Относительная погрешность определения отклика по регрессионной модели равна
′
ε = y′ 100% ,
где y′ = среднее значение отклика по регрессионной модели.
16.3 Интерпретация результатов эксперимента Интерпретация (истолкование) результатов эксперимента не-
обходима для понимания механизма исследуемого явления, создания его теории или включения в существующую теорию, что позволит получать новую информацию, выходящую за рамки проведенного исследования. Осуществляется посредством эрудиции исследователя эвристическими методами и является процессом не формализуемым. Однако для облегчения интерпретации рекомендуется представлять полученные в результате эксперимента данные в наглядной форме – в виде графиков.
118
Для однофакторных экспериментов это не представляет трудностей. Однако и при наличии более, чем одного фактора, также возможна графическая интерпретация. Например, зависимость отклика у от двух факторов х1 и х2 можно представить в виде (рис.16.1):
у |
х2=с1 |
|
х2=с2 х2=с3
х1
Рисунок 16.1 – Графическая интерпретация эксперимента
Т.о. на плоскости видно одновременно влияние обоих факторов. Можно также представить такое влияние и в пространстве, построив т.н. поверхность отклика (рис. 16.2):
у
х1
х2 |
Рисунок 16.2 – Поверхность отклика |
|
119 |
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА ОСНОВНАЯ
1.Філіпенко А.С.Основи наукових досліджень. К.: Академвидав, 2005.- 207с.
2.Чижиков Ю.М. Теория подобия и моделирование процессов ОМД.- М.: Металлургия, 1970.-295с.
3.Статистические методы в инженерных исследованиях: Лаб. практикум /Под ред. Круга Г.К.- М.: Высшая школа, 1983.-216с.
4.Фёрстер Э., Рёнц Б.. Методы корреляционного и регрессионного анализа.- М.: Финансы и статистика, 1983.-302с.
ДОПОЛНИТЕЛЬНАЯ
5.Білуха М.Т. Основи наукових досліджень. К.: ”Вища школа”, 1997.- 270с.
6.Наринян А.Р.. Поздеев В.А. Основы научных исследований. К.: Изд-
во Европ. ун-та., 2002.-109с.
7.Воробьев В.Я., Елсуков А.Н. Теория и эксперимент. Минск.: «Вы-
шейша школа», 1989.-110с.
8.Шенк Х. Теория инженерного эксперимента.- М.: Мир, 1972.-381с.
9.Гухман А.А. Введение в теорию подобия.- М.: Высшая школа, 1963.- 254с.
10.Ивашев-Муратов О.С. Теория вероятностей и математическая ста-
тистика.-М.: Наука, 1979.-255с.
11.Дрейпер Н, Смит Г. Прикладной регрессионный анализ.- М.: Фи-
нансы и статистика, 1987,-т.1.-366с.,т.2.-351с.
12.Смирнов В.Н., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики. М.: «Наука», 1969.-584с.
120
