
- •2.2. Лабораторная работа №2 “ Компьютерная обработка результатов эксперимента ”
- •2.2.1. Постановка задачи регрессионного анализа
- •2.2.2. Математический анонс.
- •1.Предварительная обработка результатов эксперимента
- •2.Поиск оценок коэффициентов линейной регрессии.
- •3.Анализ остатков и выявление выбросов.
- •4.Проверка значимости влияния факторов на отклик.
- •5.Проверка адекватности регрессии.
- •2.2.3. Подготовка данных
- •2.2.4. Рекомендации по реализации алгоритма обработки данных в пакетеStatistica.
- •1. К предварительной обработке результатов эксперимента.
- •2. К поиску оценок коэффициентов линейной регрессии.
- •3.К анализу остатков и выявлению выбросов.
- •4. К проверке значимости влияния факторов на отклик.
- •5. К проверке адекватности регрессии.
- •2.2.5. Требования к оформлению лабораторной работы.
5.Проверка адекватности регрессии.
Визуально об адекватности модели можно судить по графику соответствия распределения остатков нормальному закону и по графику соответствия расчётных и экспериментальных значений отклика. Количественная проверка адекватности выполняется путём сравнения показателей, характеризующих рассеяние расчетных и экспериментальных значений отклика. Выбор показателей определяется особенностями постановки эксперимента.
В эксперименте выполнялись параллельные опыты. В этом случае дисперсия воспроизводимости S2воспр характеризует усредненную погрешность измерения отклика и, если отклики измерены с большой погрешностью, то большая величина
вряд ли связана с плохим выбором уравнения регрессии. Таким образом, для определения соответствия (адекватности) регрессии нужно сравнить остаточную дисперсию с величиной дисперсии воспроизводимости. Если различие дисперсий незначимо, модель следует признать адекватной. Для сравнения двух дисперсий используют критерийФишера
F = S2ОСТ/ S2воспр , (2.20)
по числу степеней свободы (см. Примечание ниже) остаточной дисперсии
f1=m-n-1
и числу степеней свободы дисперсии воспроизводимости
f2=m(L-1)
для заданного уровня значимости p (0.05) по распределению Фишера определяют Fт.
- Если значение F в (2.20) меньше или равно FТ, то модель адекватна с доверительной вероятностью 1 - p (95%).
- Если F > FТ, модель следует признать неадекватной.
Примечание. При расчете степеней свободы число опытов m и число факторов n берётся с учётом исключённых опытов и факторов.
В эксперименте отсутствуют параллельные опыты. В этом случае адекватность проверяют по коэффициенту детерминации (R2), который показывает насколько модель регрессии лучше модели среднего:
R2
= 1 -
(2.21)
-
сумма квадратов,
определяющая рассеяние экспериментальных
значений отклика относительно регрессии
=
,
-
сумма квадратов, определяющая рассеяние
измерений отклика относительно среднего
по всем опытам(
)
=
, где
.
Если
,томодель
регрессии
представляет данные примерно с той же
точностью, что и просто среднее и
использовать регрессию не имеет смысла.
В этом случае
1 и R2
0.
Если
<<
, то регрессия представляет
данные значительно точнее, чем просто
среднее и имеет смысл использовать
регрессию. При этом
0 и R2
1.Т.о.чем
ближе значение R2
к 1, тем с большей
уверенностью можно утверждать, что
регрессия адекватна. Коэффициент
детерминации интерпретируют, как долю
изменчивости отклика от факторов,
объясняемую регрессией. Например, R2
= 0.8означает, что
80% изменчивости Y
от X
объясняется
регрессией, а 20% - случайностью. В идеале
желательно иметь объяснение если не
для всей, то хотя бы для большей части
исходной изменчивости.
Более строго предположение о значимости доли изменчивости, объясняемой регрессией можно проверить по критерию F:
-
сумма квадратов, определяющая рассеяние
среднего экспериментального значения
отклика относительно регрессии
=
.
Очевидно, что чем больше F, тем лучше регрессия описывает экспериментальные данные по сравнению со средним. Учитывая, что
=
+
,
Fможновыразить через коэффициент детерминации
(2.22)
Для рассчитанного значения Fпо распределению Фишера можно вычислить уровень значимости p–level. Если p–level < 0.05, то с вероятностью 0.95 можно признать долю изменчивости, объясняемую регрессией значимой и модель адекватной. В противном случае – изменчивость объясняется случайностью и полученная регрессионная модель неприемлема.
Квадратный корень из коэффициента детерминации называется коэффициентом множественной корреляции R. R характеризует тесноту связи между факторами и откликом.