- •4 Методы регрессионного и корреляционного анализов
- •4.1 Регрессионный анализ
- •4.1.1 Основные термины и понятия
- •4.1.2 Вид функции для математической модели.
- •4.1.3 Метод наименьших квадратов
- •4.1.4 Схемы регрессионного анализа
- •4.2 Методы корреляционного анализа. Лекция 6
- •4.2.1 Метод парной корреляции.
- •4.2.2 Метод множественной корреляции.
4.1.4 Схемы регрессионного анализа
После вычисления коэффициентов уравнения регрессии bi приводят статистическую обработку результатов (регрессионный анализ).
В зависимости от наличия сведений о дисперсии воспроизводимости параметра оптимизации (S2воспр) регрессионный анализ проводят по различным схемам.
Первая схема регрессионного анализа проводится при наличии параллельных опытов, то есть каждый эксперимент проводится не менее, чем два раза – опыты дублируются.
Первая схема регрессионного анализа проводится в следующем порядке:
-
Вычисляют построчные (частные) математические ожидания (yi ):
(4.13)
где yi – экспериментальные значения у параллельных опытов;
m – количество параллельных опытов.
-
Вычисляют построчные дисперсии (Si2):
, (4.14)
-
Проверяют однородность дисперсий:
При одинаковом количестве опытов по критерию Кохрена (Gр).
(4.15)
где Smax2 – максимальная построчная дисперсия;
n – количество опытов в матрице.
Полученное Gр сравнивают с табличным (Gтабл). Если Gр< Gтабл – дисперсии однородны и можно продолжить расчёт дальше. В противном случае дисперсии неоднородны и необходимо эксперимент, соответствующий максимальной дисперсии, провести более точно заново, а затем повторить проверку однородности дисперсий.
-
Вычисляют общую дисперсию воспроизводимости (S2воспр)
, (4.16)
при степени свободы fвоспр=(m-1)n.
-
Проверяют значимость коэффициентов уравнения регрессии по критерию Стьюдента (tр):
(4.17)
где Sbi2 – дисперсия коэффициента bi.
Если tр>tтабл при =0,05 и f=fвоспр, то коэффициент bi значимо отличается от нуля, то есть фактор, соответствующий этому коэффициенту оказывает существенное влияние на процесс. В противном случае коэффициент bi незначим, фактор, соответствующий ему, влияния на процесс не оказывает и из уравнения исключается.
Дисперсия коэффициента bi определяется по закону накопления ошибок:
, (4.18)
Если выборочные дисперсии однородны, получим:
(4.19)
, (4.20)
Оставшиеся, значимые коэффициенты bi пересчитывают заново, поскольку матрица не ортогональна и коэффициенты bi закоррелированы друг с другом.
-
Проверяют адекватность уравнения регрессии.
Адекватность – соответствие полученной математической модели реальному процессу.
Проверку проводят по критерию Фишера (Fр).
(4.21)
где Sад2 – дисперсия адекватности.
(4.22)
где – расчётный параметр оптимизации;
L– количество значимых коэффициентов bi.
Полученный Fр сравнивают с Fтабл. Если Fр<Fтабл – уравнение адекватно. В противном случае уравнение неадекватно и следует перейти к планам более высокого порядка.
Критерий Фишера находят по таблицам по степеням свободы числителя (fч) и знаменателя (fз).
fч=(n-L);
fз=n(m-1).
Вторая схема регрессионного анализа применяется при отсутствии информации о дисперсии воспроизводимости, то есть отсутствии параллельных опытов, и проводится в следующем порядке:
-
Рассчитывают математическое ожидание столбца yi:
(4.23)
-
Рассчитывают дисперсию столбца yi:
, (4.24)
-
Проверку значимости коэффициентов bi аналогично первой схеме провести невозможно, так как отсутствует S2воспр. Поэтому существенность влияния факторов определяют методом парной корреляции (см. метод ПК).
-
Проверку адекватности уравнения регрессии произвести невозможно, так как отсутствует дисперсия воспроизводимости. В этом случае можно оценить качество аппроксимации принятым уравнением, сравнив остаточную дисперсию (S 2 ост) и выборочную дисперсию (S 2 y).
Вычисляют дисперсионное отношение (с):
(4.25)
где S2ост – остаточная дисперсия (S2ост=S2воспр+S2ад),
и сравнивают его с критерием Фишера. Если с>Fтабл – качество описания процесса полученным уравнением хорошее, и чем больше значение с превышает Fтабл, тем эффективнее уравнение регрессии. В этом случае критерий Фишера показывает, во сколько раз уменьшается рассеяние относительно полученного уравнения регрессии по сравнению с рассеянием относительно среднего ().
Fтабл находят по степени свободы числителя fч=(n-L) и степени свободы знаменателя fз=(n-l).