
- •Лабораторная работа
- •1. Введение.
- •1. Введение.
- •1.1. Цель и задачи работы.
- •1.2. Исходные данные, соответствующие конкретному варианту.
- •1.3. Описание задачи статистического анализа (формулировка проблем, необходимые формулы, соответствующие варианту задания).
- •1 Часть
- •2 Часть
- •2. Расчётная часть.
- •2.1.1. Расчёты 1 части.
- •2.1.2. Анализ результатов.
- •2.1.3. Предварительные выводы.
- •2.2.1. Расчёты 2 части.
- •2.2.2. Анализ результатов.
- •2.2.3. Выводы по первому модулю.
- •Введение.
- •Характеристика регрессионного анализа, назначение регрессионных моделей, цель и задачи работы.
- •Исходные данные, соответствующие конкретному варианту.
- •Описание содержания регрессионного анализа (формулировка проблемы, необходимые формулы).
- •Расчётная часть (расчёты, анализ результатов).
- •Заключение.
Описание содержания регрессионного анализа (формулировка проблемы, необходимые формулы).
В данной работе нам надо определить лучшее уравнение регрессии (функцию отклика), объясняющую вариацию сопротивления стеклоткани Y от вариации сопротивления X1 смолы и зазором валика X2.
Всего в данной работе мы рассмотрим 8 различных 8 уравнений регрессии вида:
1)Y=b0 + b1*x1;
2)Y=b0 + b1*x2;
3)Y=b0 + b1*x1 + b2*x2;
4)Y=b0 + b1*x1 + b2*x1*x2;
5)Y=b0 + b1*x1*x2 + b2*x2;
6)Y=b0 + b1*x1 + b2*x1^2;
7)Y=b0 + b1*x2^2 + b2*x2;
8)Y=b0 + b1*x1^2*x2^2.
Уравнения 1, 2, 8 отражают парную регрессию вида:
Y = b0 + b1*P;
Формулы расчёта коэффициентов регрессии для них следующие:
где P – единственный фактор формулы, M(P) – математическое ожидание:
Таблица 2. Интерпретация значений P
Номер формулы № |
1 |
2 |
8 |
Значение P |
X1 |
X2 |
X1*X2 |
Уравнения 3, 4, 5, 6, 7 отражают множественную регрессию от 2-х факторов вида:
Y = b0 + b1*P + b2*Q;
Для них уже следует вывести формулы коэффициентов регрессии.
Воспользуемся методом наименьших квадратов (МНК).
Функция потерь Q(b0,b1,b2) есть сумма квадратов отклонений переменной Y от функции отклика согласно модели. Наша задача – сделать её значение минимальным, что выполняется в точке её экстремума. Сама она ограничена снизу, значит, нужно построить множество формул производных Q(b0,b1,b2) от каждого из коэффициентов регрессии (по количеству этих коэффициентов). Каждая производная будет приравнена к нулю. После чего решаем полученную СЛАУ и находим b0, b1 и b2.
В нашем случае СЛАУ состоит из 3-х уравнений:
b0 + b1*M(P) + b2*M(Q) = M(Y);
b0*M(P) + b1*M(P^2) + b2*M(Q*P) = M(Y*P);
b0*M(Q) + b1*M(P*Q) + b2*M(Q^2) = M(Y*Q);
Таблица 3. Интерпретация значений под коэффициентами регрессии и их производных.
№ |
3 |
4 |
5 |
6 |
7 |
P |
X1 |
X1 |
X1*X2 |
X1 |
X22 |
Q |
X2 |
X1*X2 |
X2 |
X12 |
X2 |
P2 |
X12 |
X12 |
X12*X22 |
X12 |
X24 |
Q2 |
X22 |
X12*X22 |
X22 |
X14 |
X22 |
P*Q |
X1*X2 |
X12*X2 |
X1*X22 |
X13 |
X23 |
Y |
Y |
||||
Y*P |
Y*X1 |
Y*X1 |
Y*X1*X2 |
Y*X1 |
Y*X22 |
Y*Q |
Y*X2 |
Y*X1*X2 |
Y*X2 |
Y*X12 |
Y*X2 |
Переведём её в упрощённый вид:
b0 + b1*m1 + b2*n1 = z1;
b0*k2 + b1*m2 + b2*n2 = z2;
b0*k3 + b1*m3 + b2*n3 = z3;
Таблица 4. Перевод упрощённых значений в формуле.
Значение |
m1 |
n1 |
z1 |
k2 |
m2 |
n2 |
z2 |
k3 |
m3 |
n3 |
z3 |
Перевод |
M(P) |
M(Q) |
M(Y) |
M(P) |
M(P2) |
M(Q*P) |
M(Y*P) |
M(Q) |
M(P*Q) |
M(Q2) |
M(Y*Q) |
Не будем вкладывать вывод формул, сразу выпишем решение коэффициентов:
Для дисперсионного анализа по всем 8-ми функциям отклика f составим некоторые уравнения:
TSS = Σ( (Y – f)2 )/n;
RSS = Σ( (f – M(Y))2 )/n;
ESS = Σ( (Y – M(Y))2 )/n;
Тогда коэффициент детерминации равен
R2 = 1 – ESS/TSS;
Коэффициент детерминации R2 как критерий точности (относительно функции отклика) показывает отношение части вариации переменной Y за счёт воздействия вариации факторов, входящих в уравнение регрессии, к общей вариации переменной Y относительно математического ожидания.
Для проверки статистической значимости уравнений регрессии воспользуемся критерием Фишера.
H0: R2 = 0; - незначимость модели
H1: R2 > 0; - значимость модели
k – количество параметров модели, в случаях линейной регрессии
(парной – 1, множественной от трёх – 2);
N – количество измерений (во всех случаях 30);
Сравним полученное значение с Fкрит (1-α квантилем Распределения Фишера):
Если F >= Fкрит 1-α(k,n-k-1), то гипотеза H0 «отвергается», и уравнение регрессии считаем статистически значимым, а значит в достаточной степени объясняющую зависимость.