Лекции ХТП / Тема-2
.pdf
41 Тема 02: Построение эмпирических статистических моделей ХТП
§4. Регрессионный и корреляционный анализ
Определение коэффициентов линейной или линеаризованной модели вида:
m |
x |
y a j j |
|
ˆ |
|
j 0 |
|
методом аппроксимации (конкретно МНК) приводит к матричной формуле:
|
T |
|
1 |
T |
|
|
|
|
|||||
|
|
|
|
|
||
a |
|
|
|
y |
|
|
|
|
|
|
|
|
|
где значения элементов матрицы независимых переменных
входных переменных |
и вида функций |
x |
: |
||
|
x |
|
|
|
|
0 x1 |
1 x1 |
... |
m x1 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
... |
|
|
x |
|
|
|
|
|
||||||||
|
|
||||||||||
0 |
2 |
1 |
2 |
|
|
m |
2 |
|
|||
n m 1 |
|
|
... |
... ... |
|
||||||
|
|
|
... |
|
|||||||
|
|
|
|
x |
|
x |
... |
|
m |
x |
|
|
|
|
0 |
n |
1 |
n |
|
|
n |
|
|
зависят только от
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
42 Тема 02: Построение эмпирических статистических моделей ХТП
Вектор экспериментальных значений (вектор наблюдений)
y
присутствует в
этом матричном соотношении в качестве линейного сомножителя.
Поэтому целесообразно ввести матрицу L
|
T |
|
1 |
|
T |
|
|
||||
|
|
|
|
||
L |
|
|
|
|
|
|
|
|
|
|
|
После чего матричную формулу МНК для определения коэффициентов модели можно записать:
ˆ |
|
a Ly |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
43 Тема 02: Построение эмпирических статистических моделей ХТП
|
|
|
|
|
|
|
|
ˆ |
|
Статистический анализ результатов вычисления |
a |
необходим, так как |
|||||||
|
|||||||||
вектор |
y |
|
, который влияет на значения |
ˆ |
, является случайным вектором (это |
||||
|
|||||||||
|
|
a |
|||||||
приводит к тому, что |
a |
- также случайный вектор). |
|
||||||
Причины случайного характера вектора измерений:
y |
|
, |
|
полученного в результате опытных
•используется случайная выборка
•результаты измерения каждого
|
y |
|
y |
|
|
i |
||
|
;
- случайные величины.
Один из видов статистического анализа – регрессионный анализ – предполагает, что компоненты вектора - случайныеyвеличины, распределённые по нормальному закону распределения, т.е. для плотности распределения (i – го измерения) будетYi справедливо:
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
44 Тема 02: Построение эмпирических статистических моделей ХТП
|
|
|
1 |
|
1 |
Y m |
y |
|
|
|
|
f Y |
|
|
exp |
i |
|
i |
|
i 1,...n, |
|||
|
|
|
|
|
|
|
|||||
i |
|
|
2 |
|
2 |
|
2 |
|
|
|
|
|
|
i |
|
|
|
|
i |
|
|
|
|
|
|
Y |
|
|
|
|
Y |
|
|
|
|
т.е. числовыми характеристиками случайной величины Yi будут:
m |
yi |
- |
математическое ожидание |
||
|
|
|
|
|
|
|
2 |
- |
дисперсия |
||
|
yi |
|
|
|
|
|
yi |
|
2 |
- среднеквадратичное отклонение или стандарт. |
|
|
|
|
yi |
|
|
Допущение о нормальном законе распределения компонентов вектора Первое допущение регрессионного анализа.
y |
|
|
- это
Второе допущение регрессионного анализа – о неслучайности компонентов вектора x , т.е. xi - неслучайные величины.
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
45 Тема 02: Построение эмпирических статистических моделей ХТП
Из этих двух допущений следует, что в соответствии со свойством линейности нормального закона распределения
компоненты вектора
a
aLy
вуравнении регрессии также являются случайными
величинами, распределёнными по нормальному закону, т.е. также могут характеризоваться следующими числовыми характеристиками:
m |
a |
|
|
||
2 |
||
|
||
a |
||
j
j
-математическим ожиданием
-дисперсией
|
a |
|
j |
- среднеквадратичным отклонением или стандартом
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
46 Тема 02: Построение эмпирических статистических моделей ХТП
Третье допущение регрессионного анализа заключается в допущении об
однородности дисперсии случайных величин |
Y |
|
|
i . Свойство однородности |
|||
предполагает несущественное отличие дисперсий |
Y |
-ых, что позволяет |
|
i |
|||
усреднять их оценки или значения, полученные по ограниченным выборкам и распространять на всю исследуемую область, и проверяется с помощью специальных критериев, которые здесь не рассматриваются.
В соответствии с регрессионным анализом всегда рассчитывается оценка
коэффициентов
ˆ a
ˆ |
э |
a Ly |
|
в результате получается приближенная зависимость:
m
yˆ aˆ j j x .
j 0
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
47 Тема 02: Построение эмпирических статистических моделей ХТП
Для получения строгой зависимости и т.к. зависимость математического ожидания
уравнением регрессии:
Y – mY
случайная величина – необходима
от значений |
x |
, называемая |
|
|
x
a |
j |
|
|
|
|
|
m |
|
|
x |
m |
|
|
|
|
a |
|
|
|
|
||||||
Y |
|
x |
|
j |
j |
|
|
|
|
|
j 0 |
|
|
|
|
|
|
|
|
|
|
|
-истинные значения коэффициентов регрессии, называемых теоретическими коэффициентами регрессии;
m |
y |
m |
|
|
Y |
x |
|
|
|
|
-условное математическое ожидание случайной величины Y.
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
48Тема 02: Построение эмпирических статистических моделей ХТП
4.1Этапы регрессионного анализа
1.Определение оценок коэффициентов регрессии МНК
2.Определение значимости коэффициентов регрессии, т.е. существенного отличия их от нуля с помощью t – критерия Стьюдента
3.Определение адекватности уравнения регрессии с помощью F – критерия Фишера
4.2 Определение числовых характеристик случайных величин измерений выходной переменной
m |
M Y |
|
y |
|
x |
|
|
- вектор математических ожиданий
Для дисперсий yi и y j справедливо:
y2 |
M yi |
my 2 |
i 1,...n |
i |
|
i |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
49 Тема 02: Построение эмпирических статистических моделей ХТП
Ковариация двух случайных величин равна математическому ожиданию
произведения Yi |
my Yj my |
|
|
|
|
|
|
|
i |
|
j |
|
|
|
|
COVyi y j |
M Yi myi |
Yj |
my j |
|
|||
|
i 1,...n; |
j 1,...n; |
i j |
|
|||
Для независимых нормально - распределённых случайных величин
Y и Y |
j |
i |
COV |
0 |
y y |
j |
i |
Для нормально-распределённых случайных величин вместо размерной
величины |
COV |
целесообразно пользоваться коэффициентом корреляции: |
y y |
||
|
i |
j |
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
50 Тема 02: Построение эмпирических статистических моделей ХТП
r |
|
|
COV |
y y |
|
i 1,...n; |
j 1,...n |
|||||
|
|
|
|
|
|
i |
|
j |
||||
|
|
|
|
|
|
|
|
|
|
|
||
y y |
|
|
|
|
|
|
|
|
|
|
|
|
i |
j |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
y |
i |
|
|
y |
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Для линейно-зависимых случайных величин
y |
i |
и y |
j |
|
|
А для независимых -
ryi y
ryi y
1
j
0 j
|
|
|
Для дисперсий |
2 |
в n |
y |
дисперсий – ковариаций:
экспериментальных точках создаётся матрица
COVy M y my y my T
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
