v0.5.7.final / Тема 2
.pdf41 Тема 02: Построение эмпирических статистических моделей ХТП
§4. Регрессионный и корреляционный анализ
Определение коэффициентов линейной или линеаризованной модели вида:
m
yˆ a j j x
j 0
методом аппроксимации (конкретно МНК) приводит к матричной формуле:
|
|
T |
|
|
1 |
|
T |
|
|
|
|
||||
|
|
|
|
|
|
||
a |
|
|
y |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где значения элементов матрицы независимых переменных |
зависят только от |
|||||
|
|
|
|
x |
|
|
входных переменных |
и вида функций |
|
|
|||
: |
|
|
||||
|
x |
|
|
|
|
|
|
|
|
|
x |
|
x ... |
|
m |
x |
|
||||
|
|
|
|
0 |
1 |
|
1 |
1 |
|
|
|
1 |
|
|
|
|
|
|
x |
|
|
x |
... |
|
|
|
x |
|
|
|
|
|
|
|
||||||||||
|
|
|
||||||||||||
|
0 |
2 |
|
1 |
2 |
|
|
m |
2 |
|
||||
n m 1 |
... |
|
... ... |
|
|
... |
|
|||||||
|
|
|
|
|
x |
|
|
x |
... |
|
|
|
x |
|
|
|
|
|
m |
|
|||||||||
|
|
|
|
0 |
n |
|
1 |
n |
|
|
n |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
42 Тема 02: Построение эмпирических статистических моделей ХТП
Вектор экспериментальных значений (вектор наблюдений) y присутствует в этом матричном соотношении в качестве линейного сомножителя.
Поэтому целесообразно ввести матрицу L
|
|
|
T |
|
|
|
1 |
|
|
|
T |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
||
L |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
После чего матричную формулу МНК для определения коэффициентов модели можно записать:
|
|
|
|
ˆ |
|||
a Ly |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
43 Тема 02: Построение эмпирических статистических моделей ХТП
|
|
|
|
ˆ |
Статистический анализ результатов вычисления a необходим, так как |
||||
вектор |
y |
, который влияет на значения |
ˆ |
|
|
a , является случайным вектором (это |
|||
приводит к тому, что |
a - также случайный вектор). |
Причины случайного характера вектора y , полученного в результате опытных измерений:
• используется случайная выборка y ;
• результаты измерения каждого yi - случайные величины.
Один из видов статистического анализа – регрессионный анализ – предполагает, что компоненты вектора - случайныеyвеличины, распределённые по
нормальному закону распределения, т.е. для плотности распределения |
(i – |
|
го измерения) будетY |
справедливо: |
|
i |
|
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
44 Тема 02: Построение эмпирических статистических моделей ХТП
|
|
|
|
|
|
|
f Y |
|
1 |
|
|
|
|
1 |
|
Yi myi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
exp |
|
|
|
i 1,...n, |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
i |
Yi |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
2 |
|
Yi |
|
|
|
|
|
т.е. числовыми характеристиками случайной величины |
Yi будут: |
|||||||||||||||||||
m |
yi |
- |
математическое ожидание |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
2 |
- |
дисперсия |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
yi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
2 |
- среднеквадратичное отклонение или стандарт. |
|||||||||||||||
|
i |
|
|
y |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Допущение о нормальном законе распределения компонентов вектора y - это Первое допущение регрессионного анализа.
Второе допущение регрессионного анализа – о неслучайности компонентов вектора x , т.е. xi - неслучайные величины.
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
45 Тема 02: Построение эмпирических статистических моделей ХТП
Из этих двух допущений следует, что в соответствии со свойством линейности нормального закона распределения
a Ly
компоненты вектора a в уравнении регрессии также являются случайными величинами, распределёнными по нормальному закону, т.е. также могут характеризоваться следующими числовыми характеристиками:
m |
a j |
- |
математическим ожиданием |
|
|
|
|
||
a2j |
- |
дисперсией |
||
a |
j |
- |
среднеквадратичным отклонением или стандартом |
|
|
|
|
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
46 Тема 02: Построение эмпирических статистических моделей ХТП
Третье допущение регрессионного анализа заключается в допущении об однородности дисперсии случайных величин Yi . Свойство однородности предполагает несущественное отличие дисперсий Yi -ых, что позволяет усреднять их оценки или значения, полученные по ограниченным выборкам и распространять на всю исследуемую область, и проверяется с помощью специальных критериев, которые здесь не рассматриваются.
В соответствии с регрессионным анализом всегда рассчитывается оценка
коэффициентов aˆ
|
|
|
|
ˆ |
э |
||
a Ly |
|
в результате получается приближенная зависимость:
m
yˆ aˆ j j x .
j 0
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
47 Тема 02: Построение эмпирических статистических моделей ХТП
Для получения строгой зависимости и т.к. Y – случайная величина – необходима |
|||||||||||
зависимость математического ожидания |
m |
|
|
от значений x , называемая |
|||||||
|
|||||||||||
уравнением регрессии: |
|
Y |
|
x |
|
||||||
|
|
|
|||||||||
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
m |
|
|
a j j x |
||||
|
|
|
|
||||||||
|
|
|
|
Y |
|
x |
j 0 |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
a j |
|
-истинные значения коэффициентов регрессии, называемых |
|||||||||
|
|
теоретическими коэффициентами регрессии; |
|||||||||
m |
y |
m |
|
-условное математическое ожидание случайной величины Y. |
|||||||
|
|||||||||||
|
Y |
|
x |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
48Тема 02: Построение эмпирических статистических моделей ХТП
4.1Этапы регрессионного анализа
1.Определение оценок коэффициентов регрессии МНК
2.Определение значимости коэффициентов регрессии, т.е. существенного отличия их от нуля с помощью t – критерия Стьюдента
3.Определение адекватности уравнения регрессии с помощью F – критерия Фишера
4.2 Определение числовых характеристик случайных величин измерений выходной переменной
my M Y x - вектор математических ожиданий
Для дисперсий yi и y j справедливо: |
|
|
|
y2 |
M yi |
my 2 |
i 1,...n |
i |
|
i |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
49 Тема 02: Построение эмпирических статистических моделей ХТП
Ковариация двух случайных величин равна математическому ожиданию |
|||
произведения |
Yi my |
Yj my |
|
|
|
i |
j |
COVyi y j |
M |
|
myi |
|
|
Yi |
Yj |
my j |
|||
i 1,...n; |
j 1,...n; |
i j |
Для независимых нормально - распределённых случайных величин Yi и Yj
COVyi y j 0
Для нормально-распределённых случайных величин вместо размерной
величины |
COV |
целесообразно пользоваться коэффициентом корреляции: |
|
yi y j |
|
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |
50 Тема 02: Построение эмпирических статистических моделей ХТП
ryi y j |
|
COVyi |
y j |
i |
1,...n; |
j 1,...n |
|||
y |
y |
j |
|||||||
|
|
|
|
|
i |
|
|
|
|
Для линейно-зависимых случайных величин yi и y j |
|
||||||||
|
|
|
|
|
|
|
ryi y j |
1 |
|
А для независимых - |
|
|
|
ryi y j |
0 |
|
|||
|
|
y2 |
в n экспериментальных точках создаётся матрица |
||||||
Для дисперсий |
дисперсий – ковариаций:
COVy M y my y my T
РХТУ им. Д.И. Менделеева |
Кафедра информатики и компьютерного моделирования |