Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Обработка данных / [SHashkov_V.B.]_Obrabotka_yeksperimentalnueh_dannu(BookFi.org)

.pdf
Скачиваний:
63
Добавлен:
13.02.2016
Размер:
991.46 Кб
Скачать

D{xn yn}=1+12ρ,

т.е. в общем случае имеем

D{xn ± yn}=2±2ρ =2(1±ρ) .

Дисперсия не может быть отрицательной величиной по определению. Дисперсия равна нулю, если каждая хi равна своему математическому ожиданию, т.е. величина хесть константа. Поэтому можно записать

1+ρ 0 и 1ρ 0 ,

откуда следует

1ρ ≤+1,

что и составляет диапазон возможных значений коэффициента корреляции. Если коэффициент корреляции отличен от нуля, то он своим значением

характеризует не только наличие, но и силу стохастической связи между х и

у, т.е. той части связи, которую называют корреляцией. Чем больше абсолютная величина коэффициента корреляции, тем сильнее корреляция между

х и у. Максимальная корреляция при ρ = ± 1 («стопроцентная» корреляция) будет отвечать наличие функциональной связи между величинами.

8.2 Коэффициент корреляции – область действия

Если в уравнениеD{xn ± yn}=2±2ρ подставить крайние зна-

чения ρ = ± 1, то получим D{xn ± yn}=0. Такой случай отвечает кон-

станте, т.е. условию х=Мхили у=Му. А это означает, что выражение в фигурных скобках должно быть равно нулю. Развернем это выражение

 

xMx

±

yMy

=0,

 

 

 

σч

σ y

 

 

 

 

 

 

 

откуда следует

 

 

 

σ y

 

 

σ y

 

 

y = My mMx

±x

,

 

 

 

 

 

 

 

 

 

 

 

σx

σx

Здесь переменными являются только величины х и у. Все остальные

величины являются константами. Тогда, обозначая

My mMx

σ y

= β

, а

 

 

σ y

= β ,

 

 

 

 

σx

0

 

 

 

1

 

 

 

 

 

 

 

σx

получим линейное уравнение

y = β0 +β1x .

41

y =(x Mx)2 .

Таким образом, при крайних значенияхρ между величинами х и у

получаем функциональную линейную связь, т.е. коэффициент корреляции есть показатель того, насколько связь между случайными величинами близка к строгой линейной зависимости.

Рассмотрим такой пример. Имеем зависимость вида

Является ли величина х случайной величиной? Да, поскольку она имеет математическое ожидание, отличное от других, текущих значений этой величины. Является ли величина у случайной величиной? Да, поскольку она является функцией случайной величины.

В связи со случайным характером значений величины х, а, следова-

тельно, и величины у, неизбежно наличие стохастической связи между ними. Рассчитаем значение корреляционного момента для этого случая.

µ1{x,y}= M{(x-Mx)(y-My)}.

Подставим в это уравнение значение у согласно зависимости y =(x Mx)2 .

Тогда µ1{x,y}= M{(x-Mx)[(x-Mx)2-M{(x-Mx)2} ]}.

Умножим выражение в квадратных скобках на множитель (x-Mx) и тогда

µ1{x,y}= M{(x-Mx)(x-Mx)2-(x-Mx)M{(x-Mx)2}.

Разнося символ математического ожидания по элементам в фигурных скобках, получаем

µ1{x,y}= M{(x-Mx)}M{(x-Mx)2}-M{(x-Mx)}M{(x-Mx)2}=0.

Таким образом, наличие стохастической связи налицо по условиям задачи, и в то же время µ1{x,y}=0, тогда как значение µ1{x,y} должно отличаться от нуля.

Причина этого «парадокса» проста: мы имеем параболическую зависимость y =(x Mx)2 , в то время как и µ1{x,y} и коэффициент корреляции «работают» только при линейной связи.

8.3 Выборочный коэффициент корреляции. Свойства коэффициентов корреляции

По своей статистической природе векторы-столбцы х1,х2, …,уg в таблице экспериментальных данных представляют собой выборочные данные, моделирующие соответствующие генеральные совокупности. Поскольку в связи с матричными расчетами при решении задач регрессии процедура включает исследование наличия линейной связи между всеми парами векто-

ров х, постольку необходимо использовать выборочные коэффициенты корреляции r. Если неизвестны математическое ожидание и генеральная дисперсия, для расчета r приходится пользоваться их выборочными оценками, соот-

42

ветствующими уравнениям (10) и (12). Тогда выборочный корреляционный момент для первой пары векторов х1 и х2 будет равен

n11(x1g x1)(x2g x2),

где n – количество строк в таблице 3, т.е. объем выборки;

х - арифметическое среднее по данному вектору х.

Тогда с учетом (12) выборочный коэффициент корреляции r будет равен

r1,2 =

(x1g

x1

)(x2g

x2

)

 

,

(23)

 

(n1)Sx1Sx2

 

где Sx среднеквадратичное отклонение по данному вектору х.

 

Поскольку выборочный коэффициент корреляции r есть величина случайная, постольку необходимо оценить значимо ли статистически его значение. Это делается обычным путем с использованием доверительного интервала по данным таблицы r-распределения /4/.

Отметим некоторые свойства коэффициентов корреляции:

-коэффициент корреляции независимых величин равен нулю;

-значение коэффициента корреляции не изменяется от прибавления к х или у каких-либо постоянных величин, а также при умножении или делении их на положительные числа. Поэтому при переходе к нормированной форме величин значение коэффициента корреляции не изменяется:

-если одну из величин, не меняя другой, умножить на минус единицу, то и значение коэффициента корреляции изменит свой знак;

-если значение коэффициента корреляции больше нуля, то коррелирующие величины одновременно возрастают или убывают, если же значение коэффициента меньше нуля, то с возрастанием одной величины другая убывает.

43

9 Лекция 9. Нахождение уравнения регрессии. Системы условных и нормальных уравнений

9.1 Условия (предпосылки) применения метода регрессионного анализа

Метод регрессионного анализа является наиболее распространенным способом обработки экспериментальных данных. Он включает:

-использование метода наименьших квадратов;

-отражение неизвестной функции истинного отклика ϕ(х), "спрятанной" в таблице экспериментальных данных, алгебраическим степенным по-

линомом η(х,b).

Метод регрессионного анализа применим при соблюдении следующих условий:

1) массив значений откликов объекта исследования на данной g-строке таблицы экспериментальных данных имеет нормальное распределение с ма-

тематическим ожиданием M{yg}=ϕ(х) и дисперсией воспроизводимости

σ2вос;

2)дисперсии σ2вос на всех строках таблицы (для g=1,2,3,…,n) одинаковы, т.к. определяются только природой объекта исследования. Поскольку, как мы отмечали ранее, дисперсия воспроизводимости характеризует точность, с которой мы получаем значение отклика объекта исследования, постольку опыты при g=1,2,3,…,n равноточные, т.е. эксперимент воспроизводится при разных наблюдениях с одинаковой точностью;

3)результаты наблюдения отклика уg и их ошибки δg в различных опы-

тах независимы, т.е. корреляционные моменты µ11{yjyq} и µ11{δjδq} равны нулю;

4) независимые от отклика факторы воздействия на объект х и производные от них базисные функции f(х) определяются в эксперименте без ошибок в силу двух факторов:

а) в случае наличия таких ошибок они "стекают" на отклик объекта, увеличивая рассеивание облака экспериментальных точек;

б) влияние этих ошибок на рассеивание облака точек пренебрежительно мало по сравнению с влиянием шума;

5) векторы факторов воздействия на объект х и векторы производных от них базисных функций f(х) линейно не зависимы, т.е. ни один вектор нельзя получить как линейную комбинацию других. В противном случае определители матриц будут равны нулю и матричные расчеты станут невозможны. Это условие и проверяется значением коэффициентов парной корреляции;

44

6) существует идеальная математическая модель отклика объекта исследования η(х,β), адекватная функции истинного отклика и, таким образом, выполняется условие η(х,β) = ϕ(х). Целью обработки экспериментальных данных является нахождение статистической оценки модели η(х,β)

в виде экспериментального уравнения η(х,b).

Сформированная таким образом задача носит название задачи регрессии, эксперимент называется регрессионным, уравнения (полиномы) – уравнениями (полиномами) регрессии, а сам метод решения называется регрессионным анализом. Этот термин отражает тот факт, что с увеличением степени полинома, т.е. с увеличением количества его членов, в общем случае ошибка уравнения уменьшается – "регрессирует".

9.2 Полином регрессии и система условных уравнений

Как отмечалось ранее, конкретный вид полинома регрессии η(х,β) для данной таблицы данных обычно неизвестен, как и объективная функция

ϕ(х)., которая "закодирована" данной таблицей данных эксперимента. Поэтому процедура регрессионного анализа начинается с выдвижения гипотезы о конкретном виде уравнения, которым мы намереваемся отразить экспериментальную табличную зависимость. Вид уравнения регрессии задается либо на основе каких-то математических, физических или профессиональных соображений, либо, при отсутствии последних, - в порядке альтернативы – нахождения для данной таблицы нескольких вариантов уравнений и сравнения их по точности воспроизведения табличного значения отклика уg.

Таблица экспериментальных данных и принятая в виде гипотезы форма уравнения регрессии являются основными отправными условиями задачи и определяют последующий ход ее решения.

Процедура обработки экспериментальных данных начинается с совмещения принятой формы уравнения с таблицей, для чего в уравнение подставляют значения факторов хkg в соответствии со строками таблицы данных, где g- номер строки таблицы, а k- номер вектора х. Это дает систему уравнений соответственно количеству строк в таблице экспериментальных данных.

Рассмотрим изложенное на конкретном примере. Пусть мы имеем таблицу данных с двумя факторами х при числе строк п=7, которую мы хотим отразить уравнением

b +b x1+b x2+b

x1 x2+b

x12 +b x22

=y .

(24)

0

1

2

12

11

22

 

 

Отметим, что левая часть полинома алгебраически представляет собой произведение двух векторов:

-вектора коэффициентов b;

45

-вектора множителей при этих коэффициентах

1

х1

х2

х1*х2

х12

х22 ,

который носит название вектора базисных функций.

Если индексами при коэффициентах b будем обозначать комбинацию базисных функций при данном коэффициенте, а индексами при факторах х – номер строки таблицы, то в алгебраическом виде построенная система уравнений будет следующей:

b0 + b1х11 + b2х21 + b12х11х21 + b11х11х11 + b22х21 х21 = у1; b0 + b1х12 + b2х22 + b12х12х22 + b11х12х12 + b22х22 х22 = у2; b0 + b1х13 + b2х23 + b12х13х23 + b11х13х13 + b22х23 х23 = у3;

b0 + b1х14 + b2х24 +b12х14х24 + b11х14х14 + b22х24 х24 = у4;

(25)

b0 + b1х15 + b2х25 + b12х15х25 + b11х15х15 + b22х25 х25 = у5; b0 + b1х16 + b2х26 + b12х16х26 + b11х16х16 + b22х26 х26 = у6; b0 + b1х17 + b2х27 + b12х17х27 + b11х17х17 + b22х27 х27 = у7;

Однако, как отмечалось ранее, при воздействии на объект исследования факторами х, наличие и значение которых определяется самим экспериментатором, значение отклика уg формируется как за счет факторов х, так и за счет факторов w по уравнению (9).

Представим себе, что мы многократно повторяем наблюдение, задавая одинаковые значение факторов x1g , x2g , . . . . . xкg для одной и той же g-ой строки таблицы экспериментальных данных. Значения откликов при этом в силу наличия шума в целом будет разными, т.е. значение случайной ошибки наблюдения при повторных опытах будет меняться. Распределение таких ошибок обладает важной особенностью - ошибки, противоположные по знаку и близкие по абсолютной величине, в среднем встречаются одинаково часто, т.е. распределение случайных ошибок симметрично относительно

нуля.

Отсюда следует, что если все допустимые значения yg по данной строке есть генеральная совокупность, то истинный результат наблюдения есть математическое ожидание случайной величины yg по этой строке. Третья предпосылка регрессионного анализа гласит, что наблюдаемое значение отклика yg есть нормально распределенная случайная величина с центром

M{yg }=ϕ(xg ),

где M{yg }есть математическое ожидание случайной величины yg.

Таким образом, уравнение регрессии, которое получено в результате обработки экспериментальных данных, есть зависимость оценки матема-

тического ожидания отклика от факторов х.

46

В связи со случайным характером отклика уg левая и правая часть полученной системы уравнений (25) неравны, система является несовместной и не имеет единственного решения, т.е. не существует такой комбинации неизвестных коэффициентов bj , которая отвечала бы всем уравнениям системы. Поэтому такие системы носят название системы условных уравнений. Представим эту систему в новом виде

y1 -( b0+b1 x11+b2 x21+b12 x11 x21+b11 x112+b22 x212 )= e1,

y2 - (b0+b1 x12+b2 x22+b12 x12 x22+b11 x122+b22 x222) = e2,

.....................................................................................

....................................................................................

y6 - (b0+b1 x16+b2 x26+b12 x16 x26+b11 x162+b22 x262)= e6, y7 - (b0+b1 x17+b2 x27+b12 x17 x26+b11 x172+b22 x272)= e7,

где еg есть разность между левой и правой частями уравнений. Обратим внимание на то, что первый элемент левой части этой систе-

мы уравнений состоит из экспериментальных значений отклика уg, а второй

– в круглых скобках, из значений, рассчитанных по уравнению регрессии (24). Поэтому невязку баланса левой и правой частей этих уравнений можно трактовать как отклонения расчетного значения отклика от экспериментального его значения. Cуммарный характеристикой этих отклонений является

остаточная сумма SUMost

SUM

 

=

n

 

y

 

2

2

,

(26)

ost

y

g

 

=∑e

 

 

 

 

gr

 

g

 

 

 

 

 

g =1

 

 

 

 

 

 

 

где уgr- расчетное значение отклика по уравнению (24).

Эта величина позволяет сформулировать понятие наилучшего реше - ния системы уравнений, которая не имеет единственного решения. Наилуч-

шим будет решение, которое минимизирует остаточную сумму SUMost .

Такой подход к решению задачи называется методом наименьших квадратов. В точке минимума функции (26) ее производные SUM ost / b j рав-

ны нулю. Дифференцируя уравнение (26) по всем коэффициентам регрессии и приравнивая нулю производные, получим систему нормальных уравнений /7/, которая совместна, имеет единственное решение и минимизирует остаточную сумму. Но для многофакторных полиномов высоких степеней способ создания системы нормальных уравнений через частные производные

47

сложен и трудоемок. Существует более простой способ построения системы нормальных уравнений путем пошагового преобразования системы условных уравнений.

9.3 Преобразование системы условных уравнений по методу Гаусса. Система нормальных уравнений

Пошаговая процедура преобразования системы условных уравнений в систему нормальных уравнений была разработана Гауссом. На первом шаге процедуры каждое условное уравнение системы (25) умножается на свой множитель при первом коэффициенте регрессии b0, после чего все преобразованные таким образом условные уравнения складываются сверху вниз; суммарное уравнение и будет первым нормальным уравнением. Если, например, искомым уравнением регрессии будет полином вида

b +b x1+b x2+b

x1 x2+b

x12 +b x22

=y ,

(27)

0

1

2

12

11

22

 

 

то результат первого шага в алгебраическом виде будет следующим

n b0+b1 x1+b2 x2+b12 x1 x2 +b11 x12+b22 x22=y,

поскольку множителем при первом коэффициенте b0 является единица.

На втором шаге каждое исходное условное уравнений умножается на свой множитель при втором коэффициенте b с последующим сложением уравнений и образованием второго нормального уравнения - и т.д. В итоге формируется система нормальных уравнений, число которых равно числу коэффициентов регрессии в уравнении (27). Для разбираемого примера это будет система шести уравнений, приведенная ниже.

Система нормальных уравнений совместна, имеет единственное решение и минимизирует остаточную сумму, т.е. обеспечивает наилучшее решение системы условных уравнений из всех возможных решений.

nb0+b1x1+b2x2+b12x1x2+b11x12+b22x22=y, b0x1+b1x12+b2x1x2+b12x12x2+b11x13+b22x1x22=yx1, b0x2+b1x1x2+b2x22+b12x1x22+b11x12x2+b22x23=

=yx2,

b0x1x2+b1x12x2+b2x1x22+b12x12x22+b11x13x2+ (28) +b22x1x23=yx1x2 ,

b0x12+b1x13+b2x2x12+b12x13x2+b11x14+b22x12x22=yx12, b0x22+b1x1x22+b2x23+b12x1x23+b11x12x22+b22x24=yx22.

48

10 Лекция 10. Нахождение уравнения регрессии. Вектор коэффициентов регрессии.

10.1 Основное уравнение процедуры регрессионного анализа

Левая часть системы условных уравнений (25) представляет собой произведение матрицы на вектор коэффициентов b. Выделяя матрицу, получим

1

х11 х21

х11х21

х11х11 х21 х21

 

1

х12 х22

х12х22

х12х12 х22 х22

 

1

х13 х23

х13х23

х13х13 х23 х23

 

1

х14

х24

х14х24

х14х14

х24

х24

(29)

1

х15

х25

х15х25

х15х15

х25 х25

 

1

х16

х26

х16х26

х16х16

х26 х26

 

1

х17

х27

х17х27

х17х17

х27 х27,

 

где индекс при факторах х обозначает номер строки таблицы данных. Эта матрица называется матрицей базисных функций. Обозначим ее

как матрицу F. Количество строк в ней равно количеству строк в таблице экспериментальных данных, а количество столбцов – числу коэффициентов b в уравнении регрессии (24), которое по условиям задачи мы должны найти.. Нетрудно видеть, что содержание матрицы F определяется формой полинома, а точнее - вектором базисных функций.

Левая часть системы нормальных уравнений (28) представляет собой произведение некоторой матрицы на вектор коэффициентов b. Выделяя матрицу из системы уравнений , получим квадратную симметричную матрицу, размерность которой равна числу коэффициентов b в уравнении регрессии (24). Эта матрица называется матрицей моментов М.

Для уравнения (24) матрица моментов имеет следующий вид:

n

Σx1

Σx2

Σx1x2

Σx12

Σx22

 

Σx1

Σx12

Σx1x2

Σx12x2

Σx13

Σx1x22

 

Σx2

Σx1x2

Σx22

Σx1x22

Σx12x2

Σx23

(30)

Σx1x2

Σx12x2

Σx1x22

Σx12x22 Σx13x2

Σx1x23

 

Σx12

Σx13

Σx12x2

Σx13x2

Σx14

Σx12x22

 

Σx22

Σx1x22

Σx23

Σx1x2

Σx12x22

Σx24.

 

Таким образом, левую часть системы уравнений (28) можно представить в виде произведения b×M .

49

Можно показать, что матрица моментов

M = FT F ,

где FT - транспонированная матрица F .

Если исходные факторы х преобразовать в нормированную форму (21),

то с учетом свойств нормированных величин матрица моментов М от формы (30) будет приведена к следующему виду:

n

0

0

Σx1x2

n

n

0

n

Σx1x2

Σx12x2

Σx13

Σx1x22

0

Σx1x2

n

Σx1x22

Σx12x2

Σx23

Σx1x2

Σx12x2

Σx1x22

Σx12x22

Σx13x2

Σx1x23

n

Σx13

Σx12x2

Σx13x2

Σx14

Σx12x22

n

Σx1x22

Σx23

Σx1x23

Σx12x22

Σx24.

Такой вид матрицы при решении задачи регрессии и будет свидетельством правильности промежуточных расчетов.

Правая часть системы уравнений (28) представляет собой суммы пар – ных произведений. Развернем эти суммы в ряды слагаемых

y11+y21+ y31+ y41+y51+ y61+y71; y1x11+y2x12+ y3x13+ y4x14+y5x15+ y6x16+y7x17; y1x21+y2x22+ y3x23+ y4x24+y5x25+ y6x26+y7x27;

y1x11x21+y2x12x22+ x14x24+y5x15x25+y6x16x26+y7x17x27; y1x112+y2x122+ y3x132+ y4x142+y5x152+ y6x162+y7x172; y1x212+y2x222+ y3x232+ y4x242+y5x252+ y6x262+y7x272.

Отсюда видно, что правая часть системы нормальных уравнений (28) является произведением некой матрицы на вектор откликов yg.

Выделяя матрицу, получим:

1

1

1

1

1

1

1

x11

x12

x13

x14

x15

x16

x17

x21

x22

x23

x24

x25

x26

x27

………………………………………………………….

…………………………………………………………..

x212

x222

x232

x242

x252

x262

x272.

50