Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
консп.-лек1-9TB.doc
Скачиваний:
75
Добавлен:
16.09.2019
Размер:
3.6 Mб
Скачать

7.4 Выбор уравнения регрессии

После того, как установлено наличие связи между переменными строится, так называемое, корреляционное поле. Определяется эмпирическая линия регрессии. Выводится уравнение теоретической линии регрессии. Предположим, что в результате корреляционного анализа установлено равенство коэффициента корреляции корреляционному отношению. В этом случае вопрос решается простой подстановкой рассчитанных в процессе корреляционного анализа данных в уравнение (7.1). В случае, если такого равенства не наблюдается, необходим поиск криволинейной связи. Наиболее часто наблюдающейся в различных технических приложениях формой криволинейной связи является параболическая связь, выражающаяся уравнением параболы n –го порядка:

x = a + bx2 + cx3 + ...

Задача заключается в поиске численных значений коэффициентов уравнения a,b,c,.... Метод, с помощью которого определяются коэффициенты уравнения, носит название метода наименьших квадратов.

Рассмотрим общую постановку вопроса. Пусть из каких либо соображений выбран общий вид функции Y = f ( x ), зависящий от нескольких числовых параметров a,b,c,...; именно эти параметры и требуется выбрать согласно методу наименьших квадратов так, чтобы сумма квадратов отклонений yi от f (x ) была минимальна. Запишем y как функцию не только аргумента х, но и параметров a,b,c,...:

y = f ( x;a,b,c,...).

Требуется выбрать a,b,c,... так, чтобы выполнялось условие:

[ yi – f ( x;a,b,c,...)]2 = min (7.2)

Найдем значения a,b,c,...,обращающие левую часть выражения (7.2) в минимум. Для этого продифференцируем eго по a,b,c,... и приравняем производные нулю:

[ yi –f ( x;a,b,c,...)] ( f / a)i = 0 ;

[ yi –f ( x;a,b,c,...)] ( f / b)i = 0 ; (7.3)

[ yi –f ( x;a,b,c,...)] ( f / c)i = 0 ;

где ( f / a)i = f/ ( x;a,b,c,...) – значение частной производной функции f по параметру а в точке хi;

( f / b)i , ( f / c)i ,...- аналогично.

Система уравнений (7.3) содержит столько же уравнений, сколько неизвестных a,b,c,... .

Решить систему (7.3) в общем виде нельзя; необходимо задаться конкретным видом функции f( x ). Рассмотрим простейший случай нелинейной зависимости, когда корреляционная связь выражается уравнением параболы второго порядка:

x = ax2 + bx + c. (7.4)

дифференцируя выражение (7.4) по a,b,c , получим:

( f / a)i = x ; ( f / b)i = x i ; ( f / c)i = 1.

Подставляя производные в систему уравнений (7.3) имеем:

[ x – ( ax2 + bx + c ) ] 2 x = 0 ,

[ x – ( ax2 + bx + c ) ] 2 x i= 0 ,

[ x – ( ax2 + bx + c ) ] 2 = 0 ,

После несложных преобразований получим систему уравнений:

x x = a x + b x + c x ,

x i x = a x + b x + c x i , (7.5)

x = a x + b x i+ cn ,

Решение системы уравнений (7.5) дает значение

коэффициентов a, b, c.

7.5. Понятие о множественной корреляции

Корреляционные связи могут существовать не только между двумя, но и между несколькими признаками. Исследование статистических связей между многими величинами составляет предмет теории множественной корреляции. В практике машиностроения встречаются случаи линейной корреляционной связи между тремя величинами или факторами. Поэтому ограничимся рассмотрением простейшего случая линейной корреляционной связи между тремя величинами X, Y и Z. Причем Z будем считать величиной, зависящей от X и Y. Линейная связь между Z, X и Y выражается уравнением:

yx = a +bx +cy,

где a ,b , c - постоянные коэффициенты, которые вычисляются с помощью коэффициентов корреляции между x и y ( rxy ); x и z

( rxz ); y и z ( ryz ), а также средних квадратических отклонений Sx, Sy, Sz по формулам:

b = ( Sz / Sx ) ( rxy - rxz ryz ) / ( 1 - r ) ;

c = ( Sz / Sy ) ( ryz - rxz rxy ) / ( 1 - r );

a = - b - c ;

Мерой силы линейной связи между Z и X, Y служит коэффициент множественной корреляции:

Rxyz = .

Коэффициент Rxyz всегда положительный и заключен между 0 и 1. Если Rxyz =1, то между Z , X и Y существует точная линейная связь вида yx = a +bx +cy, если yx =0, то Z не имеет линейной связи с X и Y, но криволинейная связь возможна.

Для исследования наличия связей между X и Z , Y и Z а также оценки влияния X и Y в отдельности на Z пользуются частными коэффициентами корреляции, которые обозначим r xz(y) (связь между x и z при постоянном значении y) и ryz(x) (связь между y и z при постоянном x). Эти коэффициенты вычисляются по формулам:

r xz(y) = (rxy - rxz ryz) / ;

ryz(x) = (ryz - rxz rxy ) / .

Смысл частных коэффициентов заключается в том, что они служат мерой линейной связи между x и z при постоянном значении y и между y и z при постоянном x. Значения коэффициентов заключены между -1 и +1. Когда они равны 0, частная связь между x и z, y и z не может быть линейной, но криволинейная возможна.