Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

семестр 2 / ЛКЗ

.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
479.5 Кб
Скачать

соответствуют, вообще говоря, различные значения yi

j ,

образующие

группу. Поэтому в этом случае D j 0 . Следовательно,

Dвнгр 0 . Так

как

Dвнгр > 0, Dмежгр 0 ,

то Dмежгр < Dмежгр + Dвнгр , т.е.

согласно

(1)

D

межгр

< D

общ

, так что

 

Dмежгр

<1,

что и требовалось

показать

во

 

Dобщ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

второй части.

 

 

 

 

 

 

 

 

 

 

Из

доказанного

утверждения

видно, что чем

связь между

величинами ближе к функциональной, тем больше будет приближаться

к единице отношение Dмежгр . Отсюда ясно, что целесообразно

Dобщ

рассматривать в качестве меры тесноты корреляционной зависимости

отношение Dмежгр или, что то же, отношение

Dобщ

Выборочным корреляционным отношением Y к X называют отношение вида

где

,

n – объем выборки, nx

- частота значения x случайной величины X; ny

- частота значения y

случайной величины Y; y - общее среднее

величины Y; yx - групповое среднее величины Y. Аналогично определяется выборочное корреляционное отношение X к Y

Пример. По данным корреляционной таблицы вычислим ηyx .

X

10

20

30

ny

xy

Y

 

 

 

 

 

 

 

 

 

 

 

 

38

 

15

4

28

6

20.5

 

 

 

 

12

 

25

6

 

6

20

 

 

 

 

n=50

 

nx

10

28

12

 

 

 

 

 

 

yx

21

15

20

 

 

 

 

 

 

 

Найдем общее среднее

y =

1

ny y =

38 15 +12 25

=17.4

n

50

 

 

 

Вычислим выборочные средние квадратичные отклонения

Тогда выборочное корреляционное отношение равно

Аналогично

x =

1

n

x

x =

10 10 + 28 20 +12 30

= 20.4, x

=

4 10 +28 20 +6 30

= 20.53

 

 

 

 

 

n

 

 

 

 

50

15

38

 

 

 

 

 

6 10 +6 30

 

 

 

 

 

x25 =

 

= 20

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Видим, что, вообще говоря, ηyx ηxy .

Вычислим теперь выборочный коэффициент корреляции r и сравним его с корреляционным отношением η. Для этого перейдем к

условным вариантам

ui = xi 20 , vi = yi 15 10 10

Перепишем в условных координатах корреляционную таблицу

U

-1

0

1

nv

V

 

 

 

 

 

 

 

0

4

28

6

38

 

 

 

 

 

1

6

 

6

12

 

 

 

 

 

nu

10

28

12

n=50

 

 

 

 

Вычислим значение выборочного коэффициента корреляции

r = nuvuv nu v nσuσv

Для этого найдем соответствующие средние значения

 

 

 

1 10 +0 28 +1 12

 

 

2

 

 

0 38 +1 12

 

12

,

 

 

=

22

,

 

 

 

12

 

 

u

=

=

, v =

=

u2

v2

=

 

50

 

 

 

 

50

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

50

50

 

 

 

50

 

 

 

 

 

Найдем выборочные средние отклонения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σu =

 

u2 u 2 =

1096 , σv =

 

v2 v 2

=

 

1056

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

Вычислим

сумму

nuvuv = 4 0 +6 (1)+1 0 6 +1 1 6 = 0 .

 

Тогда

значение выборочного коэффициента корреляции равно

 

 

 

 

 

 

 

r = −

 

u v

 

= −

 

 

 

 

2 12

 

 

 

 

 

 

= −0.02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1096

 

1056

 

 

 

 

 

 

 

 

 

 

σu σv

 

50 50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В данном примере η >

 

r

 

 

 

 

50

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. Это соотношение является общим.

 

 

 

 

 

 

 

 

 

 

 

Свойства выборочного корреляционного отношения

 

 

 

Так

как ηyx

обладает

теми

же

свойствами,

что и

 

ηxy , то

рассмотрим свойства только ηyx , которое для упрощения записи обозначим через η и будем называть корреляционным отношением.

Свойство 1. 0 η 1

Доказательство

Так как по определению Dмежгр 0, Dобщ 0 , то

Следовательно, η 0 . Из соотношения

Dобщ = Dмежгр + Dвнгр

следует, что

 

 

 

Dвнгр

+

Dмежгр

=1 или

Dвнгр

+η2 =1

 

 

 

D

 

 

 

 

 

 

D

D

 

 

 

 

 

общ

 

общ

общ

Так как

Dвнгр

0, η2 0 ,

то каждое из слагаемых

1; в частности,

D

 

 

 

 

 

 

 

 

 

 

общ

 

 

 

 

 

 

 

 

η2 1. Приняв во внимание, что η 0 , заключаем

 

0 η 1, что и

требовалось показать.

Свойство 2. Если η = 0, то Y и X корреляционной зависимостью не связаны.

 

 

 

Доказательство

 

 

Из

следует, что

и, следовательно,

Dмежгр = 0 .

РавенствоDмежгр = 0 означает, что yx

= y , т.е. при

всех значениях

случайной величины X

yx

сохраняет

постоянное

значение, равное

y . Иными

словами,

при

η = 0 условное среднее

yx

не является

функцией от x, а значит, величина Y не связана корреляционной зависимостью с величиной X. Верно и обратное утверждение: если

yx = const ,

т.е. yx

= yx =..... = y ,

то

Dмежгр = 0

и, следовательно,

 

1

2

 

 

 

, η = 0.

 

 

 

 

Свойство 3. Если η =1, то Y и X связаны функционально.

 

 

Доказательство

 

Из η =1 следует, что

 

 

 

 

 

, Dмежгр = Dобщ

(1)

Так как

Dобщ = Dмежгр + Dвнгр ,

то

из (1)

вытекает, что

Dвнгр = 0 D j = 0 , так что в каждой группе содержатся равные значения yi j , т.е. каждому значению x соответствует одно значение y.

Поэтому величины Y и X связаны функционально. Верно и обратное утверждение: если yxi = yi , то и, η =1.

Свойство 4. Всегда

корреляционное отношение не

меньше

коэффициента корреляции η

 

r

 

.

 

 

 

 

 

 

 

 

 

 

Свойство 5. Если

η =

 

r

 

, то имеет

место точная линейная

 

 

зависимость. Другими словами, если η =

 

r

 

,

то точки (xi , yi )

лежат на

 

 

прямой линии регрессии, найденной способом наименьших квадратов.

Убедимся, что

с

возрастанием

 

η

 

корреляционная

связь

становится

более

 

тесной.

 

 

Для

 

 

 

этого

преобразуем

соотношениеDобщ = Dмежгр + Dвнгр

следующим образом

 

 

 

 

 

 

 

 

D

межгр

 

= D (1η2 )

 

 

D

=

D

1

 

 

(2)

 

 

 

 

внгр

 

общ

 

 

Dобщ

 

 

 

общ

 

 

Из (2) видно, что при η 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dвнгр

0

 

 

(3)

Из (3) вытекает, что

 

 

 

 

D j 0

 

 

 

(4)

 

 

 

 

 

 

 

 

 

Из (4) следует, что yi j y j , т.е. при η 1 связь величин Y,X становится более тесной, переходя в функциональную при η =1

Поскольку в приведенных рассуждениях не делалось никаких допущений о форме корреляционной связи, то η может служить мерой

тесноты корреляционной связи любой формы. В этом состоит преимущество корреляционного отношения перед коэффициентом корреляции, который оценивает тесноту лишь линейной связи.

Недостаток: η не позволяет судить, насколько близко

расположены точки, найденные по данным наблюдений, к кривой определенного вида, например, к параболе, гиперболе и т.д.

§4.3. Нелинейная корреляционная зависимость

Если график функций регрессии f (x),ϕ(y) изображается кривой

линией, то корреляцию называют криволинейной. Например, функции регрессии Y на X могут иметь вид:

yx

= ax2

+bx +c (параболическая корреляция второго

порядка)

= ax3

+bx2 +cx + d

 

yx

(параболическая корреляция 3

порядка)

 

 

 

yx = ax +b (гиперболическая корреляция)

Теория криволинейной корреляции решает те же задачи, что и теория линейной корреляции:

1)установление формы корреляционной связи;

2)установление тесноты корреляционной связи.

Неизвестные параметры уравнения регрессии ищут методом наименьших квадратов. Для оценки тесноты криволинейной корреляции служит выборочное корреляционное отношение.

Чтобы выяснить суть дела, ограничимся параболической корреляцией 2 порядка, предположив, что данные n наблюдений позволяют считать, что имеет место именно такая корреляция. В этом случае выборочное уравнение регрессии Y на X имеет вид:

yx = Ax2 + Bx +C ,

(1)

где А,В,С – неизвестные параметры, подлежащие определению. Пользуясь методом наименьших квадратов, нетрудно получить

систему линейных уравнений относительно этих параметров:

An

x

x4

+ B n

x

x3

+C n

x

x2 =

n

x

y

x

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+C nx x = nx yx x

(2)

Anx x3 + B nx x2

 

 

 

+ B nx x +C n =nx yx

 

 

 

 

 

Anx x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найденные из системы (2) параметры А,В,С подставляют в (1) и в итоге получают искомое уравнение регрессии.

Пример. По данным корреляционной таблицы найдем выборочное уравнение регрессии Y на X вида yx = Ax2 + Bx +C :

 

 

Y

 

X

1

 

 

 

1.1

 

1.2

 

 

ny

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

8

 

 

 

9

 

 

 

 

 

17

 

 

7

 

 

 

 

 

 

 

23

 

 

 

 

 

23

 

 

7.5

 

 

 

 

 

 

 

1

 

9

 

 

10

 

 

nx

 

 

8

 

 

 

33

 

9

 

 

n=50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx

 

 

 

6 8

= 6

 

6.74

 

7.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

Составим расчетную таблицу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

nx

yx

 

 

nx x

nx x2

 

nx x3

nx x4

 

nx yx

nx yx x

 

nx yx x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.0

8

6

 

 

8

 

8

 

8

8

 

48

48

 

 

48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.1

33

6.74

 

 

36.3

39.93

 

43.93

48.32

 

222.5

244.66

 

 

269.13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.2

9

7.5

 

 

10.8

12.96

 

15.55

18.66

 

67.50

81

 

 

97.20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

55.1

60.89

 

67.48

74.98

 

338

373.66

 

 

414.33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставив числа нижней строки этой таблицы в (2), получим систему

74.98A +67.48B +60.89C

= 414.33

 

 

 

= 373.66

 

67.48A +60.89B +55.10C

 

 

 

 

 

60.89A +55.10B +50C = 338

 

Решив эту систему, найдем

A =1.95, B = 2.98, C =1.10 , так

что

искомое уравнение регрессии имеет вид

 

 

yx

=1.95 x2 +2.98 x +1.10

(3)

При x=1 по исходной таблице y1 = 6 , а по уравнению (3) y1 = 6.03 .

§4.4. Множественная корреляционная зависимость

Ранее мы рассматривали корреляционную связь между 2 величинами. Если исследуется связь между несколькими величинами, то корреляцию называют множественной. Рассмотрим случай, когда число величин равно 3 и связь между ними линейная

(z z )= A(x x)+ B (y y)

Вэтом случае возникают задачи:

1)найти коэффициенты регрессии А,В;

2)оценить силу связи между величиной Z и обоими величинами

X,Y;

3)оценить силу связи между Z и X, Z и Y.

Первая задача решается методом наименьших квадратов:

A =

σz

rxz ryz rxy

,

B =

σx

ryz rxz rxy

,

 

 

 

σx

1

r 2

 

σ y

1r 2

 

 

 

xy

 

 

xy

где rxz - коэффициент корреляции между X и Z; ryz - Y и Z; rxy - X и Y; σx ,σ y ,σz - выборочные средние квадратичные отклонения. Сила связи

величины Z с величинами X,Y оценивается выборочным совокупным коэффициентом корреляции

R =

r 2

+r 2

2r

r

r

yz

 

xz

yz

xy

xz

 

 

 

 

1

r 2

 

 

 

 

 

 

 

xy

 

 

 

Сила связи между Z и X оценивается частным выборочным

коэффициентом корреляции

 

 

 

 

 

r

 

=

rxz rxy ryz

 

 

xz(y)

 

(1r 2 )(1r 2 )

 

 

 

 

xy

 

yz

Сила же связи между Z и Y оценивается частным выборочным коэффициентом корреляции

ryz(x) =

ryz rxy rxz

)

(1r 2

)(1r 2

 

xy

xz

 

Эти коэффициенты имеют те же свойства и тот же смысл, что и обыкновенный выборочный коэффициент корреляции, т.е. служат для оценки линейной связи между величинами.

§4.5. Сглаживание

Часто экспериментальные данные представляют собой зависимость величины f от некоторой другой величины x .

Измеренные с некоторой погрешностью или зашумленные экспериментальные данные перед их анализом обычно сглаживают. Если количество экспериментальных точек велико, то подбор эмпирической формулы может оказаться весьма затруднительным: формулы с малым числом параметров могут давать большие искажения, а большое число параметров неудобно для анализа. С другой стороны, многие задачи анализа (например, связанные с дифференцированием или интегрированием) не требуют единой аналитической формулы для всех данных. Для анализа важно лишь устранить «шум» эксперимента, сохранив информацию об истинной функции.

Для этой цели применяется сглаживание эмпирических данных, т.е. замена данной таблицы опытных точек другой таблицей близких к ним точек, лежащих на достаточно гладкой кривой.

Сглаживание производится с помощью многочленов (желательно оптимальной степени), приближающих по методу наименьших квадратов выбранные группы опытных точек. Так как наилучшее сглаживание получается для средних точек (когда учитывается информация о поведении функции по обе стороны от сглаживаемой точки), то количество точек для сглаживания выбирают нечетным, а группы точек–скользящими вдоль всей таблицы: берут, например, первые пять точек y1, y2 , y3, y4 , y5 и сглаживают с их помощью

среднюю точку y3 , затем берут следующую группу точек y2 , y3, y4 , y5, y6 и сглаживают точку y4 , и т.д. до конца таблицы. При

этом остаются несколько крайних точек, которые сглаживаются с меньшей точностью.

Ниже приводятся наиболее употребляемые из простых формул сглаживания для таблиц с постоянным шагом. Сглаженные значения обозначаются волнистой чертой сверху. Основной формулой служит

~

формула сглаживания средней точки, т.е. формула для fi , остальные

формулы применяются только на краях таблицы.

Наиболее простым методом является метод линейного сглаживания по трем точкам: Линейным сглаживанием называется сглаживание многочленом первой степени.

~

+ fi + fi+1]/ 3, i =1,2,...n 1,

fi = [fi1

~

f0

~

fn

= [5 f0 +2 fi f2 ]/ 6, i = 0 ,

= [5 fn +2 fn1 fn2 ]/ 6, i = n ,

где n-номер последней точки, в которой измерена величина fi .

Метод линейного сглаживания по пяти точкам основан на использовании формул

~

=

[3 f0 +2 fi + f2 f4 ]/ 5, i = 0 ,

f0

~

=

[4 f0 +3 fi +2 f2 + f3]/10, i =1,

f1

~

=

[fi2 + fi1 + fi + fi+1 + fi+2 ]/ 5, i = 2,3,...n 2

fi

~

 

= [4 fn +3 fn1 +2 fn2 + fn3]/10, i = n 1

fn1

~

+ fn2

fn4 ]/ 5, i = n

fn = [3 fn +2 fn1

Метод нелинейного сглаживания по семи точкам обеспечивает усреднение на основе применения полинома третьей степени и реализуется следующими формулами:

~

=

[39 f0 +8 f1 4(f2 + f3 f4 )+ f5 2 f6 ]/ 42 ,

f0

~

=

[8 f0 +19 f1 +16 f2 +6 f3 4 f4 7 f5 +4 f6 ]/ 42 ,

f1

~

=

[4 f0 +16 f1 +19 f2 +12 f3 +2 f4 4 f5 + f6 ]/ 42 ,

f2

~

=

[7 fi +6(fi+1 + fi1 )+3(fi+2 + fi2 )2(fi+3 + fi3 )]/ 21,

fi

~

 

= [4 fn +16 fn1 +19 fn2 +12 fn3 +2 fn4 4 fn5 + fn6 ]/ 42

fn2

~

 

= [8 fn +19 fn1 +16 fn2 +6 fn3 4 fn4 7 fn5 +4 fn6 ]/ 42 ,

fn1

~

=

[39 fn +8 fn1 4(fn2 + fn3 fn4 )+ fn5 2 fn6 ]/ 42

fn

Формулы сглаживания многочленами более высоких степеней не применяются, а формулы сглаживания по большему числу точек применяются крайне редко, так как они оставляют плохо сглаженными большое количество точек по краям таблицы.

Соседние файлы в папке семестр 2