Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебник по теориии вероятности

.pdf
Скачиваний:
136
Добавлен:
18.03.2015
Размер:
12.57 Mб
Скачать

Найдем условные моменты первого, второго, третьего и четверо того порядков:

 

M l - — = - ^ 5 5

= 0 . 0 3 ,

A l 2 = — ; р - - =

jgg

=4,05,

 

А1з=

 

 

_

= -

1,53,

j^m

Si4-14s2+36

$3+24s4

=

147+14129+36 . 69+2419 .^ ^^

Л14

pj

 

 

щ |

=48,93.

Найдем центральные эмпирические моменты третьего и четвер­ того порядков:

= [_ 1,53—3 0,03 4,05 + 2 (0,03)^] 4« = — 121,245,

=[48,93—4 0,03.(— 1,53)+

+6 .(0,03)« -4.05—3 (0,03)*] 4* = 12578,679.

Найдем

искомые асимметрию

и эксцесс, учитывая, что Од^ж

= K D ^ =

V^ 64,78 (дисперсия Dg

была найдена ранее, см. задачу

529):

а , = т,/аЬ = -~ 121,245/(l/'64J8)« = —0,25,

 

е^=mJOB—3=12578,679/(

У 64,78)*—3=26,97.

534. Найти методом сумм асимметрию и эксцесс по заданному распределению выборки объема п=100:

а) X/ 10,2 10,4 10,6

10,8 11,0 11,2 11,4 11,6 11,8 12,0;

П;

2

3

8

13

25

20

12

10

6

1

б) Xi

12. 14

16

18

20

22.

 

 

 

 

п^

5

15

50

16

10

4

 

 

 

 

Глава двенадцатая

ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ

§ 1. Линейная корреляция

Если обе линии регрессии К на X и X на V—прямые, то кор­

реляцию называют линейной.

 

 

 

Выборочное уравнение прямой линии регрессии Y на X имеет вид

-. -

а-.

_

 

yx—y^rs

— ix—x),

(•)

^Дв Vx—условная средняя; х и у^—выборочные средние

признаков

X и г; Сх и Оу—выборочные средние

квадратические отклонения;

Гв—выборочный коэффициент корреляции, причем

 

гв = ( 2 f^xyXy—nxyyinOjfOy).

190

Выборочное уравнение прямой линии регрессии X на У имеет вид

( • •)

Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целе­ сообразно перейти к условным вариантам:

Ui = (Xi—Ci)/hu

t;y=(£/y—С2)/Л2.

где Cj—«ложный нуль» вариант X (новое начало отсчета); в ка­ честве ложного нуля выгодно принять рарианту, которая располо­ жена примерно в середине еариационного ряда (условимся прини­ мать в качестве ложного нуля варианту, имеющую наибольшую частоту); hi—шаг, т. е. разность между двумя соседними вариантами X; Сг—ложный нуль вариант К; Лг—шаг вариант К.

В этом случае выборочный коэффициент корреляции

Гв= ( 2 Пауии-'пйд)/{пОаОу),

причем слагаемое 2Li"tiv^^^ удобно вычислять, используя расчетную табл. 7 (см. далее решение задачи 535). .

Величины сГ, V, o„, а^ могут быть найдены либо методом произ/ ведений (при большом числе данных), либо непосредственно по фор­ мулам:

'и = (^Паи)/п, v^'^n^v/n, Оа=К й*—(il)2, o^ = Vv^ — {v)^.

Зная эти величины, можно определить входящие в уравнения рег­ рессии (•) и (*«) величины по формулам:

x^uhi + C-if "y^vhz + Cz, Ox^ojii,

Oy=^(S^2-

Для оценки силы линейной корреляционной связи служит вы­ борочный коэффициент корреляции г^.

Для обоснованного суждения о наличии связи между количест­ венными признаками следует проверить, значим ли выборочный ко­ эффициент корреляции (см. гл. ХП1, § 12).

535. Найти выборочное уравнение прямой линии рег­ рессии К на X по данным, приведенным в корреляцион­ ной табл. 5.

Т а б л и ц а 5

Y

20

25

X

35

40

«..

30

 

 

 

 

 

 

V

16

4

6

10

_

10

26

-.

8

18

36

32

3

9

44

46

«..

.».

4

12

6

22

56

—*

—~

1

5

6

Пх

4

14

46

16

20

п = 100

191

Р е ш е н и е . Составим корреляционную табл. 6 в условных ва­ риантах, выбрав в качестве ложных нулей Ci=30 и С2==36 (каж­ дая из этих вариант расположена в середине соответствующего вариационного ряда).

Т а б л и ц а 6

и

.V

-2

1 ~^

1 ^

1

! ^

1 %

 

 

 

 

 

 

— 2

4

6

10

—1

8

10

18

0

32

3

9

44

1 1

4

12

в

22

2

1

5

6

Па

4

1 ^^

46

16

20

л=100

Найдем и и v:

«=(2«tt£/)M = (4.(—2)+14.(—1) + 46.0+1б. 1+20.2)/100 = 0,34; t' = (2''vt')/«==(10(---2)+18(--l) + 44.0+22.1+6.2)/100==---0,04. Найдем вспомогательные величины и^ и v^:

I ? ^ ( 2 / i e a a ) / n = ( 4 . 4 + 1 4 . 1 + l6.1+20.4)/100=l,26; t^=(S'*v^'^)/'»=(^0'4+181+22.1+6.4)/100 = 1.04.

Найдем аа и о^

aa = l/l? - ~(u)«= F^l,26—0,342=1,07; а^ = К t;«—(t»)2 = |/'l,04—0,042= 1,02.

Найдем ^figt^uv, для чего составим расчетную табл. 7. Суммируя числа последнего столбца табл. 7, находим

2 у- (/ = 2 '^«v"^= ^^•

V

Для контроля вычислений находим сумму чисел последней строки:

Совпадение сумм свидетельствует о правильности вычислений. Пояснения к составлению табл. 7.

1. Произведение частоты п^^ на варианту и, т.е. Лц^гг, записы­ вают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: 4-(—2)= —8;,6-(—1)= —6.

192

со

 

 

 

 

 

 

а

^

11 99

1 ^

1 ^

X

 

Si

 

 

 

 

 

1

^

х»«

 

оо

 

 

 

II

т

 

1

 

см

 

 

 

 

 

 

 

 

 

 

 

 

^

 

 

 

 

 

 

 

 

 

 

0 0

 

1 ^

 

 

 

 

 

 

 

 

 

 

jiJ

 

 

 

 

 

 

СО

1

о

 

^

о

^

 

 

 

СО

 

 

 

 

1 О

 

 

 

 

IJ 1

1 Т

 

 

 

7

00

 

1

 

 

и

 

m

 

1

*

 

 

1 см^,^

- 1 — л

 

 

 

 

1 00-<

1

о

1

'^

 

 

II

1

см

1

с^

 

1

ь«

1

^'

^ ^

1

о

 

 

 

 

W-

 

1

 

 

 

 

 

 

Г"

1

"^

 

 

 

11

^ < ^

 

СМ

 

 

 

 

 

1 ^

Ы~

L.W

F1 юF <£> S3

[ см 1 d

см

R

^

'^

17

 

 

zl

 

1

 

^

1

о

R

 

н8

1

1

1 сч 1

1

1

1

1

00 1 ю

1

 

 

 

 

1

 

 

 

 

 

 

 

т

 

 

 

 

о 1

 

1

О

1 "^ 1

см

1 W

::5^

/ /

Si

 

 

 

 

 

 

1/ о

 

1

1

 

II

 

1/

 

 

 

^

 

 

 

 

 

 

 

193

2. Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же стро­ ки «столбца и». Например, для первой строки а = — 8 + ( — 6 ) = — 1 4 .

3.

Наконец, умножают варианту v нг U и полученное

произве­

дение записывают в соответствующую клетку «столбца t/(/».

Напри­

мер, в

первой

строке

таблицы

t; = — 2, /7=—14,

следовательно,

i;£/ = (—2).(—14) = 28.

 

 

 

 

4.

Сложив все числа «столбца t>t/», получают сумму ^vU, ко-

торая

равна

искомой

сумме

^Пц^^ии. Например,

V

табл. 7

для

2 ^ ( 7 = 8 2 , следовательно, искомая сумма y\ntipUV=^S2.

V Для контроля аналогичные вычисления производят по столбцам: произведения na^v записывают в левый нижний угол клетки, содер­ жащей значение частоты; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму помещают в «строку К»; наконец, умножают каждую варианту и нг V и резуль­ тат записывают в клетках последней строки.

Сложив все числа последней строки, получают сумму 2 ^^f

и

которая также равна искомой сумме y\nui,uv. Например, для табл. 7

2 ^ ^ = 82, следовательно,

^Пц^иу^82.

и

Найдем искомый выборочный коэффициент корреляции:

 

y\nuvUV'-ruIv

 

82— 100-0,34 • (—0,04) ^ -^

'"^

поао^

^

100.1.07.1,02

==^'^^-

Найдем шаги h^ и hz (разности между любыми двумя соседними вариантами):

Лх ==25—20=5; Аа = 26—16 = 10.

Найдем X н"у,учитывая, что Сх = 30, 0^ = 36:

x=;7I./ii + Ci=0,34 . 5+ 30 = 31,70; l7=^./ia + C2 = (—0,04). 10+36 = 35,60.

Найдем Qjf и Oyi

a;p = /ii.a„ = 5.1,07 = 5,35; а^,=Лаа^ = 10-1,02 = 10,2.

Подставив найденные величины в соотношение (*), получим искомое уравнение прямой линии регрессии Y на X:

5^;,-35,60 = 0,76 i | | (;^-31,70).

или окончательно J^;^=1,45JC—10,36.

194

536. Найти выборочные уравнения прямых линий регрессии У на X и X на У по данным, приведенным в следующих корреляционных таблицах:

а)

 

 

 

 

 

 

X

 

 

 

 

Y

5

!

10

15

20

25

30

35

40

%

 

100

2

 

1

 

 

 

 

 

 

3

120

3

'

4

3

 

 

 

 

 

10

140

 

5

10

8

-—

23

160

 

1

6

1

1

9

180

 

 

 

 

 

 

 

4

1

5

Пх

5

1

5

8

11

8

6

5

2

л=50

б)

X

Y

•в 1

23

28

33 j

38

j 43

48

%

125

1

 

 

 

 

 

1

150

1

2

5

—-

--

8

175

3

2

12

^ —

17

200

1

8

7

16

225

-—

3

3

-— !

6

250

 

 

 

 

 

1

1

2

Пх

1

6

8

20

10

4

1

л=50

195

в)

 

 

 

 

 

X

 

 

 

Y

5

15

20

25

30

35

100

 

 

 

 

 

6

1

7

120

 

 

 

 

 

4

2

6

140

8

10

5

23

160

3

4

3

10

180

2

1

I

4

Пх

5

5

11

11

5

10

3

л = 50

§ 2. Криволинейная корреляция

Если график регрессии — кривая

линия, то корреляцию

назы­

вают криволинейной, В

частности,

в случае

параболической

корре­

ляции второго порядка выборочное уравнение регрессии К на X

имеет вид

 

 

 

 

 

 

 

yj, = Ax^ +

Bx+C.

 

 

 

Неизвестные параметры

А, В и С находят (например, методом Га­

усса) из системы уравнений:

 

 

 

 

 

( S п^х^) л + ( S п^х^) В + (^

п^х^) С = 2

^хУхХ\

 

( 2 ^хХ^) л +

( 2 ^хХ^) ^ + (Zif^xx) с = 2

f^x'yxXf

(*)

(Еп^х^)

А + (Еп^х)

В + пС =

Еп;^^.

 

Аналогично находится выборочное уравнение регрессии X на Y: Ху^ЛгУ^ + Вгу + Сг.

Идя оценки силы корреляции Y на X служит выборочное корре* ляционное отношение (отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению признака Y)

"^ух =^межгр/^общ»

или в других обозначениях

Здесь

Ух = У ^межгр = К ( 2 ^х (Ух—'У^)/п. <Уу= 1^^общ =

=К(2^ИУ-^)^)/Л.

196

где п—объем выборки (сумма всех частот); Пх — частота значения х признака X; Пу—частота значения у признака К; у^ — условная

средняя признака К; у—общая средняя признака К.

Аналогично определяется выборочное корреляционное отношение

X к У:

у'

537. Найти выборочное уравнение регрессий у^ = ^Ах^-^Вх + С по данным, приведенным в корреляцион­ ной табл. 8.

Оценить силу корреляционной связи по выборочному корреляционному отношению.

 

 

 

 

 

 

 

 

Т а б л и ц а

8

 

 

 

 

 

X

 

 

 

 

 

 

Y

2

 

 

3

5

 

''у

 

 

 

 

 

 

 

 

 

 

25

20

 

 

 

20

 

 

45

 

30

I

 

 

31

 

 

ПО

 

 

1

48

 

 

49

 

 

Пх

20

 

31

49

 

/1=100

 

 

Р е ш е н и е . Составим

расчетную табл. 9.

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

9

X

Ух

'';с^

«х^*

п^х*

"х^*

"х^х

«xi'x^

''х'Ух'''

 

 

 

 

2

20

25

40

80

160

320

500

1000

2000

3

31

47,1

93

279 i

837

2 511

1460

4 380

13 141

5

49

108,67

245

1225

6125

30 625

5325

26 624

133 121

2

100

 

378

1584

7122

33 456

7285

32 004

148 262

Подставив

числа, содержащиеся в последней строке табл. 9,

в (*), получим

систему уравнений

относительно неизвестных коэф­

фициентов Л, В, С:

 

 

 

33456 Л +

7122 В+

1584 С = 148262,

 

7122 А +1584 В +

378 С = 32004,

 

1584 Л +

378 Б +

100 С = 7285.

197

Решив

эту систему

(например,

методом Гаусса), найдем: Л =2,94,

В=7^7^

С=—1,25.

Подставив

найденные коэффициенты в уравне­

ние регрессии ух = Ах^+Вх+С^

окончательно получим

^^=2,94х*+7,27х— 1.25.

Для того чтобы вычислить выборочное корреляционное отноше­ ние t)yxf предварительно найдем общую среднюю у, общее среднее квадратическое отклонение Оу и межгрупповое среднее квадратиче­ ское отклонение а- :

Ух

У = ( S Луу)/л=(20>25+31>45+49> 110)7100=72,85;

Oy=\^(Zny(y-^y)*)/n=

= ^"(20(25—72,85)«+31 (45—72,85)» + 49 (110~72,85)«)/100 =37,07;

<^77

^У(Епх(Ух-У)*)/п^

 

= V^(20(25—72,85)«+31 (47,1—72.85)« + 49 (108,67-. 72,85)»)/100 = =35,95.

Найдем искомое выборочное корреляционное отношение:

г\ух = о - lOy = 35,95/37,07=0,97.

^х'

538. Найти выборочное уравнение регрессии у^=Лл:^4- +Вх + С и выборочное корреляционное отношение г\ух по данным, приведенным в корреляционной таблице:

а)

 

 

 

 

X

 

 

 

Y

0

1

2

3

 

4

«1/

0

1 ^^

1

1

 

 

 

20

3

1

20

 

 

 

 

21

5

3

5

10

2

 

 

20

10

 

 

7

12

 

 

19

17

 

 

 

14

1

20

20

Пх

22

26

18

20

л=100

198

б)

у

 

 

 

X

 

1 %

0

4

6

7

10

7

19

1

1 1

 

 

 

21

13

2

14

 

 

 

1

16

40

 

3

22

2

 

 

27

80

 

 

 

15

 

 

15

200

 

 

 

 

21

 

21

Пх

21

18

23

17

21

л = 100

в)

 

 

 

 

 

 

 

Y

0

 

4

X

 

 

 

 

5

 

%

1

 

 

50

 

5

1

 

56

35

 

 

44

 

 

44

50

 

 

5

45

 

50

Пх

50

 

54

46

 

/1 =

150

г)

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

Y

0

1

2

3

4

 

%

10

 

20

5

 

 

 

 

25

11

7

15

3

1

 

 

26

20

 

3

17

4

7

!

24

35

 

 

8

13

 

28

50

 

 

 

5

42

 

47

Пх

27

23

28

23

49

д = 150

199