Учебник по теориии вероятности
.pdfНайдем условные моменты первого, второго, третьего и четверо того порядков:
|
M l - — = - ^ 5 5 |
= 0 . 0 3 , |
A l 2 = — ; р - - = |
jgg |
=4,05, |
|
|
А1з= |
|
|
_ |
= - |
1,53, |
j^m |
Si4-14s2+36 |
$3+24s4 |
= |
147+14129+36 . 69+2419 .^ ^^ |
||
Л14 |
pj |
|
|
щ | |
=48,93. |
Найдем центральные эмпирические моменты третьего и четвер того порядков:
= [_ 1,53—3 0,03 4,05 + 2 (0,03)^] 4« = — 121,245,
=[48,93—4 0,03.(— 1,53)+
+6 .(0,03)« -4.05—3 (0,03)*] 4* = 12578,679.
Найдем |
искомые асимметрию |
и эксцесс, учитывая, что Од^ж |
= K D ^ = |
V^ 64,78 (дисперсия Dg |
была найдена ранее, см. задачу |
529): |
а , = т,/аЬ = -~ 121,245/(l/'64J8)« = —0,25, |
|
|
||
е^=mJOB—3=12578,679/( |
У 64,78)*—3=26,97. |
534. Найти методом сумм асимметрию и эксцесс по заданному распределению выборки объема п=100:
а) X/ 10,2 10,4 10,6 |
10,8 11,0 11,2 11,4 11,6 11,8 12,0; |
|||||||||
П; |
2 |
3 |
8 |
13 |
25 |
20 |
12 |
10 |
6 |
1 |
б) Xi |
12. 14 |
16 |
18 |
20 |
22. |
|
|
|
|
|
п^ |
5 |
15 |
50 |
16 |
10 |
4 |
|
|
|
|
Глава двенадцатая
ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ
§ 1. Линейная корреляция
Если обе линии регрессии К на X и X на V—прямые, то кор
реляцию называют линейной. |
|
|
|
Выборочное уравнение прямой линии регрессии Y на X имеет вид |
|||
-. - |
а-. |
_ |
|
yx—y^rs |
— ix—x), |
(•) |
|
^Дв Vx—условная средняя; х и у^—выборочные средние |
признаков |
||
X и г; Сх и Оу—выборочные средние |
квадратические отклонения; |
||
Гв—выборочный коэффициент корреляции, причем |
|
гв = ( 2 f^xyXy—nxyyinOjfOy).
190
Выборочное уравнение прямой линии регрессии X на У имеет вид
( • •)
Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целе сообразно перейти к условным вариантам:
Ui = (Xi—Ci)/hu |
t;y=(£/y—С2)/Л2. |
где Cj—«ложный нуль» вариант X (новое начало отсчета); в ка честве ложного нуля выгодно принять рарианту, которая располо жена примерно в середине еариационного ряда (условимся прини мать в качестве ложного нуля варианту, имеющую наибольшую частоту); hi—шаг, т. е. разность между двумя соседними вариантами X; Сг—ложный нуль вариант К; Лг—шаг вариант К.
В этом случае выборочный коэффициент корреляции
Гв= ( 2 Пауии-'пйд)/{пОаОу),
причем слагаемое 2Li"tiv^^^ удобно вычислять, используя расчетную табл. 7 (см. далее решение задачи 535). .
Величины сГ, V, o„, а^ могут быть найдены либо методом произ/ ведений (при большом числе данных), либо непосредственно по фор мулам:
'и = (^Паи)/п, v^'^n^v/n, Оа=К й*—(il)2, o^ = Vv^ — {v)^.
Зная эти величины, можно определить входящие в уравнения рег рессии (•) и (*«) величины по формулам:
x^uhi + C-if "y^vhz + Cz, Ox^ojii, |
Oy=^(S^2- |
Для оценки силы линейной корреляционной связи служит вы борочный коэффициент корреляции г^.
Для обоснованного суждения о наличии связи между количест венными признаками следует проверить, значим ли выборочный ко эффициент корреляции (см. гл. ХП1, § 12).
535. Найти выборочное уравнение прямой линии рег рессии К на X по данным, приведенным в корреляцион ной табл. 5.
Т а б л и ц а 5
Y |
20 |
25 |
X |
35 |
40 |
«.. |
30 |
||||||
|
|
|
|
|
|
V |
16 |
4 |
6 |
10 |
— |
_ |
10 |
26 |
-. |
8 |
18 |
|||
36 |
— |
— |
32 |
3 |
9 |
44 |
46 |
«.. |
.». |
4 |
12 |
6 |
22 |
56 |
—* |
— |
—~ |
1 |
5 |
6 |
Пх |
4 |
14 |
46 |
16 |
20 |
п = 100 |
191
Р е ш е н и е . Составим корреляционную табл. 6 в условных ва риантах, выбрав в качестве ложных нулей Ci=30 и С2==36 (каж дая из этих вариант расположена в середине соответствующего вариационного ряда).
Т а б л и ц а 6
и
.V |
-2 |
1 ~^ |
1 ^ |
1 |
! ^ |
1 % |
|
|
|
|
|
|
|
— 2 |
4 |
6 |
— |
— |
— |
10 |
—1 |
— |
8 |
10 |
— |
— |
18 |
0 |
— |
— |
32 |
3 |
9 |
44 |
1 1 |
— |
— |
4 |
12 |
в |
22 |
2 |
— |
— |
— |
1 |
5 |
6 |
Па |
4 |
1 ^^ |
46 |
16 |
20 |
л=100 |
Найдем и и v:
«=(2«tt£/)M = (4.(—2)+14.(—1) + 46.0+1б. 1+20.2)/100 = 0,34; t' = (2''vt')/«==(10(---2)+18(--l) + 44.0+22.1+6.2)/100==---0,04. Найдем вспомогательные величины и^ и v^:
I ? ^ ( 2 / i e a a ) / n = ( 4 . 4 + 1 4 . 1 + l6.1+20.4)/100=l,26; t^=(S'*v^'^)/'»=(^0'4+181+22.1+6.4)/100 = 1.04.
Найдем аа и о^
aa = l/l? - ~(u)«= F^l,26—0,342=1,07; а^ = К t;«—(t»)2 = |/'l,04—0,042= 1,02.
Найдем ^figt^uv, для чего составим расчетную табл. 7. Суммируя числа последнего столбца табл. 7, находим
2 у- (/ = 2 '^«v"^= ^^•
V
Для контроля вычислений находим сумму чисел последней строки:
Совпадение сумм свидетельствует о правильности вычислений. Пояснения к составлению табл. 7.
1. Произведение частоты п^^ на варианту и, т.е. Лц^гг, записы вают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: 4-(—2)= —8;,6-(—1)= —6.
192
со |
|
|
|
|
|
|
а |
^ |
11 99 |
1 ^ |
1 ^ |
||
X |
||||||
|
Si |
|
|
|
|
|
1 |
^ |
х»« |
|
оо |
|
|
|
II |
т |
|
1 |
|
см |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
^ |
|
|
|
|
|
|
|
|
|
|
0 0 |
|
1 ^ |
|
|
|
|
|
|
|
|
|
|
|
jiJ |
|
|
|
|
|
|
|
СО |
1 |
о |
|
^ |
о |
^ |
|
|
|
СО |
||||
|
|
|
|
1 О |
|
|
|
|
IJ 1 |
1 Т |
|
|
|
|
7 |
00 |
|
1 |
||
|
|
и |
|
m |
|
1 |
* |
|
|
1 см^,^ |
- 1 — л |
|
|
|
|
|
1 00-< |
1 |
о |
1 |
'^ |
|
|
II |
||
1 |
см |
1 |
с^ |
|||
|
1 |
ь« |
||||
1 |
^' |
^ ^ |
1 |
о |
||
|
|
|
|
W- |
|
1 |
|
|
|
|
|
|
Г" |
1 |
"^ |
|
|
|
11 |
^ < ^ |
|
СМ |
|
|
|
|
|
1 ^
Ы~
L.W
F1 юF <£> S3
[ см 1 d
см |
R |
^ |
'^ |
17 |
|
|
|
zl |
|
1 |
|
^ |
1 |
о |
|
R |
|
н8 |
|
1 |
1 |
1 сч 1 |
1 |
1 |
1 |
1 |
00 1 ю |
|
1 |
|
|
|
|
1 |
|
|
|
|
|
|
|
|
т |
|
|
|
|
о 1 |
|
1 |
О |
1 "^ 1 |
см |
1 W |
::5^ |
|
/ / |
Si |
|||||
|
|
|
|
|
|
|
1/ о |
|
1 |
1 |
|
II |
|
1/ |
|
|
|
^ |
|
|
|
|
|
|
|
|
193
2. Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же стро ки «столбца и». Например, для первой строки а = — 8 + ( — 6 ) = — 1 4 .
3. |
Наконец, умножают варианту v нг U и полученное |
произве |
||||
дение записывают в соответствующую клетку «столбца t/(/». |
Напри |
|||||
мер, в |
первой |
строке |
таблицы |
t; = — 2, /7=—14, |
следовательно, |
|
i;£/ = (—2).(—14) = 28. |
|
|
|
|
||
4. |
Сложив все числа «столбца t>t/», получают сумму ^vU, ко- |
|||||
торая |
равна |
искомой |
сумме |
^Пц^^ии. Например, |
V |
табл. 7 |
для |
2 ^ ( 7 = 8 2 , следовательно, искомая сумма y\ntipUV=^S2.
V Для контроля аналогичные вычисления производят по столбцам: произведения na^v записывают в левый нижний угол клетки, содер жащей значение частоты; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму помещают в «строку К»; наконец, умножают каждую варианту и нг V и резуль тат записывают в клетках последней строки.
Сложив все числа последней строки, получают сумму 2 ^^f
и
которая также равна искомой сумме y\nui,uv. Например, для табл. 7
2 ^ ^ = 82, следовательно, |
^Пц^иу^82. |
и
Найдем искомый выборочный коэффициент корреляции:
|
y\nuvUV'-ruIv |
|
82— 100-0,34 • (—0,04) ^ -^ |
|
'"^ |
поао^ |
^ |
100.1.07.1,02 |
==^'^^- |
Найдем шаги h^ и hz (разности между любыми двумя соседними вариантами):
Лх ==25—20=5; Аа = 26—16 = 10.
Найдем X н"у,учитывая, что Сх = 30, 0^ = 36:
x=;7I./ii + Ci=0,34 . 5+ 30 = 31,70; l7=^./ia + C2 = (—0,04). 10+36 = 35,60.
Найдем Qjf и Oyi
a;p = /ii.a„ = 5.1,07 = 5,35; а^,=Лаа^ = 10-1,02 = 10,2.
Подставив найденные величины в соотношение (*), получим искомое уравнение прямой линии регрессии Y на X:
5^;,-35,60 = 0,76 i | | (;^-31,70).
или окончательно J^;^=1,45JC—10,36.
194
536. Найти выборочные уравнения прямых линий регрессии У на X и X на У по данным, приведенным в следующих корреляционных таблицах:
а)
|
|
|
|
|
|
X |
|
|
|
|
Y |
5 |
! |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
% |
|
||||||||||
100 |
2 |
|
1 |
|
|
|
|
|
|
3 |
120 |
3 |
' |
4 |
3 |
|
|
|
|
|
10 |
140 |
— |
|
— |
5 |
10 |
8 |
— |
-— |
— |
23 |
160 |
— |
|
— |
— |
1 |
— |
6 |
1 |
1 |
9 |
180 |
|
|
|
|
|
|
|
4 |
1 |
5 |
Пх |
5 |
1 |
5 |
8 |
11 |
8 |
6 |
5 |
2 |
л=50 |
б)
X
Y |
•в 1 |
23 |
28 |
33 j |
38 |
j 43 |
48 |
% |
|
125 |
|||||||||
— |
1 |
|
|
|
|
|
1 |
||
150 |
1 |
2 |
5 |
— |
—- |
-- |
— |
8 |
|
175 |
— |
3 |
2 |
12 |
— |
^ — |
— |
17 |
|
200 |
— |
— |
1 |
8 |
7 |
— |
— |
16 |
|
225 |
— |
— |
— |
-— |
3 |
3 |
-— ! |
6 |
|
250 |
|
|
|
|
|
1 |
1 |
2 |
|
Пх |
1 |
6 |
8 |
20 |
10 |
4 |
1 |
л=50 |
195
в)
|
|
|
|
|
X |
|
|
|
|
Y |
5 |
1С |
15 |
20 |
25 |
30 |
35 |
"у |
|
100 |
|||||||||
|
|
|
|
|
6 |
1 |
7 |
||
120 |
|
|
|
|
|
4 |
2 |
6 |
|
140 |
— |
— |
8 |
10 |
5 |
— |
— |
23 |
|
160 |
3 |
4 |
3 |
— |
— |
— |
— |
10 |
|
180 |
2 |
1 |
— |
I |
— |
— |
— |
4 |
|
Пх |
5 |
5 |
11 |
11 |
5 |
10 |
3 |
л = 50 |
§ 2. Криволинейная корреляция
Если график регрессии — кривая |
линия, то корреляцию |
назы |
||||
вают криволинейной, В |
частности, |
в случае |
параболической |
корре |
||
ляции второго порядка выборочное уравнение регрессии К на X |
||||||
имеет вид |
|
|
|
|
|
|
|
yj, = Ax^ + |
Bx+C. |
|
|
|
|
Неизвестные параметры |
А, В и С находят (например, методом Га |
|||||
усса) из системы уравнений: |
|
|
|
|
|
|
( S п^х^) л + ( S п^х^) В + (^ |
п^х^) С = 2 |
^хУхХ\ |
|
|||
( 2 ^хХ^) л + |
( 2 ^хХ^) ^ + (Zif^xx) с = 2 |
f^x'yxXf |
(*) |
|||
(Еп^х^) |
А + (Еп^х) |
В + пС = |
Еп;^^. |
|
Аналогично находится выборочное уравнение регрессии X на Y: Ху^ЛгУ^ + Вгу + Сг.
Идя оценки силы корреляции Y на X служит выборочное корре* ляционное отношение (отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению признака Y)
"^ух =^межгр/^общ»
или в других обозначениях
Здесь
Ух = У ^межгр = К ( 2 ^х (Ух—'У^)/п. <Уу= 1^^общ =
=К(2^ИУ-^)^)/Л.
196
где п—объем выборки (сумма всех частот); Пх — частота значения х признака X; Пу—частота значения у признака К; у^ — условная
средняя признака К; у—общая средняя признака К.
Аналогично определяется выборочное корреляционное отношение
X к У:
у'
537. Найти выборочное уравнение регрессий у^ = ^Ах^-^Вх + С по данным, приведенным в корреляцион ной табл. 8.
Оценить силу корреляционной связи по выборочному корреляционному отношению.
|
|
|
|
|
|
|
|
Т а б л и ц а |
8 |
|
|
|
|
|
|
X |
|
|
|
|
|
|
Y |
2 |
|
|
3 |
5 |
|
''у |
|
|
|
|
|
|
|
|
|
|
|||
|
25 |
20 |
|
— |
— |
|
|
20 |
|
|
|
45 |
— |
|
30 |
I |
|
|
31 |
|
|
|
ПО |
— |
|
|
1 |
48 |
|
|
49 |
|
|
Пх |
20 |
|
31 |
49 |
|
/1=100 |
|
||
|
Р е ш е н и е . Составим |
расчетную табл. 9. |
|
|
|
|
||||
|
|
|
|
|
|
|
|
Т а б л и ц а |
9 |
|
X |
"х |
Ух |
'';с^ |
«х^* |
п^х* |
"х^* |
"х^х |
«xi'x^ |
''х'Ух''' |
|
|
|
|
||||||||
2 |
20 |
25 |
40 |
80 |
160 |
320 |
500 |
1000 |
2000 |
|
3 |
31 |
47,1 |
93 |
279 i |
837 |
2 511 |
1460 |
4 380 |
13 141 |
|
5 |
49 |
108,67 |
245 |
1225 |
6125 |
30 625 |
5325 |
26 624 |
133 121 |
|
2 |
100 |
|
378 |
1584 |
7122 |
33 456 |
7285 |
32 004 |
148 262 |
Подставив |
числа, содержащиеся в последней строке табл. 9, |
||
в (*), получим |
систему уравнений |
относительно неизвестных коэф |
|
фициентов Л, В, С: |
|
|
|
|
33456 Л + |
7122 В+ |
1584 С = 148262, |
|
7122 А +1584 В + |
378 С = 32004, |
|
|
1584 Л + |
378 Б + |
100 С = 7285. |
197
Решив |
эту систему |
(например, |
методом Гаусса), найдем: Л =2,94, |
В=7^7^ |
С=—1,25. |
Подставив |
найденные коэффициенты в уравне |
ние регрессии ух = Ах^+Вх+С^ |
окончательно получим |
^^=2,94х*+7,27х— 1.25.
Для того чтобы вычислить выборочное корреляционное отноше ние t)yxf предварительно найдем общую среднюю у, общее среднее квадратическое отклонение Оу и межгрупповое среднее квадратиче ское отклонение а- :
Ух
У = ( S Луу)/л=(20>25+31>45+49> 110)7100=72,85;
Oy=\^(Zny(y-^y)*)/n=
= ^"(20(25—72,85)«+31 (45—72,85)» + 49 (110~72,85)«)/100 =37,07;
<^77 |
^У(Епх(Ух-У)*)/п^ |
^х |
|
= V^(20(25—72,85)«+31 (47,1—72.85)« + 49 (108,67-. 72,85)»)/100 = =35,95.
Найдем искомое выборочное корреляционное отношение:
г\ух = о - lOy = 35,95/37,07=0,97.
^х'
538. Найти выборочное уравнение регрессии у^=Лл:^4- +Вх + С и выборочное корреляционное отношение г\ух по данным, приведенным в корреляционной таблице:
а)
|
|
|
|
X |
|
|
|
Y |
0 |
1 |
2 |
3 |
|
4 |
«1/ |
0 |
1 ^^ |
1 |
1 |
|
|
|
20 |
3 |
1 |
20 |
|
|
|
|
21 |
5 |
3 |
5 |
10 |
2 |
|
|
20 |
10 |
|
|
7 |
12 |
|
|
19 |
17 |
|
|
|
14 |
1 |
20 |
20 |
Пх |
22 |
26 |
18 |
20 |
л=100 |
198
б)
у |
|
|
|
X |
|
1 % |
|
0 |
4 |
6 |
7 |
10 |
|||
7 |
19 |
1 |
1 1 |
|
|
|
21 |
13 |
2 |
14 |
|
|
|
1 |
16 |
40 |
|
3 |
22 |
2 |
|
|
27 |
80 |
|
|
|
15 |
|
|
15 |
200 |
|
|
|
|
21 |
|
21 |
Пх |
21 |
18 |
23 |
17 |
21 |
л = 100 |
|
в) |
|
|
|
|
|
|
|
Y |
0 |
|
4 |
X |
|
|
|
|
5 |
|
% |
||||
1 |
|
|
|||||
50 |
|
5 |
1 |
|
56 |
||
35 |
|
|
44 |
|
|
44 |
|
50 |
|
|
5 |
45 |
|
50 |
|
Пх |
50 |
|
54 |
46 |
|
/1 = |
150 |
г) |
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
Y |
0 |
1 |
2 |
3 |
4 |
|
% |
10 |
|
||||||
20 |
5 |
|
|
|
|
25 |
|
11 |
7 |
15 |
3 |
1 |
|
|
26 |
20 |
|
3 |
17 |
4 |
7 |
! |
24 |
35 |
|
|
8 |
13 |
|
28 |
|
50 |
|
|
|
5 |
42 |
|
47 |
Пх |
27 |
23 |
28 |
23 |
49 |
д = 150 |
199