
книги из ГПНТБ / Рыжов, П. А. Математическая статистика в горном деле учеб. пособие
.pdfСравнение данных последних двух строк показывает, что прямая, полученная из условия наибольшей близости к точкам корреляционного поля, оказалась в наибольшей близости к эмпирической линии связи. Эта прямая вырав нивает наилучшим образом эмпирическую линию связи (рис. 48).
В предпоследней нижней строке табл. 50 приведены значения уі, необходимые для построения ломаной эмпи рической линии связи.
На рис. 48 изображены эмпирическая и теоретическая линии связи, построенные по данным предпоследней и по
следней |
(нижней) |
строки табл. 50. |
|
|
Кроме прямой связи Y с X можно рассматривать |
так |
|||
же и прямую связи X с Y, параметры которой |
можно оп |
|||
ределить, |
решив |
нормальную систему уравнений |
(А). |
|
Из табл. 50 берут |
соответствующие значения |
для |
этих |
|
уравнений. |
|
|
|
Из табл.50 имеем: п= 199; 2t/-m = 217,5; S*-m = 384,5, St/2 -m = 411,75; Б * 2 - т = 598,25. Система нормальных урав нений запишется так:
1 9 9 а |
' + 217,50'= 384,5, 1 |
|
217,5а'+ |
411,756' = 598,25. ' |
- . |
Разделив каждое из этих уравнений на коэффициенты при а', получим
а ' + 1,096'= 1,93, \ а' + 1,896' = 2,75. >
Вычитая из второго уравнения первое, имеем 0,8&'= 0,82; 6' = 1,03, откудд а' = 0,81.
Следовательно, Zy = 0,81 + 1,03 у.
Теснота связи между двумя взаимозависимыми при знаками характеризуется линейным коэффициентом кор реляции г, который показывает, существует ли и насколь ко велика связь между показателями.
Значение коэффициента корреляции может изменять
ся в пределах от — 1 до + 1 . Знак ( + ) |
показывает |
пря |
|||
мую связь, знак (—) обратную. Если коэффициент |
кор |
||||
реляции равен нулю, то связи |
между |
признаками |
нет. |
||
Если |
коэффициент |
корреляции |
равен |
+ 1 или — 1 , то |
|
между |
признаками |
существует |
функциональная |
связь. |
6 — 1 9 24 |
— 161 — |
Коэффициент корреляции определяется по формуле
|
|
|
г = |
XY — |
XY, |
|
|
|
(6.9) |
||
|
|
|
|
|
ОхОу |
|
|
|
|
|
|
где XY— среднее значение |
произведений X на У; XY — |
||||||||||
средние значения соответствующих признаков; ох |
и |
оѵ— |
|||||||||
средние |
|
квадратнческне |
отклонения, |
найденные |
по |
при |
|||||
знаку Л' и по признаку Y. |
|
|
|
|
|
|
|
||||
При большом числе испытаний данные двух взаимоза |
|||||||||||
висимых рядов признаков |
сводятся |
в |
корреляционную |
||||||||
таблицу, по данным которой определяют |
|
|
|
|
|||||||
|
|
ѣхуіПху |
_ |
2хтх |
_ |
|
Ъу-піу |
|
|
||
XY |
|
— |
А' — |
|
• Y = |
- |
— . |
|
|
||
|
|
г 2 I , x 1 - m x |
|
2 |
|
2>Уг-Щ |
|
|
|
|
|
a * = — |
A ; |
o v = — - |
|
l 2 |
- |
|
|
||||
В нашем примере (см. табл. 50): |
|
|
|
|
|
||||||
|
|
|
ЪтХу |
|
|
199 |
|
|
|
|
|
|
|
Х = І * ^ = |
^ |
=1,93; |
|
|
|
|
|||
|
|
|
У.тА |
|
199 |
|
|
|
|
|
|
|
|
|
2ш„ |
199 |
|
|
|
|
|
||
2 |
|
: Х 2 " ' Х |
Х а = |
і£ІЫ5_1 ,93»=1,67; |
|
|
|||||
Ох |
|
|
|
||||||||
: |
2/и* |
|
|
199 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
ffje |
= |
у 1,67 « |
1,29; |
|
|
|
|
|
2
ff»
^ І . ^ ^ |
І І Ы 5 |
- 1 ^ = 0,88; |
2m„ |
199 |
|
|
а„ = у О Ж = 0,94; |
|
Гу/х = |
3,01 - 1,93-1,09 |
= 0,75. |
|
1,29-0,94 |
|
Погрешность коэффициента корреляции определяют
—162 —
по формуле
Подставляя значения соответствующих величин, получим
1 - |
|
0,752 |
п |
л о |
|
а ^ - у і 9 9 - = 0 ' 0 3 ' |
|||||
Надежность коэффициента |
корреляции определяют |
||||
по формуле |
|
|
|
|
|
ц = |
^ |
, |
|
(6.1.) |
|
|
|
OY |
|
|
|
В .нашем примере и = |
0,75 yÏ99 |
= |
п п п |
||
|
—— |
23,8. |
|||
|
1 — 0,56 |
|
|
Согласно теореме Ляпунова, при (.1^2,6 можно ут верждать, что связь между признаками надежная. Таким
образом, г3 / /ж = 0,75±0,03. |
|
|
|
||
Зная значения |
г, ах, |
ау, |
можно |
вычислить |
коэффици |
енты корреляционного |
уравнения |
по следующим форму |
|||
лам: |
|
_ |
_ |
|
|
|
a = Y — bX, |
|
|||
|
bx/y = |
rx/v — , |
(6.12) |
||
|
|
|
Oy |
|
|
|
by/x |
= rv/x |
. |
|
|
|
|
|
Ox |
|
|
В нашем примере |
|
1 29 |
|
|
|
bx/y |
|
|
1,029; |
|
|
= 0J5——= |
|
||||
|
у |
|
0,94 |
|
|
|
|
|
0 94 |
|
|
Ьу/Х |
= 0,75 - ^ - = |
0,547; |
|
||
а = |
1,09 — 0,55 -1,93 = 0,03. |
|
Произведение коэффициентов регрессии равно квадрату коэффициента корреляции:
|
by/x-bx/y |
= г2 . |
(6.13) |
В нашем примере |
1,029 - 0,547 = 0,752. |
|
|
6* |
— 163 — |
|
При функциональной связи между 7 м X обе прямые связи совпадают и поэтому b x / v = l b v / x , следовательно, г = ± 1 .
Чем больше угол между прямыми связи, тем меньше коэффициент корреляции (рис. 49).
Статистические характеристики распределения свин ца Y и цинка Л' по данным тех же 199 проб были выше
|
|
|
|
|
|
Т а б л и ц а 50а |
|
ч \ |
х |
|
Сопержаннс |
цинка Л'. % |
|
|
|
У |
\ ^ |
|
|
|
|
|
|
|
0,5 |
1,5 |
3,5 |
•1,5 |
5,5 |
Ii,5 |
Итого |
Содержание свинца У, %
0,5 |
41 |
67 |
11 |
|
9 |
|
|
121 |
|
(1) |
(0) |
( - 1 ) |
|
( - 3 ) |
|
|
|
1,5 |
|
23 |
20 |
5 |
4 |
|
1 |
53 |
(0) |
|
(0) |
(0) |
(0) |
(0) |
|
(0) |
|
2,5 |
|
1 |
2 |
10 |
9 |
1 |
|
16 |
|
|
(0) |
(1) |
(2) |
(3) |
(4) |
|
|
3,5 |
|
|
|
3 |
|
1 |
1 |
5 |
|
|
(0) |
|
(4) |
|
(8) |
(10) |
|
4,5 |
|
|
|
|
1 |
1 |
|
2 |
|
|
(0) |
|
|
(9) |
(12) |
|
|
5,5 |
|
|
|
|
|
1 |
1 |
2 |
|
|
(0) |
|
|
|
(16) |
(20) |
|
И т о г о |
41 |
91 |
33 |
18 |
9 |
3 |
199 |
(см. пример L6) вычислены другим приемом, однако зна |
|||||||
чения У, Oy, X, Ох были |
получены |
те же. Составим |
по |
||||
данным этих же 199 проб корреляционную |
таблицу 50а |
||||||
(в которой цифры |
в клетках — это частоты |
(цифр_ы без |
|||||
скобок) |
и произведения |
отклонений |
(у—У) • (х—X) = ті£ |
(цифры в скобках).
—164 —
Затем составляется таблица 51.
Отметим, что знак произведений г|-і| положителен в верхнем левом и нижнем правом квадрантах таблицы (на квадранты таблица разделена графой и строкой, для ко торых і ] - | = 0) и отрицателен в двух остальных.
|
|
X |
|
X |
|
|
|
Рис. |
49 |
|
|
|
|
|
|
Т а б л и ц а 51 |
|
|
Ч ислснность |
|
Произведения |
||
|
(+) |
( - ) |
И т о г о |
( + ) |
( - ) |
|
|
||||
1 |
43 |
11 |
32 |
32 |
_ |
2 |
10 |
—. |
10 |
20 |
— |
3 |
2 |
2 |
0 |
0 |
— |
4 |
4 |
— |
4 |
16 |
— |
О |
|
|
|
О |
|
О |
{ |
z |
} |
О |
—. |
9 |
9 |
||||
10 |
1 |
— |
1 |
10 |
— |
12 |
1 |
1 |
12 |
— |
|
16 |
1 |
— |
1 |
16 |
•—. |
20 |
1 |
— |
1 |
20 |
— |
|
|
|
|
||
— |
65 |
13 |
|
143 |
— |
Числа в графе 4 табл. 51 получены вычитанием чисел, стоящих в графе 3 из чисел, стоящих в графе 2. Получен ные значения разностей умножают на произведение т)-£ (из графы 1),и эти значения заносят в графы 5 и 6.
|
Sri •£ |
2т)-1=143; разделив ее на я =190, получим: |
—-—- = |
— 165 —
В примере 1.6 были получены следующие значения:
а р = ± 0 , 9 4 , |
о* = + 1,29, f =_. — = --0,41; |
86 |
SriE |
= 0,72 + 0,43-0,41 = 0,90.
Коэффициент корреляции определяется по формуле
|
г = — Р — . |
(6.14) |
|
|
Ох-Oy |
|
|
В нашем случае |
0,90- |
|
|
г = |
= |
0,74. |
|
|
1,29-0,94 |
|
Вычисление параметров уравнения линейной связи. При изучении статистического материала по одному варь
ирующему |
признаку X основными показателями |
служат |
X и о*. |
|
|
При анализе материалов по дву_м_признакам X п У |
||
основными |
показателями служат: X, У, ох, оу, |
гуІх- Эти |
показатели и вычисляют в первую очередь. Затем |
опреде |
|||
ляют эмпирическую линию связи, после |
чего вычисляют |
|||
параметры теоретической |
линии |
связи |
У по X |
(Yx = |
= a + bx): |
|
|
|
|
Oy |
|
_ |
_ |
|
by'x = Гу/х — ; |
а = |
у — ЬХ. |
|
Ox
Применив эти формулы для примера 6.1, имеем:
Y =1,93; |
Y = |
1,09; |
ах |
=1,29; |
оѵ = 0,94; |
|
|
|
|
|
|
0 94 |
|
Гуіх = |
0,75; |
by/x = |
0,75 |
• |
= |
0,55; |
а = F - by/x • X = 1,09 - 0,55 • 1,93 = 0,03; y = 0,03 + 0 Д О .
Квадратическая ошибка, с которой вычислено значе ние содержания свинца по содержанию цинка, составит:
Oy У1 — г2 = 0,94-0,66 = ± 0 , 6 % .
— 166 —
Коэффициент детерминации равен квадрату коэффи циента корреляции:
d = г2 = 0,752 = 0,56.
Коэффициент детерминации измеряет долю тех эле ментов вариации в У, которые содержатся также и в вари ации X. Если известно, что зависимая переменная нахо дится в отношении причинной связи с независимой переменной, то коэффициент детерминации определяет долю, которая может быть рассмотрена как причинно обусловленная изменениями факториального признака.
Пример 6.2. В табл. 52 приведены значения удельного веса каменного угля и зольности в 18 бороздовых пробах, отобранных из различных участков по одному и тому же пласту.
Рассматривая первые две графы табл. 52, замечаем, что зольность (X) увеличивается, при увеличении значе ния удельного веса. Однако эта связь не всегда сохраня ется. В одном случае значение У увеличивается при неиз меняющемся X, в другом случае изменение X не вызывает изменения У. Объясняется это тем, что удельный вес угля
зависит не только от зольности, но и от влажности |
угля, |
а также и от различия их метаморфизма. |
|
Предположив, что связь между удельным весом |
угля |
и зольностью прямолинейная, определим угловой коэффи циент линии связи по формуле
|
_ 2(х-у) — |
пХ-7 |
|||
|
~ |
ЪХ2 |
— |
п-Х2 |
|
По данным табл. 52 находим: |
|
||||
|
_ |
2г/г |
26,6 |
||
|
|
n |
18 |
|
|
|
_ |
2*І |
339 |
= 18,83, |
|
|
Х = — = -~ |
||||
|
|
п |
18 |
|
|
Ъ — |
527,1 - 18-18-83-1,48 |
527,1 -501,63 |
|||
8251 — 18-(18,83)2 |
8251 - 6382,26 |
||||
|
|||||
|
|
25,47 |
|
||
|
|
1868,74 = |
0,0136, |
— 167 —
Значение по пробе
ХУ
ул. пес содерж.
|
4 |
4,8 |
16 |
1,44 |
|
4 |
5,2 |
16 |
1,69 |
|
5 |
6,5 |
25 |
1,69 |
|
7 |
9,1 |
49 |
1,69 |
|
6 |
8,4 |
36 |
1,96 |
|
9 |
12,6 |
81 |
1,96 |
|
20 |
28 |
400 |
1,96 |
|
20 |
28 |
400 |
1,96 |
|
17 |
25,5 |
289 |
2,25 |
|
24 |
36 |
576 |
2,25 |
|
24 |
36 |
576 |
2,25 |
|
24 |
36 |
576 |
2,25 |
|
25 |
37,5 |
625 |
2,25 |
|
25 |
40,0 |
625 |
2,56 |
|
26 |
41,6 |
676 |
2,56 |
|
30 |
51 |
900 |
2,89 |
|
33 |
56,1 |
1089 |
2,89 |
|
36 |
64,8 |
1296 |
3,24 |
26,6 |
339 |
527,1 |
8251 |
39,74 |
Т а б л и ц а 52 *'
|
|
|
|
Оценка |
|
|
|
и-У |
(Ѵ-У)- |
по уравне |
|
|
|
нию |
|
||
|
|
|
|
(г/') |
|
-14,83 |
219,93 |
-0,28 |
0,0784 |
1,28 |
—0,08 |
-14,83 |
219,93 |
-0,18 |
0,0324 |
1,28 |
0,02 |
-13,83 |
191,27 |
-0,18 |
0,0324 |
1,29 |
0,01 |
-11,83 |
139,95 |
-0,18 |
0,0324 |
1,32 |
—0,02 |
-12,83 |
164,61 |
-0,08 |
0,0064 |
1,30 |
0,10 |
—9,83 |
96,63 |
-0,08 |
0,0064 |
1,35 |
0,05 |
1,17 |
1,37 |
-0,08 |
0,0064 |
1,50 |
- 0,1 0 |
1,17 |
1,37 |
-0,08 |
'0,0064 |
1,50 |
—0,10 |
— 1,83 |
3,35 |
0,02 |
0,0004 |
1,46 |
0,04 |
5,17 |
26,73 |
0,02 |
0,0004 |
1,56 |
—0,06 |
5,17 |
26,73 |
0,02 |
0,0004 |
1,56 |
—0,06 |
5,17 |
26,73 |
0,02 |
0,0004 |
1,56 |
—0,06 |
6,17 |
38,07 |
0,02 |
0,0004 |
1,57 |
—0,07 |
6,17 |
38,07 |
0,12 |
0,0144 |
1,57 |
0,03 |
7,17 |
51,41 |
0,12 |
0,0144 |
1,58 |
0,02 |
11,17 |
124,77 |
0,22 |
0,0484 |
1,64 |
0,06 |
14,17 |
200,79 |
0,22 |
0,0484 |
1,68 |
0,02 |
17,17 |
294,81 |
0,33 |
0,1089 |
1,72 |
0,08 |
—79,81 |
1866,52 |
- 1,1 4 |
0,4377 |
26,72 |
—0,55 |
+79,87 |
|
+ 1,11 |
|
|
|
(U—U')2
0,0688
. ^ Д а н н ы е заимствованы из книги: I I . П. Ш а р а п о в «Применение математической |
|
|
с Н е д р а г _ |
1965 |
статистики |
в геологии» . М., |
|
|
|
a = Y-bX = 1,48- 0,0136-18,83 = |
1,48-0,26 |
=1,22. |
Следовательно, корреляционное |
уравнение |
(уравне |
ние связи, уравнение регрессии), определенное но всем 18 парам наблюдений, имеет вид
|
|
|
|
|
7 = 1 , 2 2 + |
0,014*.. |
|
|
|||
По этому уравнению |
вычислены для всех |
18 значений X |
|||||||||
значения У, записанные в графе 10 табл. 52. |
|
||||||||||
|
Линию |
У =1,22 + |
|
|
|
|
|
||||
+ 0,014* |
можно |
на |
|
|
|
|
|
||||
звать линией наилучше |
|
|
|
|
|
||||||
го |
подбора, |
поскольку |
|
|
|
|
|
||||
она |
дает |
для всех |
1 8 ^ ^ |
|
|
|
|
||||
значений |
X такие |
зна- . |
|
|
|
|
|||||
чения |
Y, |
которые паи- ^ |
|
|
|
1,22+ЦОМХ |
|||||
более |
близко |
подходят |
^ 20 |
|
|
|
|||||
|
|
|
|
||||||||
ко |
всем |
наблюдаемым |
g |
|
|
|
|
||||
значениям Y (что видно |
§ |
|
|
|
|
||||||
из |
рис. 50, на котором |
* 10 |
|
|
|
|
|||||
изображены |
эмпириче- |
§ |
|
|
|
|
|||||
екая линия связи и тео- |
|
|
|
|
|
||||||
ретическая). |
|
|
|
|
|
|
|
|
|||
|
Первый из парамет |
О |
12 |
1А |
1,6 |
1,8 |
|||||
ров |
|
уравнения |
связи |
|
Удельный |
бес угля |
|||||
(1.22) |
имеет только ма |
|
|
|
|
|
|||||
тематический |
смысл: он |
|
|
Рис. 50 |
|
||||||
определяет точку |
пере |
|
|
|
|
|
|||||
сечения прямой с |
осью ординат. |
|
|
|
|||||||
|
Параметр |
Ь = 0,014 определяет, |
насколько, в среднем, |
||||||||
для |
всех |
18 проб изменяется у при изменении |
х на еди |
||||||||
ницу. |
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент |
корреляции |
вычисляют по |
формуле |
|||||||
(6.9): |
|
|
|
|
|
|
|
|
|
|
2 ХУ
XY
где
527,1
29,28.
— 169 —
Стандарт признака X определяют по формуле:
= 1'" 958,39354,57 = |
і Л 03,12 = 10,2. |
|
|||||
Стандарт признака У определяют по формуле: |
|
||||||
2/У2 |
•У |
18 |
39,74 |
( 1 , 4 8 ) 2 |
:0,0225, |
||
|
16 |
|
18 |
|
|||
|
|
|
|
|
|
||
|
Oy = УО.0225 « |
0,150. |
|
||||
Коэффициент |
корреляции |
|
|
|
|
|
|
29,28 — 27,87 |
|
1,41 |
= 0,92. |
|
|||
|
10,2-0,15 |
|
— |
|
|
||
|
|
1,53 |
|
|
|||
Коэффициент детерминации d = r2 = 0,922 = 0,84. |
|
||||||
В данном случае зависимая |
переменная — удельный |
||||||
вес угля — находится в отношении |
причинной связи с не |
зависимой переменной — зольностью. Следовательно, ко эффициент детерминации 0,84 определяет долю, которая может рассматриваться как причинно обусловленная из
менением зольности. На долю |
влияния |
на |
удельный вес |
||
угля влажности и степени |
метаморфизма |
углей |
остает |
||
ся 16%. |
|
|
|
|
|
Средняя стандартная ошибка оценки |
для прямой ли |
||||
нии может быть выражена |
уравнением |
|
|
|
|
20/, — уд2 |
|
|
(6.15) |
||
|
п-2 |
|
|
|
|
где числу 2 соответствует два параметра |
прямой |
(а и в); |
|||
0,0688 |
= |
УО.0043 « |
0,07. |
|
|
16 |
|
|
|
|
|
Линия связи (см. рис. 50) как бы расчленяет каждое на блюдаемое значение у, на две части: оцененную величи ну у' и остаточную величину ( / / , — У І ) .