Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рыжов, П. А. Математическая статистика в горном деле учеб. пособие

.pdf
Скачиваний:
25
Добавлен:
19.10.2023
Размер:
7.54 Mб
Скачать

Сравнение данных последних двух строк показывает, что прямая, полученная из условия наибольшей близости к точкам корреляционного поля, оказалась в наибольшей близости к эмпирической линии связи. Эта прямая вырав­ нивает наилучшим образом эмпирическую линию связи (рис. 48).

В предпоследней нижней строке табл. 50 приведены значения уі, необходимые для построения ломаной эмпи­ рической линии связи.

На рис. 48 изображены эмпирическая и теоретическая линии связи, построенные по данным предпоследней и по­

следней

(нижней)

строки табл. 50.

 

 

Кроме прямой связи Y с X можно рассматривать

так­

же и прямую связи X с Y, параметры которой

можно оп­

ределить,

решив

нормальную систему уравнений

(А).

Из табл. 50 берут

соответствующие значения

для

этих

уравнений.

 

 

 

Из табл.50 имеем: п= 199; 2t/-m = 217,5; S*-m = 384,5, St/2 -m = 411,75; Б * 2 - т = 598,25. Система нормальных урав­ нений запишется так:

1 9 9 а

' + 217,50'= 384,5, 1

 

217,5а'+

411,756' = 598,25. '

- .

Разделив каждое из этих уравнений на коэффициенты при а', получим

а ' + 1,096'= 1,93, \ а' + 1,896' = 2,75. >

Вычитая из второго уравнения первое, имеем 0,8&'= 0,82; 6' = 1,03, откудд а' = 0,81.

Следовательно, Zy = 0,81 + 1,03 у.

Теснота связи между двумя взаимозависимыми при­ знаками характеризуется линейным коэффициентом кор­ реляции г, который показывает, существует ли и насколь­ ко велика связь между показателями.

Значение коэффициента корреляции может изменять­

ся в пределах от — 1 до + 1 . Знак ( + )

показывает

пря­

мую связь, знак (—) обратную. Если коэффициент

кор­

реляции равен нулю, то связи

между

признаками

нет.

Если

коэффициент

корреляции

равен

+ 1 или — 1 , то

между

признаками

существует

функциональная

связь.

6 — 1 9 24

— 161 —

Коэффициент корреляции определяется по формуле

 

 

 

г =

XY —

XY,

 

 

 

(6.9)

 

 

 

 

 

ОхОу

 

 

 

 

 

где XY— среднее значение

произведений X на У; XY —

средние значения соответствующих признаков; ох

и

оѵ

средние

 

квадратнческне

отклонения,

найденные

по

при­

знаку Л' и по признаку Y.

 

 

 

 

 

 

 

При большом числе испытаний данные двух взаимоза­

висимых рядов признаков

сводятся

в

корреляционную

таблицу, по данным которой определяют

 

 

 

 

 

 

ѣхуіПху

_

2хтх

_

 

Ъу-піу

 

 

XY

 

А' —

 

Y =

-

— .

 

 

 

 

г 2 I , x 1 - m x

 

2

 

2>Уг

 

 

 

 

a * =

A ;

o v = — -

 

l 2

-

 

 

В нашем примере (см. табл. 50):

 

 

 

 

 

 

 

 

ЪтХу

 

 

199

 

 

 

 

 

 

 

Х = І * ^ =

^

=1,93;

 

 

 

 

 

 

 

У.тА

 

199

 

 

 

 

 

 

 

 

2ш„

199

 

 

 

 

 

2

 

: Х 2 " ' Х

Х а =

і£ІЫ5_1 ,93»=1,67;

 

 

Ох

 

 

 

:

2/и*

 

 

199

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ffje

=

у 1,67 «

1,29;

 

 

 

 

 

2

ff»

^ І . ^ ^

І І Ы 5

- 1 ^ = 0,88;

2m„

199

 

 

а„ = у О Ж = 0,94;

Гу/х =

3,01 - 1,93-1,09

= 0,75.

 

1,29-0,94

 

Погрешность коэффициента корреляции определяют

162 —

по формуле

Подставляя значения соответствующих величин, получим

1 -

 

0,752

п

л о

а ^ - у і 9 9 - = 0 ' 0 3 '

Надежность коэффициента

корреляции определяют

по формуле

 

 

 

 

 

ц =

^

,

 

(6.1.)

 

 

OY

 

 

В .нашем примере и =

0,75 yÏ99

=

п п п

 

——

23,8.

 

1 — 0,56

 

 

Согласно теореме Ляпунова, при (.1^2,6 можно ут­ верждать, что связь между признаками надежная. Таким

образом, г3 / /ж = 0,75±0,03.

 

 

 

Зная значения

г, ах,

ау,

можно

вычислить

коэффици­

енты корреляционного

уравнения

по следующим форму­

лам:

 

_

_

 

 

 

a = Y — bX,

 

 

bx/y =

rx/v — ,

(6.12)

 

 

 

Oy

 

 

 

by/x

= rv/x

.

 

 

 

 

Ox

 

В нашем примере

 

1 29

 

 

bx/y

 

 

1,029;

 

= 0J5——=

 

 

у

 

0,94

 

 

 

 

 

0 94

 

 

Ьу/Х

= 0,75 - ^ - =

0,547;

 

а =

1,09 — 0,55 -1,93 = 0,03.

 

Произведение коэффициентов регрессии равно квадрату коэффициента корреляции:

 

by/x-bx/y

= г2 .

(6.13)

В нашем примере

1,029 - 0,547 = 0,752.

 

6*

— 163 —

 

При функциональной связи между 7 м X обе прямые связи совпадают и поэтому b x / v = l b v / x , следовательно, г = ± 1 .

Чем больше угол между прямыми связи, тем меньше коэффициент корреляции (рис. 49).

Статистические характеристики распределения свин­ ца Y и цинка Л' по данным тех же 199 проб были выше

 

 

 

 

 

 

Т а б л и ц а 50а

ч \

х

 

Сопержаннс

цинка Л'. %

 

 

У

\ ^

 

 

 

 

 

 

 

0,5

1,5

3,5

•1,5

5,5

Ii,5

Итого

Содержание свинца У, %

0,5

41

67

11

 

9

 

 

121

 

(1)

(0)

( - 1 )

 

( - 3 )

 

 

 

1,5

 

23

20

5

4

 

1

53

(0)

 

(0)

(0)

(0)

(0)

 

(0)

 

2,5

 

1

2

10

9

1

 

16

 

 

(0)

(1)

(2)

(3)

(4)

 

 

3,5

 

 

 

3

 

1

1

5

 

 

(0)

 

(4)

 

(8)

(10)

 

4,5

 

 

 

 

1

1

 

2

 

 

(0)

 

 

(9)

(12)

 

 

5,5

 

 

 

 

 

1

1

2

 

 

(0)

 

 

 

(16)

(20)

 

И т о г о

41

91

33

18

9

3

199

(см. пример L6) вычислены другим приемом, однако зна­

чения У, Oy, X, Ох были

получены

те же. Составим

по

данным этих же 199 проб корреляционную

таблицу 50а

(в которой цифры

в клетках — это частоты

(цифр_ы без

скобок)

и произведения

отклонений

—У) • (х—X) = ті£

(цифры в скобках).

164 —

Затем составляется таблица 51.

Отметим, что знак произведений г|-і| положителен в верхнем левом и нижнем правом квадрантах таблицы (на квадранты таблица разделена графой и строкой, для ко­ торых і ] - | = 0) и отрицателен в двух остальных.

 

 

X

 

X

 

 

 

Рис.

49

 

 

 

 

 

 

Т а б л и ц а 51

 

Ч ислснность

 

Произведения

 

(+)

( - )

И т о г о

( + )

( - )

 

 

1

43

11

32

32

_

2

10

—.

10

20

3

2

2

0

0

4

4

4

16

О

 

 

 

О

 

О

{

z

}

О

—.

9

9

10

1

1

10

12

1

1

12

16

1

1

16

•—.

20

1

1

20

 

 

 

 

65

13

 

143

Числа в графе 4 табл. 51 получены вычитанием чисел, стоящих в графе 3 из чисел, стоящих в графе 2. Получен­ ные значения разностей умножают на произведение т)-£ (из графы 1),и эти значения заносят в графы 5 и 6.

 

Sri •£

2т)-1=143; разделив ее на я =190, получим:

—-—- =

— 165 —

В примере 1.6 были получены следующие значения:

а р = ± 0 , 9 4 ,

о* = + 1,29, f =_. — = --0,41;

86

SriE

= 0,72 + 0,43-0,41 = 0,90.

Коэффициент корреляции определяется по формуле

 

г = — Р — .

(6.14)

 

Ох-Oy

 

 

В нашем случае

0,90-

 

 

г =

=

0,74.

 

1,29-0,94

 

Вычисление параметров уравнения линейной связи. При изучении статистического материала по одному варь­

ирующему

признаку X основными показателями

служат

X и о*.

 

 

При анализе материалов по дву_м_признакам X п У

основными

показателями служат: X, У, ох, оу,

гуІх- Эти

показатели и вычисляют в первую очередь. Затем

опреде­

ляют эмпирическую линию связи, после

чего вычисляют

параметры теоретической

линии

связи

У по X

(Yx =

= a + bx):

 

 

 

 

Oy

 

_

_

 

by'x = Гу/х — ;

а =

у — ЬХ.

 

Ox

Применив эти формулы для примера 6.1, имеем:

Y =1,93;

Y =

1,09;

ах

=1,29;

оѵ = 0,94;

 

 

 

 

 

0 94

 

Гуіх =

0,75;

by/x =

0,75

=

0,55;

а = F - by/x • X = 1,09 - 0,55 • 1,93 = 0,03; y = 0,03 + 0 Д О .

Квадратическая ошибка, с которой вычислено значе­ ние содержания свинца по содержанию цинка, составит:

Oy У1 — г2 = 0,94-0,66 = ± 0 , 6 % .

— 166 —

Коэффициент детерминации равен квадрату коэффи­ циента корреляции:

d = г2 = 0,752 = 0,56.

Коэффициент детерминации измеряет долю тех эле­ ментов вариации в У, которые содержатся также и в вари­ ации X. Если известно, что зависимая переменная нахо­ дится в отношении причинной связи с независимой переменной, то коэффициент детерминации определяет долю, которая может быть рассмотрена как причинно обусловленная изменениями факториального признака.

Пример 6.2. В табл. 52 приведены значения удельного веса каменного угля и зольности в 18 бороздовых пробах, отобранных из различных участков по одному и тому же пласту.

Рассматривая первые две графы табл. 52, замечаем, что зольность (X) увеличивается, при увеличении значе­ ния удельного веса. Однако эта связь не всегда сохраня­ ется. В одном случае значение У увеличивается при неиз­ меняющемся X, в другом случае изменение X не вызывает изменения У. Объясняется это тем, что удельный вес угля

зависит не только от зольности, но и от влажности

угля,

а также и от различия их метаморфизма.

 

Предположив, что связь между удельным весом

угля

и зольностью прямолинейная, определим угловой коэффи­ циент линии связи по формуле

 

_ 2(х-у) —

пХ-7

 

~

ЪХ2

п-Х2

По данным табл. 52 находим:

 

 

_

2г/г

26,6

 

 

n

18

 

 

_

2*І

339

= 18,83,

 

Х = — = -~

 

 

п

18

 

Ъ —

527,1 - 18-18-83-1,48

527,1 -501,63

8251 — 18-(18,83)2

8251 - 6382,26

 

 

 

25,47

 

 

 

1868,74 =

0,0136,

— 167 —

Значение по пробе

ХУ

ул. пес содерж.

 

4

4,8

16

1,44

 

4

5,2

16

1,69

 

5

6,5

25

1,69

 

7

9,1

49

1,69

 

6

8,4

36

1,96

 

9

12,6

81

1,96

 

20

28

400

1,96

 

20

28

400

1,96

 

17

25,5

289

2,25

 

24

36

576

2,25

 

24

36

576

2,25

 

24

36

576

2,25

 

25

37,5

625

2,25

 

25

40,0

625

2,56

 

26

41,6

676

2,56

 

30

51

900

2,89

 

33

56,1

1089

2,89

 

36

64,8

1296

3,24

26,6

339

527,1

8251

39,74

Т а б л и ц а 52 *'

 

 

 

 

Оценка

 

 

 

и-У

(Ѵ-У)-

по уравне ­

 

 

 

нию

 

 

 

 

 

(г/')

 

-14,83

219,93

-0,28

0,0784

1,28

—0,08

-14,83

219,93

-0,18

0,0324

1,28

0,02

-13,83

191,27

-0,18

0,0324

1,29

0,01

-11,83

139,95

-0,18

0,0324

1,32

—0,02

-12,83

164,61

-0,08

0,0064

1,30

0,10

—9,83

96,63

-0,08

0,0064

1,35

0,05

1,17

1,37

-0,08

0,0064

1,50

- 0,1 0

1,17

1,37

-0,08

'0,0064

1,50

—0,10

— 1,83

3,35

0,02

0,0004

1,46

0,04

5,17

26,73

0,02

0,0004

1,56

—0,06

5,17

26,73

0,02

0,0004

1,56

—0,06

5,17

26,73

0,02

0,0004

1,56

—0,06

6,17

38,07

0,02

0,0004

1,57

—0,07

6,17

38,07

0,12

0,0144

1,57

0,03

7,17

51,41

0,12

0,0144

1,58

0,02

11,17

124,77

0,22

0,0484

1,64

0,06

14,17

200,79

0,22

0,0484

1,68

0,02

17,17

294,81

0,33

0,1089

1,72

0,08

—79,81

1866,52

- 1,1 4

0,4377

26,72

—0,55

+79,87

 

+ 1,11

 

 

 

(U—U')2

0,0688

. ^ Д а н н ы е заимствованы из книги: I I . П. Ш а р а п о в «Применение математической

 

 

с Н е д р а г _

1965

статистики

в геологии» . М.,

 

 

a = Y-bX = 1,48- 0,0136-18,83 =

1,48-0,26

=1,22.

Следовательно, корреляционное

уравнение

(уравне­

ние связи, уравнение регрессии), определенное но всем 18 парам наблюдений, имеет вид

 

 

 

 

 

7 = 1 , 2 2 +

0,014*..

 

 

По этому уравнению

вычислены для всех

18 значений X

значения У, записанные в графе 10 табл. 52.

 

 

Линию

У =1,22 +

 

 

 

 

 

+ 0,014*

можно

на­

 

 

 

 

 

звать линией наилучше­

 

 

 

 

 

го

подбора,

поскольку

 

 

 

 

 

она

дает

для всех

1 8 ^ ^

 

 

 

 

значений

X такие

зна- .

 

 

 

 

чения

Y,

которые паи- ^

 

 

 

1,22+ЦОМХ

более

близко

подходят

^ 20

 

 

 

 

 

 

 

ко

всем

наблюдаемым

g

 

 

 

 

значениям Y (что видно

§

 

 

 

 

из

рис. 50, на котором

* 10

 

 

 

 

изображены

эмпириче-

§

 

 

 

 

екая линия связи и тео-

 

 

 

 

 

ретическая).

 

 

 

 

 

 

 

 

 

Первый из парамет­

О

12

1,6

1,8

ров

 

уравнения

связи

 

Удельный

бес угля

(1.22)

имеет только ма­

 

 

 

 

 

тематический

смысл: он

 

 

Рис. 50

 

определяет точку

пере­

 

 

 

 

 

сечения прямой с

осью ординат.

 

 

 

 

Параметр

Ь = 0,014 определяет,

насколько, в среднем,

для

всех

18 проб изменяется у при изменении

х на еди­

ницу.

 

 

 

 

 

 

 

 

 

 

 

Коэффициент

корреляции

вычисляют по

формуле

(6.9):

 

 

 

 

 

 

 

 

 

 

2 ХУ

XY

где

527,1

29,28.

— 169 —

Стандарт признака X определяют по формуле:

= 1'" 958,39354,57 =

і Л 03,12 = 10,2.

 

Стандарт признака У определяют по формуле:

 

22

•У

18

39,74

( 1 , 4 8 ) 2

:0,0225,

 

16

 

18

 

 

 

 

 

 

 

 

Oy = УО.0225 «

0,150.

 

Коэффициент

корреляции

 

 

 

 

 

29,28 — 27,87

 

1,41

= 0,92.

 

 

10,2-0,15

 

 

 

 

 

1,53

 

 

Коэффициент детерминации d = r2 = 0,922 = 0,84.

 

В данном случае зависимая

переменная — удельный

вес угля — находится в отношении

причинной связи с не­

зависимой переменной — зольностью. Следовательно, ко­ эффициент детерминации 0,84 определяет долю, которая может рассматриваться как причинно обусловленная из­

менением зольности. На долю

влияния

на

удельный вес

угля влажности и степени

метаморфизма

углей

остает­

ся 16%.

 

 

 

 

 

Средняя стандартная ошибка оценки

для прямой ли­

нии может быть выражена

уравнением

 

 

 

20/, уд2

 

 

(6.15)

 

п-2

 

 

 

где числу 2 соответствует два параметра

прямой

и в);

0,0688

=

УО.0043 «

0,07.

 

16

 

 

 

 

 

Линия связи (см. рис. 50) как бы расчленяет каждое на­ блюдаемое значение у, на две части: оцененную величи­ ну у' и остаточную величину ( / / , — У І ) .

Соседние файлы в папке книги из ГПНТБ