Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рыжов, П. А. Математическая статистика в горном деле учеб. пособие

.pdf
Скачиваний:
25
Добавлен:
19.10.2023
Размер:
7.54 Mб
Скачать

Рис. 43

Распределение частот по двум количественным при­ знакам изображают стсрсограммой (рис. 44).

При уменьшении размеров клеток стереограмма при­ ближается к непрерывной кривой поверхности — поверх­ ности распределения частот т.

 

На рис. 45 изображена идеально симметричная фор­

ма

поверхности распределения системы признаков (X,

У),

которая в практике горного дела встречается редко.

У, м/смену

Рис. 44

Рис. 45

— 151 —

 

§ 2. УРАВНЕНИЕ СВЯЗИ

 

Статистическую

связь между признаками выражают

с помощью такой

математической функции, которая да­

ет наименьшее отклонение от полученных

при наблюде­

нии значений признаков. Уравнение такой

функции явля­

ется уравнением связи между результативными и факто­ рна льным признаками.

Вид функции, заданной уравнением связи, определя­ ет п разграничивает связи по форме их проявления па

Y=a+bX'CX2<dX3

 

 

^

^ / ^ = а Х ь

T

V

 

 

\ < ^ a

- ьх-сх*

 

 

 

 

 

 

 

Г\

lgY=a+bx+cX}-i-dX3

 

 

 

lgY=a-bx<-cX2

 

 

lgY=a*b(lg

t;

lg

Y=a+b(Lgx)+c(lgX2)

 

 

 

 

 

 

lgY-a+b(lgX)+c(lgx')+

\\ ^ ^ с * Ь Х - с х г yÇrY-c<-b!gX

Pue 46

линейные и криволинейные (параболические, гиперболи­ ческие, степенные и т. д.).

Форму и вид связи можно определить двумя мето­ дами.

1) Построим на корреляционном поле изолинии численностей совокупности (рис. 43), число которых должно быть порядка 3—5. По изолиниям проведем главную ли­

нию

перегиба поверхности распределения

частот (линия

KL

на рис. 43). Эта линия и определяет вид связи.

По рис. 46 подбираем, для этой линии

соответствую­

щее уравнение связи. В рассматриваемом

примере для

линии KL (рис. 47) уравнение связи имеет вид

 

у = а 4- Ьх + сх2.

(6.3)

- 152 -

 

Затем находим значения параметров а, в и с корреля­ ционного уравнения. Выбирая уравнения связи, необхо­ димо учитывать его логическую основу и физическую сущность соотношения между исследуемыми признаками.

Угм/смену

 

К. сот. м/месяц

 

Рис. 47

Гипербола Y =

—— — равносторонняя, асимпто-

 

о, -{- ЪХ

тическая к линии, параллельной оси X; гипербола Y =

,1

=а + о — — равносторонняя, асимптотическая к линии,

параллельной оси У; гипербола — = a -f- b ( — ) — равно-

сторонняя, асимптотическая к линиям, параллельным обеим осям.

Пример. Выбрать соответствующую кривую и ее урав­ нение для выражения взаимосвязи площади развала ру­ ды (или пород) от удельной величины заряда взрывча­ тых (ВВ) веществ.

Следует взять параболу, асимптотическую к линии, параллельной оси У (если по оси У отложены площади развала, а по оси X — величины удельных зарядов ВВ), так как, чем больше удельный расход ВВ, тем больше ве­ личины площади развала.

При возрастании удельного расхода ВВ в каждом взрыве, величина площади развала будет асимптотически приближаться к линии, параллельной оси игрек.

— 153 —

Так в каждом конкретном случае при подборе вида кривой необходимо учитывать физическую сущность от­ ношения зависимости.

Необходимо иметь в 'виду, что переменные могут быть выражены в логарифмах (если они не имеют отрица­ тельных значении). Логарифмические кривые всегда ста­ новятся асимптотическими, если переменные приближа­ ются к нулю, т. е. они стремятся сгладиться и идти парал­

лельно осям. Необходимо

также

иметь в виду, что при

замене

уравнения

у = а + Ьх + сх2

уравнением

\gy — a +

+ bx + cx2 происходит трансформирование

параболы, обо­

стряется

вершина

перегиба (если

величина

b

положи­

тельна)

пли углубляется

падение

(если она отрицатель­

на) .

 

 

 

 

 

 

 

Если

вместо х

используют Ig.v, то

первоначальные

кривые

модифицируются

так, что абсциссы

сжимаются

вблизи нуля и вытягиваются при высших

значениях.

Если логарифмы используют вместо х и у одновремен­ но, то в результате модифицируются обе системы коорди­ нат описанным выше образом.

2) В корреляционной таблице определяют средние ве­ личины признака т7,- для отдельных интервалов (или клас­ сов) признака х. В последней строке таблицы, приведен­ ной на рис. 43, числа 0,16; 0,19; 0,26 и т. д. — это средние

значения у для значений признака

х, равного

соответст­

венно 0,5; 0,7; 0,9 и т. д.

 

 

В правом

крайнем

столбце таблицы числа 1,55; 1,45;

1,38 и т. д. — это средние значения

признака л' для значе­

нии признака

іу,-, соответственно равного 0,42; 0,38; 0,34

и т. д.

Иу-тху

 

 

 

Значение

для каждого

столбца

определяют

следующим образом: так например, для третьего столбца,

соответствующего

значению признака

.ѵ = 0,9, значение

2упгху

=

2-0,38+1 •0,34 + 3-0,30+10-0,26 + 8-0,22 + 2 X

Х0,14 = 6,98.

 

 

 

 

Аналогично

находят значения

2 у - т . ѵ у для всех дру­

гих столбцов.

 

 

 

 

Значение Их-тху

для третьей строки, соответствующей

значению признака у = 0,34 таково:

 

 

2

х-тхи

=

2-0,9 + 6-1,1 +

3-1,3 +

7-1,5 +

 

 

 

+

4 - 1,7+ 1-2,1 =

31,7.

 

Средние значения признаков для каждой строки и каждой колонки определены по таблице, приведенной па

— 154' —

рис. 43. По данным последней строки этой таблицы стро­ ят кривую y = f(x). Кривая, приведенная на рис. 47, опре­ деляет вид и форму связи у с X. [Она аналогична кривой kL (см. рис. 43)]. Следовательно, искомое корреляцион­ ное уравнение имеет вид (6.3).

Уравнение связи называют также уравнением

регрес­

сии *.

 

§ 3. ПРЯМОЛИНЕЙНАЯ СВЯЗЬ

При прямолинейной связи параметры корреляционно­ го уравнения находят по способу наименьших квадратов:

у = а 4- Ьх.

(6.4)

Требование наименьших квадратов записывается в виде

2 (у — j / ) 2 = m i n >

или

2 (у — у)2,п тт<

т. е. сумма квадратов (или взвешенная сумма квадратов для сгруппированных рядов) отклонений фактических ор­ динат точек корреляционного поля от ординат, вычислен­ ных по уравнению (6.4), должна быть наименьшей. Отыс­ кание параметров прямой, удовлетворяющей этому тре­ бованию, называется способом наименьших квадратов. Заменив в уравнении (*) у, на а + Ьх и обозначив левую часть уравнения через S, получим выражение функции от неизвестных параметров а и Ь:

S = S {у — а — Ьх).

Значения а и Ь, удовлетворяющие минимуму функции 5, находят из уравнений

dS dS да до

или

dSда — 22(y — a — bx) = О,

* Regressus (лат.) — отступление, возврат к чему-либо.

_ 155 —

или

 

- г г = 22 {у — а — bx)x = О,

до

 

2 (г/ — а — Ьх) = О,

2 (у — а — Ьх)х = О.

Из последних выражений имеем

Лу =

па + Ьѣх,

2ух =

а2х + 62л:2.

Таким образом, получено два уравнения первой степени относительно неизвестных параметров а и Ь:

2у =

п-а

+

/32А;, \

(6.5)

2л-£/ =

OSJC +

62х2 . /

 

Систему (6.5) называют

системой нормальных

урав­

нений.

 

 

 

 

Если статистические

данные сгруппированы, то систе­

ма нормальных уравнении принимает следующий вид

піу = а2іпх

+ Ь2х • mx,

\

ü,yxmxy

=

Û2JC mx

-4- ЬУх2-m~

>

Здесь

 

 

 

 

Zmx - п; Ъхтх

=

n• X; 2y-my=

у• my = n-Y,

_

Hx-nix

;'

_

X =

Sfflj

У =

Из уравнения (6.5)

имеем:

 

 

 

a =

Y

-Lxym^-n-X-Y

 

 

D—

 

 

"--

Ъх2х

— пХ2

где

 

 

 

Ъх2тх

 

 

 

 

 

 

X 2 = —

Уравнение связи Y с X таково:

 

y-Y

=

b{x-X).

2y-m"v

2 m у

 

ftjf.

(6.6)

 

XY-X-Y

 

: =

— ,

( O . / )

Xz

— X2

У

.

(6.8)

Из уравнения_(б_;8) следует, что прямая связи проходит через точку (X, Y). Угловой коэффициент линии связи называют коэффициентом корреляционного уравнения и

обозначают через Ьѵ/Х:

y-Y

= byix{x-X).

(6.8')

Пример 6.1. Как пример расчета параметров уравне­ ния прямой и определения средних значений результатив­ ного признака для каждого интервального значения факториального признака рассмотрим корреляционную таблицу (табл. 50), являющуюся формой представления значительного количества пар чисел.' В таблице один признак записывается в строках, а другой — в графах. Числа, расположенные в клетках на пересечении строк и граф, показывают, как часто встречаются сочетания дан­ ных результативного и факториального признаков. Сум­ мы по строкам показывают частоты признака ту, суммы граф — частоты признака тх. Числа, стоящие в клетках, являются частотами, относящимися к обоим признакам, и обозначаются тху.

Средние величины у по строкам и графам, вследствие небольшого числа наблюдений, как правило, располага­ ются настолько неправильно, что не выявляют истинной природы линии связи, и в этом случае прямая линия дает почти такое же хорошее приближение, как и более слож­ ная кривая.

Решая систему нормальных уравнений (6.5), по кор­ реляционной таблице рассчитывают параметры уравне­ ния связи.

В нашем случае

Ътху = п= 199;

Ъх-тх = 384,5;

Иу-ту — 217,5;

2 , ѵ ' 2 - т ж = 1071,75;

2,у-хтух = уЪхтух = 598,25.

В каждой строке у повторяется столько раз, сколько раз оно суммируется, следовательно, у можно вынести за скобку.

— 157 —

Т а б л и ц а 50а

Значение середин интервалов признака

 

 

X

 

 

 

 

 

X, %

 

 

 

 

 

 

 

 

0,5

1,5

2,5

3,5

4,5

 

 

"'у

У-"'y

 

B.l--/wr y

уЪ.\тл.у=71ух-тлу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5,5

6,5

 

 

 

 

 

 

 

5,5

 

 

 

 

 

1

1

2

11,0

60,50

5,5-1 +

12-5,5=66,00

 

 

 

 

 

 

 

 

+6,5-1 = 12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4,5

 

 

 

 

 

1

 

2

9,0

40,50

4,5-1 +

10-4,5=45,00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+5,5-1=10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение

3,5

 

 

 

 

 

1

1

5

17,5

61,25

3,5-3+5,5-1 +

22,5-3,5=78,75

 

 

 

 

 

 

середин

ин­

 

 

 

 

 

 

+ 6,5-1=22,5

 

тервалов

 

2,5

 

 

 

10

2

 

 

 

 

 

1,5-1+2,5-2+

 

признака

Y

 

 

 

1

 

16

40,0

 

56-2,5=140,0

 

 

 

 

 

 

 

 

 

100 + 3 , 5 - 1 0 + 4 , 5 Х

 

 

 

 

 

 

 

 

 

 

 

 

 

Х 2 + 5 , 5 - 1 = 5 6

 

 

 

1,5

 

23

20

 

 

 

 

 

 

 

1,5 - 23+2,5 Х

 

 

 

 

 

 

 

1

53

79,5

119,25

Х 2 0 + 3 . 5 - 5 +

126,5-1,5=189,75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+4,5-4+6,5-1 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 126,6

 

 

 

0,5

41

67

11

 

 

 

 

121

60,5

 

0,5-41 + 1,5Х

157,5-0,5=78,75

 

 

 

 

 

 

 

 

 

 

30,25 Х 6 7 + 2 . 5 - 1 1 +

 

 

 

 

 

 

 

 

 

 

 

 

 

+4,5-2=157,5

 

 

 

 

41

91

33

18

 

4

3

199

217,5

411,75

384,5

598,25

 

 

 

 

 

 

 

 

 

 

 

20,5

136,5

82,5

63,0

40,5

22,0

19,5

384,5= Z u * - / и .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10,25

201,75

206,25 220,50 182,25

121,00

126,75

1071,75=

 

 

 

 

 

 

 

 

 

 

=

2*2. Шд.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1у-тл.и

 

0,541=20,50

0,567+1,5-23+

40,5

43,0

16,5

16,0

10,5

217,5=S(/-my

 

 

 

 

 

 

+2,5-1=70,5

 

 

 

 

 

 

^ху

 

0,50

0,77

1,23

2,39

1,83

4

3,5

 

Ii

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г=0,03+0,55л:

0,31

0,86

1.41

1,96

2,51

3,06

3,61

 

Y wo yp

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

— 158 —

 

 

 

J

 

 

 

159 —

 

 

 

 

 

 

 

 

 

 

 

 

 

і

Система нормальных уравнений по результатам под­ счета запишется так:

іэ9а +384,56 = 217,5, \ 384,5а - f 1071,756 = 598,25. »

Для определения параметров уравнения линейной свя­ зи a il Ь каждое из уравнений делят на коэффициенты при а:

Рас. 48

Вычитая из первого уравнения второе, получим:

- 0,866 = -

0,47,

т. е.

Ь= - ^ - = 0,55;

 

 

 

0,86

а =

1,09 — 1,93 • 0,55 = 0,03.

Уравнение связи в явном виде имеет вид

 

Y =

0,03 +

0,55Х.

Уравнение связи определяет среднюю зависимость F (содержание свинца) от X (содержание цинка). Исполь­ зуя уравнение связи, найдем для каждого интервала факториального признака X среднее значение результативно­ го признака У. Результаты вычислений записаны в ниж­ ней (последней)' строке корреляционной таблицы.

160 —

Соседние файлы в папке книги из ГПНТБ