
книги из ГПНТБ / Рыжов, П. А. Математическая статистика в горном деле учеб. пособие
.pdfРис. 43
Распределение частот по двум количественным при знакам изображают стсрсограммой (рис. 44).
При уменьшении размеров клеток стереограмма при ближается к непрерывной кривой поверхности — поверх ности распределения частот т.
|
На рис. 45 изображена идеально симметричная фор |
ма |
поверхности распределения системы признаков (X, |
У), |
которая в практике горного дела встречается редко. |
У, м/смену
Рис. 44
Рис. 45
— 151 —
|
§ 2. УРАВНЕНИЕ СВЯЗИ |
|
Статистическую |
связь между признаками выражают |
|
с помощью такой |
математической функции, которая да |
|
ет наименьшее отклонение от полученных |
при наблюде |
|
нии значений признаков. Уравнение такой |
функции явля |
ется уравнением связи между результативными и факто рна льным признаками.
Вид функции, заданной уравнением связи, определя ет п разграничивает связи по форме их проявления па
Y=a+bX'CX2<dX3
|
|
^ |
^ / ^ = а Х ь |
T |
V |
|
|
\ < ^ a |
- ьх-сх* |
||
|
|
|
|
||
|
|
|
Г\ |
lgY=a+bx+cX}-i-dX3 |
|
|
|
|
lgY=a-bx<-cX2 |
|
|
lgY=a*b(lg |
t; |
lg |
Y=a+b(Lgx)+c(lgX2) |
|
|
|
|
|
|
lgY-a+b(lgX)+c(lgx')+
\\ ^ ^ с * Ь Х - с х г yÇrY-c<-b!gX
Pue 46
линейные и криволинейные (параболические, гиперболи ческие, степенные и т. д.).
Форму и вид связи можно определить двумя мето дами.
1) Построим на корреляционном поле изолинии численностей совокупности (рис. 43), число которых должно быть порядка 3—5. По изолиниям проведем главную ли
нию |
перегиба поверхности распределения |
частот (линия |
KL |
на рис. 43). Эта линия и определяет вид связи. |
|
По рис. 46 подбираем, для этой линии |
соответствую |
|
щее уравнение связи. В рассматриваемом |
примере для |
линии KL (рис. 47) уравнение связи имеет вид |
|
у = а 4- Ьх + сх2. |
(6.3) |
- 152 - |
|
Затем находим значения параметров а, в и с корреля ционного уравнения. Выбирая уравнения связи, необхо димо учитывать его логическую основу и физическую сущность соотношения между исследуемыми признаками.
Угм/смену
|
К. сот. м/месяц |
|
Рис. 47 |
Гипербола Y = |
—— — равносторонняя, асимпто- |
|
о, -{- ЪХ |
тическая к линии, параллельной оси X; гипербола Y =
,1
=а + о — — равносторонняя, асимптотическая к линии,
параллельной оси У; гипербола — = a -f- b ( — ) — равно-
сторонняя, асимптотическая к линиям, параллельным обеим осям.
Пример. Выбрать соответствующую кривую и ее урав нение для выражения взаимосвязи площади развала ру ды (или пород) от удельной величины заряда взрывча тых (ВВ) веществ.
Следует взять параболу, асимптотическую к линии, параллельной оси У (если по оси У отложены площади развала, а по оси X — величины удельных зарядов ВВ), так как, чем больше удельный расход ВВ, тем больше ве личины площади развала.
При возрастании удельного расхода ВВ в каждом взрыве, величина площади развала будет асимптотически приближаться к линии, параллельной оси игрек.
— 153 —
Так в каждом конкретном случае при подборе вида кривой необходимо учитывать физическую сущность от ношения зависимости.
Необходимо иметь в 'виду, что переменные могут быть выражены в логарифмах (если они не имеют отрица тельных значении). Логарифмические кривые всегда ста новятся асимптотическими, если переменные приближа ются к нулю, т. е. они стремятся сгладиться и идти парал
лельно осям. Необходимо |
также |
иметь в виду, что при |
|||||
замене |
уравнения |
у = а + Ьх + сх2 |
уравнением |
\gy — a + |
|||
+ bx + cx2 происходит трансформирование |
параболы, обо |
||||||
стряется |
вершина |
перегиба (если |
величина |
b |
положи |
||
тельна) |
пли углубляется |
падение |
(если она отрицатель |
||||
на) . |
|
|
|
|
|
|
|
Если |
вместо х |
используют Ig.v, то |
первоначальные |
||||
кривые |
модифицируются |
так, что абсциссы |
сжимаются |
||||
вблизи нуля и вытягиваются при высших |
значениях. |
Если логарифмы используют вместо х и у одновремен но, то в результате модифицируются обе системы коорди нат описанным выше образом.
2) В корреляционной таблице определяют средние ве личины признака т7,- для отдельных интервалов (или клас сов) признака х. В последней строке таблицы, приведен ной на рис. 43, числа 0,16; 0,19; 0,26 и т. д. — это средние
значения у для значений признака |
х, равного |
соответст |
||
венно 0,5; 0,7; 0,9 и т. д. |
|
|
||
В правом |
крайнем |
столбце таблицы числа 1,55; 1,45; |
||
1,38 и т. д. — это средние значения |
признака л' для значе |
|||
нии признака |
іу,-, соответственно равного 0,42; 0,38; 0,34 |
|||
и т. д. |
Иу-тху |
|
|
|
Значение |
для каждого |
столбца |
определяют |
следующим образом: так например, для третьего столбца,
соответствующего |
значению признака |
.ѵ = 0,9, значение |
||||
2упгху |
= |
2-0,38+1 •0,34 + 3-0,30+10-0,26 + 8-0,22 + 2 X |
||||
Х0,14 = 6,98. |
|
|
|
|
||
Аналогично |
находят значения |
2 у - т . ѵ у для всех дру |
||||
гих столбцов. |
|
|
|
|
||
Значение Их-тху |
для третьей строки, соответствующей |
|||||
значению признака у = 0,34 таково: |
|
|||||
|
2 |
х-тхи |
= |
2-0,9 + 6-1,1 + |
3-1,3 + |
7-1,5 + |
|
|
|
+ |
4 - 1,7+ 1-2,1 = |
31,7. |
|
Средние значения признаков для каждой строки и каждой колонки определены по таблице, приведенной па
— 154' —
рис. 43. По данным последней строки этой таблицы стро ят кривую y = f(x). Кривая, приведенная на рис. 47, опре деляет вид и форму связи у с X. [Она аналогична кривой kL (см. рис. 43)]. Следовательно, искомое корреляцион ное уравнение имеет вид (6.3).
Уравнение связи называют также уравнением |
регрес |
сии *. |
|
§ 3. ПРЯМОЛИНЕЙНАЯ СВЯЗЬ
При прямолинейной связи параметры корреляционно го уравнения находят по способу наименьших квадратов:
у = а 4- Ьх. |
(6.4) |
Требование наименьших квадратов записывается в виде
2 (у — j / ) 2 = m i n >
или
2 (у — у)2,п — тт<
т. е. сумма квадратов (или взвешенная сумма квадратов для сгруппированных рядов) отклонений фактических ор динат точек корреляционного поля от ординат, вычислен ных по уравнению (6.4), должна быть наименьшей. Отыс кание параметров прямой, удовлетворяющей этому тре бованию, называется способом наименьших квадратов. Заменив в уравнении (*) у, на а + Ьх и обозначив левую часть уравнения через S, получим выражение функции от неизвестных параметров а и Ь:
S = S {у — а — Ьх).
Значения а и Ь, удовлетворяющие минимуму функции 5, находят из уравнений
dS dS да до
или
dSда — 22(y — a — bx) = О,
* Regressus (лат.) — отступление, возврат к чему-либо.
_ 155 —
или |
|
- г г = 22 {у — а — bx)x = О, |
|
до |
|
2 (г/ — а — Ьх) = О, |
|
2 (у — а — Ьх)х = О. |
|
Из последних выражений имеем |
|
Лу = |
па + Ьѣх, |
2ух = |
а2х + 62л:2. |
Таким образом, получено два уравнения первой степени относительно неизвестных параметров а и Ь:
2у = |
п-а |
+ |
/32А;, \ |
(6.5) |
|
2л-£/ = |
OSJC + |
62х2 . / |
|||
|
|||||
Систему (6.5) называют |
системой нормальных |
урав |
|||
нений. |
|
|
|
|
|
Если статистические |
данные сгруппированы, то систе |
ма нормальных уравнении принимает следующий вид
2у |
• піу = а2іпх |
+ Ь2х • mx, |
\ |
|
ü,yxmxy |
= |
Û2JC •mx |
-4- ЬУх2-m~ |
> |
Здесь |
|
|
|
|
Zmx - п; Ъхтх |
= |
n• X; 2y-my= |
у• my = n-Y, |
_ |
Hx-nix |
;' |
_ |
|
X = |
—Sfflj |
У = |
||
Из уравнения (6.5) |
имеем: |
|
||
|
|
a = |
Y — |
|
-Lxym^-n-X-Y |
|
|
||
D— |
|
|
— |
"-- |
Ъх2-тх |
— пХ2 |
|||
где |
|
|
|
Ъх2тх |
|
|
|
|
|
|
|
X 2 = — |
||
Уравнение связи Y с X таково: |
||||
|
y-Y |
= |
b{x-X). |
2y-m"v
2 m у
|
ftjf. |
(6.6) |
|
XY-X-Y |
|
: = |
— , |
( O . / ) |
Xz |
— X2 |
У |
.
(6.8)
Из уравнения_(б_;8) следует, что прямая связи проходит через точку (X, Y). Угловой коэффициент линии связи называют коэффициентом корреляционного уравнения и
обозначают через Ьѵ/Х:
y-Y |
= byix{x-X). |
(6.8') |
Пример 6.1. Как пример расчета параметров уравне ния прямой и определения средних значений результатив ного признака для каждого интервального значения факториального признака рассмотрим корреляционную таблицу (табл. 50), являющуюся формой представления значительного количества пар чисел.' В таблице один признак записывается в строках, а другой — в графах. Числа, расположенные в клетках на пересечении строк и граф, показывают, как часто встречаются сочетания дан ных результативного и факториального признаков. Сум мы по строкам показывают частоты признака ту, суммы граф — частоты признака тх. Числа, стоящие в клетках, являются частотами, относящимися к обоим признакам, и обозначаются тху.
Средние величины у по строкам и графам, вследствие небольшого числа наблюдений, как правило, располага ются настолько неправильно, что не выявляют истинной природы линии связи, и в этом случае прямая линия дает почти такое же хорошее приближение, как и более слож ная кривая.
Решая систему нормальных уравнений (6.5), по кор реляционной таблице рассчитывают параметры уравне ния связи.
В нашем случае
Ътху = п= 199;
Ъх-тх = 384,5;
Иу-ту — 217,5;
2 , ѵ ' 2 - т ж = 1071,75;
2,у-хтух = уЪхтух = 598,25.
В каждой строке у повторяется столько раз, сколько раз оно суммируется, следовательно, у можно вынести за скобку.
— 157 —
Т а б л и ц а 50а
Значение середин интервалов признака
|
|
X |
|
|
|
|
|
X, % |
|
|
|
|
|
|
|
|
0,5 |
1,5 |
2,5 |
3,5 |
4,5 |
|
|
"'у |
У-"'y |
|
B.l--/wr y |
уЪ.\тл.у=71ух-тлу |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5,5 |
6,5 |
|
|
|
|
|
|
|
5,5 |
|
|
|
|
|
1 |
1 |
2 |
11,0 |
60,50 |
5,5-1 + |
12-5,5=66,00 |
|
|
|
|
|
|
|
|
+6,5-1 = 12 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4,5 |
|
|
|
|
|
1 |
|
2 |
9,0 |
40,50 |
4,5-1 + |
10-4,5=45,00 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
+5,5-1=10 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Значение |
3,5 |
|
|
|
|
|
1 |
1 |
5 |
17,5 |
61,25 |
3,5-3+5,5-1 + |
22,5-3,5=78,75 |
|
|
|
|
|
|
|
|||||||||
середин |
ин |
|
|
|
|
|
|
+ 6,5-1=22,5 |
|
|||||
тервалов |
|
2,5 |
|
|
|
10 |
2 |
|
|
|
|
|
1,5-1+2,5-2+ |
|
признака |
Y |
|
|
|
1 |
|
16 |
40,0 |
|
56-2,5=140,0 |
||||
|
|
|
|
|
|
|
|
|
100 + 3 , 5 - 1 0 + 4 , 5 Х |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Х 2 + 5 , 5 - 1 = 5 6 |
|
|
|
1,5 |
|
23 |
20 |
|
|
|
|
|
|
|
1,5 - 23+2,5 Х |
|
|
|
|
|
|
|
1 |
53 |
79,5 |
119,25 |
Х 2 0 + 3 . 5 - 5 + |
126,5-1,5=189,75 |
|||
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
+4,5-4+6,5-1 = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= 126,6 |
|
|
|
0,5 |
41 |
67 |
11 |
|
|
|
|
121 |
60,5 |
|
0,5-41 + 1,5Х |
157,5-0,5=78,75 |
|
|
|
|
|
|
|
|
|
|
30,25 Х 6 7 + 2 . 5 - 1 1 + |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
+4,5-2=157,5 |
|
|
|
|
41 |
91 |
33 |
18 |
|
4 |
3 |
199 |
217,5 |
411,75 |
384,5 |
598,25 |
|
|
|
|
|
|
|
|
|||||||
|
|
|
20,5 |
136,5 |
82,5 |
63,0 |
40,5 |
22,0 |
19,5 |
384,5= Z u * - / и . |
|
|
||
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
10,25 |
201,75 |
206,25 220,50 182,25 |
121,00 |
126,75 |
1071,75= |
|
|
||||
|
|
|
|
|
|
|
|
= |
2*2. Шд. |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|||
1у-тл.и |
|
0,541=20,50 |
0,567+1,5-23+ |
40,5 |
43,0 |
16,5 |
16,0 |
10,5 |
217,5=S(/-my |
|
|
|||
|
|
|
|
+2,5-1=70,5 |
|
|
|
|
|
|||||
|
^ху |
|
0,50 |
0,77 |
1,23 |
2,39 |
1,83 |
4 |
3,5 |
|
Ii |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Г=0,03+0,55л: |
0,31 |
0,86 |
1.41 |
1,96 |
2,51 |
3,06 |
3,61 |
|
Y wo yp |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
— 158 — |
|
|
|
J |
|
|
|
— 159 — |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
і
Система нормальных уравнений по результатам под счета запишется так:
іэ9а +384,56 = 217,5, \ 384,5а - f 1071,756 = 598,25. »
Для определения параметров уравнения линейной свя зи a il Ь каждое из уравнений делят на коэффициенты при а:
Рас. 48
Вычитая из первого уравнения второе, получим:
- 0,866 = - |
0,47, |
т. е. |
Ь= - ^ - = 0,55; |
|
|
|
0,86 |
а = |
1,09 — 1,93 • 0,55 = 0,03. |
||
Уравнение связи в явном виде имеет вид |
|||
|
Y = |
0,03 + |
0,55Х. |
Уравнение связи определяет среднюю зависимость F (содержание свинца) от X (содержание цинка). Исполь зуя уравнение связи, найдем для каждого интервала факториального признака X среднее значение результативно го признака У. Результаты вычислений записаны в ниж ней (последней)' строке корреляционной таблицы.
—160 —