
книги из ГПНТБ / Сивый В.Б. Метод множественной корреляции в анализе и планировании угольных предприятий
.pdf1 |
Себестоимость |
г- |
|
т |
угля, руб. (у) |
О |
|
|
|
|
1 |
|
|
|
ю |
|
|
|
о |
|
|
7— 9 |
|
|
|
9—11 |
|
|
|
11—13 |
|
|
|
13-15 |
|
|
|
15—17 |
|
|
|
17—19 |
9 |
|
|
19—21 |
3 |
|
|
|
|
|
|
|
|
Таблица 5 |
|
Среднединамическая производительность пласта, |
т /м 2 (х) |
|
|
||||||
О |
|
со |
Ш |
С- |
05 |
cq |
СО |
cq |
my |
О |
Т |
7 |
Т |
Т |
Т |
cq |
|
||
1 |
i |
|
X |
|
|||||
ь- |
05 |
|
со |
ю |
|
05 |
Cq |
|
|
о |
О |
|
|
|
|
|
cq |
|
|
|
1 |
|
|
3 |
1 |
3 |
17 |
2 |
27 |
|
13 |
10 |
14 |
14 |
18 |
7 |
2 |
1 |
79 |
13 |
57 |
50 |
34 |
16 |
6 |
13 |
|
|
189 |
8 |
19 |
3 |
10 |
5 |
9 |
5 |
1 |
|
60 |
|
|
1 |
|
1 |
|
2 |
|
|
4 |
|
|
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|
|
|
|
3 |
т х |
12 |
21 |
90 |
64 |
58 |
39 |
34 |
30 |
20 |
3 |
371 |
динамическая производительность разрабаты
ваемых пластов, тем меньше себестоимость 1 т
угля.
В прямой зависимости от среднединамиче
ской производительности |
пласта |
находится |
производительность труда |
рабочего |
(табл. 6) |
по той же группе шахт. |
|
|
Корреляционная таблица наглядно показы
вает распределение значений у для каждого интервала значений х (или наоборот). Напри мер, для 1,1 < х < 1 ,3 (табл. 6) распределение
имеет вид:
у = 16 — 20 — 24 — 28 — 32 — 36 — 40.
Частота, с которой встречаются указанные значения у:
т Х]/ = 5; 19; 21; 10; 6; 3.
Это означает, что для значений х, лежащих в интервалах 1,1—1,3, были получены соответ ственно 5; 19; 21 и т. д. раз значения у в интер валах 16 — 20; 20 — 24; 24 — 28 и т. д.
Связи между рассматриваемыми перемен
ными удобно наблюдать на поле корреляции, которое строится в виде точечной диаграммы.
Для этого на координатную плоскость осу на
кладывается сетка с интервалами корреляцион ной таблицы. Частоты вариант изображаются в
виде соответствующего количества точек, равно
мерно распределенных внутри отдельной клет ки. Каждая точка представляет собой резуль
тат наблюдения над двумя переменными вели чинами. При помощи таких диаграмм можно лег-
4* |
61 |
Производитель
ность труда,
т/.мес (у)
12—16
16—20
20—24
24—28
28—32
32—36
36—40
40—44
Таблица 6
Среднединамическая производительность пласта, т /м 2 (я)
г— |
05 |
|
СО |
хЛ |
Г- |
05 |
|
со |
Щ |
mv |
о |
О |
7 |
7 |
7 |
т |
|
03 |
оз |
оГ |
|
1 |
1 |
I |
1 |
|
1 |
|
||||
Ю |
|
05 |
|
со |
in |
05 |
|
со |
|
|
о |
О |
О |
|
|
|
|
|
|
03 |
|
11 |
|
|
|
|
|
|
|
|
|
11 |
1 |
1 |
12 |
5 |
5 |
1 |
1 |
|
|
|
26 |
|
И |
33 |
19 |
14 |
16 |
12 |
15 |
1 |
|
121 |
|
8 |
31 |
21 |
15 |
4 |
5 |
4 |
|
|
88 |
|
1 |
4 |
10 |
23 |
13 |
12 |
8 |
3 |
|
74 |
|
|
7 |
6 |
1 |
5 |
4 |
|
2 |
|
25 |
|
|
3 |
3 |
|
|
|
1 |
5 |
1 |
13 |
|
|
|
|
|
|
|
2 |
9 |
2 |
13 |
т х |
12 |
21 |
90 |
64 |
58. |
39 |
34 |
30 |
20 |
3 |
371 |
ко установить, какая зависимость имеет место
между переменными — функциональная или
корреляционная.
Как видно из рис. 4, с возрастанием среднеди
намической производительности пласта себе стоимость 1 т угля снижается-, а производи
тельность труда растет.
В основе метода корреляции лежит вырав
нивание, позволяющее определить усредненное
влияние отдельных факторов на результаты
производственно-хозяйственной деятельности предприятий. Методика соответствующих под счетов показана ниже в табл. 7 (в таблице пред ставлены средние значения у и ж в интервалах).
На рис. 4—7 на поле корреляции изобра жены графически результаты подсчетов значе
ний средних арифметических по формуле (3).
Ординаты ?/, последовательно соединяются пря
мыми линиями. Полученная ломаная линия, вы ражающая форму связи между у и х, называется
эмпирической линией регрессии у по х. Линия ре
грессии показывает, как в среднем изменяются
(смещаются) ряды распределения у с увеличе нием или уменьшением х. Поступательный ход
линии регрессии несколько нарушается зигза
гами, которые имеют случайный характер и сильнее проявляются в интервалах с незначи тельным количеством наблюдений.
Аналогично строится эмпирическая линия
зависимости х от у.
Эмпирическую линию регрессии нужно рас
сматривать в поле корреляции на фоне индиви
дуальных точек, которые она усредняет.
На основании закона больших чисел можно
утверждать, что при неограниченном возраста-
5 3
с, |
|
|
- |
|
руб |
|
. 1• |
1 |
7117р +15,58 |
19 |
- |
Я |
||
1 |
■ |
|
||
|
• к |
• |
|
|
|
• у - |
|
||
17 |
’ |
V |
|
|
|
|
|
\. |
|
|
|
|
' |
|
15 |
|
|
V • • |
|
|
|
|
r 'y . |
|
13 |
|
|
\ • • |
|
|
|
. |
t |
11
■ V
9
7
т/м ес |
П=6,0832,р 1-17,77 |
||
40 |
|
|
|
36 |
|
|
|
32 |
• £ » ш |
||
28 |
|||
24 |
|||
20 |
Т \ \ |
|
|
. , |
|
: / • |
|
|
|
||
16 |
! |
|
|
T f - |
|
|
|
12 |
0,7 |
0,9 |
1,1 |
0,5 |
^ • • *
Ч.
•*ч ч • * •
и<
> : : :
-
1,3 1,5 1,7
6
•• \ \
;^ ч
•ч»
■
£
1.'
—1 —Г-
Т-
и -
1,9 2,1 2 J р, ф *
Рис. 4. Корреляционные поля и линии регрессии для группы шахт с комбайновой выемкой угля:
а — себестоимость 1 m угля С и производительность пласта р; б — производительность труда П и производительность пласта р.
5 4
нии числа наблюдений случайные зигзаги эмпи
рической линии будут сглаживаться и линия
будет принимать все более правильный, законо
мерный характер. Нахождение предельного по
ложения эмпирической линии регрессии состав ляет одну из основных проблем теории корре ляции — проблему формы связи.
Предельное положение эмпирической линии регрессии, к которому она стремится при неогра ниченном увеличении числа наблюдений, назы
вается теоретической линией регрессии.
Корреляционное поле и нанесенные на него
эмпирические линии регрессии показывают на личие корреляционной связи. Если бы у не за
висел от х или наоборот, то линия регрессии
у по х была бы параллельна оси абсцисс, а линия
регрессии х по у — оси ординат, т. е. они пере
секались бы под углом, близким к 90°. Приме
ром этого могут служить приведенные на рис. 5 зависимости между производительностью труда рабочего П , с одной стороны, скоростью прове дения откаточных штреков КПОДг и средней дли ной лавы /л, с другой, для группы шахт, на которых преобладает выемка угля комбай нами.
Следует подчеркнуть, что во всех случаях использования корреляционного метода ото
бранные факторы необходимо подвергать
экономическому анализу. Математическая стати стика в данном случае является одним из ору дий экономического исследования и должна контролироваться с точки зрения законов эконо мики. Сочетание математического анализа с логи
ческим освобождает от излишней расчетно графической работы и дает возможность избе
55
жать ложных выводов, помогает наилучшим
образом познать закономерности формирования
экономики предприятий.
Процесс нахождения теоретической линии
регрессии заключается в выборе и обосновании
типа кривой и расчете параметров ее уравнения.
|
|
|
п, |
|
0=0,0016 1л +25, 91 |
||
|
|
|
г/мес |
|
|||
|
|
|
|
|
|
|
|
|
|
|
36 |
|
4 V |
|
|
|
|
|
|
V. . |
|
|
|
|
|
|
28 |
|
r.v . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-*■ |
. |
/ |
|
|
|
|
• |
|
|
|
|
|
|
|
20 |
|
i - |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О |
80 |
160 240 |
1270 |
90 |
НО |
130 |
150 |
|
а |
V^.M/мес |
|
|
6 |
|
|
Рис. 5. Корреляционные поля и линии регрессии для группы шахт с комбайновой выемкой угля:
а — производительность труда П и скорость проведения отка точного штрека УПОдГ; б — производительность труда Я и сред
няя длина лавы 1„
Предельная теоретическая линия регрессии изо
бражается, как правило, плавной кривой. Поэ тому процесс нахождения теоретической линии
регрессии называется выравниванием эмпири
ческой линии регрессии.
Наиболее часто для выравнивания эмпири
ческой линии регрессии пользуются уравнением
прямой
ух = а + Ьх. |
(16) |
56
Для выравнивания эмпирической линии ре грессии, отражающей криволинейную зависи
мость, пользуются уравнением параболы
Ух = а + Ьх + сх2. |
(17) |
Для обратно пропорциональной зависимос
ти пользуются уравнением гиперболы
|
У* = |
а + ^ , |
(18) |
где |
ух — ордината |
теоретической линии |
ре |
грессии;
а,Ь,с — неизвестные параметры уравнений.
Уравнение (18) простым преобразованием
может быть приведено к линейному виду: вы-
1
ражая — через z, получаем у = а + bz. Урав
нение кривой подбирают так, чтобы оно отве чало теоретической характеристике изучаемого процесса, не противоречило логическим поло
жениям и в то же время позволяло использо
вать упрощающие методы расчета.
Из математического анализа известно, что если анализируемая совокупность подчиняется закону нормального распределения, то теоре тическая линия регрессии выражается прямой.
Кроме того, в достаточно малых промежутках
изменения аргумента криволинейные зависи
мости могут быть воспроизведены приближенно
с достаточной точностью линейной зависимо стью. О линейной (или близкой к линейной)
зависимости между рассматриваемыми перемен
ными свидетельствует характер эмпирических
линий регрессии и расположение точек.
Найти уравнение регрессии — значит вы разить формулами (17, 18, 19) связь между сред
57
ними значениями у (в интервалах изменения х) и соответствующими значениями х. Решение этой задачи усложняется тем, что средние ве
личины у в разных интервалах имеют неодина
ковый удельный вес частот. Ввиду большого и
неизбежного разброса точек метод средних ве
личин и графический метод в данном случае не
приемлемы.
Из бесчисленного множества прямых линий, которые можно провести на плоскости, следует выбрать одну, наилучшим образом соответ
ствующую экспериментальным данным. Для
этого требуется, чтобы сумма квадратов расстоя
ний всех экспериментальных точек от ординат, вычисленных по уравнению прямой, была ми нимальной.
Для облегчения вычислительной работы, а также для быстрого отыскания погрешностей и своевременной их ликвидации составляется ра
счетная таблица, полностью отражающая ход
действий над цифрами.
Пример. Определим корреляционную зависимость между производительностью труда и относительной протяженностью откаточных выработок на 1000 т месячной добычи по шахтам с выемкой угля отбойными молотками.
Эмпирическая линия регрессии и все взве шенные суммы, которые необходимы для опре деления углового коэффициента при неизвест ном и свободного члена в уравнении парной
регрессии, рассчитываются в порядке, пока
занном в табл. 7. В таблице по вертикали записываются интервалы значений у и их сред ние значения, по горизонтали — интервалы
значений х и их средние значения. В результа
58
те пересечения вертикального и горизонталь
ного рядов образуется клетка. В левой половине
клетки фиксируется частота т , т. е. количество случаев с данным значением х и у; в правой
верхней части клетки приводится резуль тат умножения частоты на среднее значение ин
тервала по жср; в правой нижней части клетки
записывается произведение частоты на среднюю
величину интервала по уср. Суммарное количе ство случаев х в данном интервале заносится в
колонку Етгеу, а суммарное количество |
случа |
ев у в каждом интервале х — в строку |
Ъ тх. |
Заполнение таблицы начинается с умноже
ния количества случаев на средние значения
интервалов изменения показателей. Сумма про
изведений частот на среднее значение хср в ин
тервале заносится |
в колонку 2,(m,jXcp), а |
сум |
|
ма произведений |
частот |
на среднее значение у |
|
в данном интервале —■ в |
строку 2,(тхуср). |
Сум |
марные величины двух произведений должны
быть равны |
между собой, т. |
е. 2(т,/гср) = |
|
= 2(/лж1/ср). |
|
|
|
Контроль за |
вычислениями |
осуществляется |
|
также путем заполнения строки |
2(/ижг/ср) и ко |
||
лонки |
хср) |
величинами, |
которые полу |
чаются путем перемножения средних значений
интервалов на соответствующие им частные сум мы количества случаев по столбцам и строкам. Величины ух и х„ определяются делением зна чений I,(mxycp) или ЩгПуХСр) на частные сум
мы частот по интервалам.
Полученные в результате расчета средние
значения у по каждому интервалу изменения х являются соответствующими ординатами эм пирической линии регрессии.
5 9