
книги из ГПНТБ / Сивый В.Б. Метод множественной корреляции в анализе и планировании угольных предприятий
.pdfПОДГОТОВКА МАТЕРИАЛОВ
КОБРАБОТКЕ, ГРУППИРОВКА
ИАНАЛИЗ ПОКАЗАТЕЛЕЙ
ля надежного суждения об объективности Дполученных зависимостей необходимо под вергнуть математическому анализу несколько сот случаев варьирования каждого признака. Первичные данные, подлежащие обработке,
подвергаются тщательному просмотру, причем
исключаются периоды явно ненормальной ра боты шахт.
Запись рядов распределения производится в интервальной форме, т. е. показатели по своим
числовым значениям объединяются в разряды
(интервалы), каждый из которых определяется
низшим и высшим пределами.
Из полученных данных находятся наиболь шая и наименьшая варианты (яМ£ШСи яМин), раз-
20
пость между которыми определяет размах варьи
рования признака (промежуток вариации):
И в — 2-макс 2-мин• |
(1) |
От объема совокупности и размаха варьиро вания зависит количество интервалов.
Количество интервалов не должно быть чрез
мерно большим, так как в каждом интервале тогда окажется слишком мало наблюдений и
трудно будет выявить закономерность измене ния показателей; таблицы получатся громоздки
ми и их рассмотрение усложнится. Увеличение же интервала может привести к исчезновению ряда существенных подробностей распределе ния .
В литературе [1] рекомендуется при числе наблюдений от 100 до 500 брать 8—16 интерва лов; среднее количество интервалов обычно принимается равным 12 [2].
Для определения величины интервала нужно
размах варьирования разделить на среднее число интервалов, т. е.
_ |
-^в |
жмакс |
а'мин |
/оч |
« — |
12 — |
12 |
* |
\z) |
Полученное значение интервала и обычно
округляется.
Рассмотрим порядок построения рядов рас
пределения на примере шахт, где преобладает
выемка угля комбайнами.
По рассматриваемой группе шахт произво дительность труда, себестоимость 1 т угля и
значения показателей материально-техниче
ских условий производства колеблются в сле дующих пределах: месячная производитель
21
ность |
труда рабочего |
по |
добыче — от |
12 до |
44 т \ |
себестоимость 1 т |
угля — от 7 до 21 руб.; |
||
средняя длина очистного |
забоя — от |
70 до |
160 м\ среднемесячные скорости подвигания очистной линии забоев — от 13 до 55 м/мес; среднединамическая производительность пла
ста — от 0,5 до 2,5 m/л 2; относительная протя
женность откаточных выработок на 1000 т ме сячной добычи — от 200 до 1000 м\ соответ
ственно протяженность проводимых и ремонти
руемых выработок — от 0 до 32 м и от 0 до
90 м\ скорость проведения основных горизон
тальных выработок — от 0 до 280 м/мес и сред
несуточная |
добыча шахт — от |
250 до 4500 т . |
В этом |
примере .тмакс— 44 |
т/мес] хшт — |
= 12 т/мес. Если принять количество интер валов равным 12, то величина интервала соста вит 2,67 т/мес. Округляем величину интервала до 4 т/мес, что соответствует количеству интер
валов, равному восьми.
Первичная систематизация и обработка дан
ных исследования должна производиться раз
дельно по группам шахт в зависимости от осо бенностей их материально-технических условий. Для анализируемой группы шахт промежут ки вариации показателей разбиты на неодина ковое количество интервалов (табл. 1).
При сравнительно небольшом объеме ин
формации частота каждого интервала может рас
считываться вручную. Для экономии труда и времени, оперативного использования статисти ческих материалов и данных оперативного уче
та более эффективным в современных условиях является применение счетно-аналитических ма шин.
22
|
|
|
|
Шахты с комбай |
|
|
|
|
|
новой выемкой |
|
|
Показатели |
|
Величи |
Коли |
|
|
|
|
|
||
|
|
|
|
на ин |
чество |
|
|
|
|
терва |
интер |
|
|
|
|
лов |
валов |
Производительность труда рабочего |
|
8 |
|||
по добыче, т/м ес |
..................................... |
|
4 |
||
Себестоимость 1 |
т угля, руб. |
. . . |
2 |
7 |
|
Месячный |
фонд |
заработной |
платы |
1000 |
8 |
рабочих по добыче, руб./1000 т |
. . . |
||||
Среднесуточная добыча, т ................. |
|
500 |
9 |
||
Скорость подвигания очистной ли |
6 |
7 |
|||
нии забоев, |
м /м ес ................ .................... |
|
|||
Среднединамическая производитель |
0,2 |
10 |
|||
ность пласта, |
т /м 2 ................................. |
|
|||
Скорость |
прохождения основных |
40 |
7 |
||
торных выработок, |
м /м ес ......................... |
|
|
|
Таблица 1 |
|
Шахты с выем |
Смешанная груп |
||
па шахт с ма |
|||
кой отбойными |
шинной и ком |
||
молотками |
байновой выем |
||
|
|
кой |
|
Величи |
Коли |
Величи |
Коли |
на ин |
чество |
на ин |
чество |
терва |
интер |
терва |
интер |
лов |
валов |
лов |
валов |
2 |
и |
6 |
7 |
1 |
12 |
о |
10 |
1000 |
13 |
2000 |
6 |
300 |
10 |
400 |
7 |
6 |
10 |
4 |
11 |
0,1 |
14 |
0,2 |
11 |
10 |
16 |
20 |
И |
Продолжение табл. 1
|
|
|
|
|
Шахты с выем |
Смешанная груп |
||
|
|
|
Шахты с комбай |
па шахт с ма |
||||
|
|
|
кой отбойными |
шинной и ком |
||||
|
|
|
новой выемкой |
молотками |
байновой выем |
|||
Показатели |
|
|
|
|
|
|
кой |
|
|
|
Величи |
Коли |
Величи |
Коли |
Величи |
Коли |
|
|
|
|
||||||
|
|
|
на ин |
чество |
на ин |
чество |
на ин |
чество |
|
|
|
терва |
интер |
терва |
интер |
терва |
интер |
|
|
|
лов |
валов |
лов |
валов |
лов |
валов |
Относительная протяженность отка- |
|
|
|
|
|
|
||
,точных выработок на 1000 т |
месячной |
100 |
8 |
100 |
8 |
100 |
10 |
|
добычи, м .................................................... |
|
|
||||||
Средняя длина очистного забоя, |
м |
10 |
9 |
10 |
16 |
20 |
10 |
|
Относительная протяженность прово |
|
|
|
|
|
|
||
димых за счет эксплуатации основных |
|
|
|
|
|
|
||
горных выработок на 1000 т |
месячной |
4 |
8 |
4 |
8 |
2 |
15 |
|
добычи, м ..................................................... |
|
|
||||||
Относительная протяженность ремон |
|
|
|
|
|
|
||
тируемых за счет эксплуатации основ |
|
|
|
|
|
|
||
ных горных выработок на 1000 т |
ме- |
|
9 |
10 |
10 |
20 |
12 |
|
-сячной добычи, м ..................................... |
|
|
10 |
При обработке исходных данных на маши
носчетной станции разрабатывается макет пер
фокарты. Для уменьшения объема перфорации
и сортировки каждому интервалу группируе
мого показателя присваивается числовой шифр
(порядковый номер) и составляется схема-за дание. На макете перфокарты последовательно
размещаются показатели и каждому из них от
водится колонка в соответствии с принятым чис
лом знаков. В зашифрованном виде исходные
данные переносятся на перфорационные кар
точки, которые обрабатываются на сортиро вальных машинах согласно заданной программе.
В программе предусматривается порядок распо ложения и сочетания исследуемых показателей
по принятым интервалам их варьирования.
Вначале перфокарты пропускаются через сор
тировальную машину по показателю, выступаю
щему в качестве функции. Затем рассортировы
ваются по показателю, выступающему в каче стве аргумента. Группы перфокарт поочередно устанавливаются на каретку подающего меха низма табулятора, который отбирает и с по мощью специальных счетчиков фиксирует и пе чатает на бумажной ленте требуемые показа
тели.
Количество наблюдений (перфокарт) в каж дом интервале может подсчитываться вручную.
Одновременно контролируется «на свет» распре
деление перфокарт по карманам. В случае об
наружения погрешностей перфокарты рассор тировываются повторно.
После определения значений каждого ин
тервала строятся ряды распределения по вы
бранным показателям. Для этого данные из та
35
буляграммы переносятся в составленные зара нее формы программного задания.
В табл. 2 приведены сгруппированные выбо
рочные данные о производительности труда рабочих. В варьировании признаков замечает ся следующая закономерность: один из интер
валов встречается с наибольшей частотой. По ме
ре удаления от этого интервала в сторону боль ших или меньших значений частоты вариант
постепенно уменьшаются. Характер нарастания
и убывания частот выражает закономерность
связи между величиной вариант и частотой, с
которой они встречаются. Эта закономерность отчетливо обнаруживается уже при данном чис
ле наблюдений.
Таблица 2
Шахты с комбай |
Шахты с выемкой |
Смешанная группа |
|||
шахт с машинной и |
|||||
новой выемкой |
отбойными молотками |
комбайновой выемкой |
|||
Интервал, |
Час- |
Интервал, |
Час- |
Интервал, |
Час- |
т/мес |
тота |
т/мес |
тота |
т/мес |
тота |
12— 16 |
и |
12— 14 |
1 |
0— 6 |
1 |
16—20 |
26 |
14— 16 |
20 |
6— 12 |
3 |
20—24 |
121 |
16— 18 |
32 |
12— 18 |
130 |
24—28 |
88 |
18—20 |
40 |
18—24 |
356 |
28—32 |
74 |
20— 22 |
48 |
24—30 |
199 |
32—36 |
25 |
22— 24 |
44 |
30—36 |
98 |
36—40 |
13 |
24—26 |
47 |
36—42 |
19 |
40— 44 |
13 |
26—28 |
40 |
|
|
|
|
28—30 |
13 |
|
|
|
|
30—32 |
12 |
|
|
|
|
32— 34 |
3 |
|
|
Наряду с табличной формой выражения чис
ловых данных используются графическая и ана
литическая.
26
Графическое изображение позволяет лучше
понять характер изучаемого распределения.
Графические вероятностные законы распре
деления количественных признаков (случайных
переменных) изображаются в виде полигонов,
гистограмм и плавных кривых.
Гистограмма применяется для изображения интервального вариационного ряда и характе ризует эмпирическое распределение признака,
т. е. распределение в том виде, в каком оно не
посредственно отражается в полученных в ре
зультате наблюдения данных.
При построении гистограмм по оси абсцисс откладываются значения границ интервалов, а
по оси ординат — числа, пропорциональные час тотам. Площади получаемых прямоугольников
также пропорциональны соответствующим зна
чениям частот или частостей.
Соединяя середины верхних оснований пря моугольников отрезками прямой, получаем по лигон распределения.
На практике гистограммы применяются ча
ще, чем полигоны.
В эмпирическом распределении можно уло
вить определенную закономерность в измене
нии частот. Эта закономерность в чистом виде обычно не проявляется из-за различного рода
случайных отклонений. При увеличении объе
ма выборки влияние случайных причин умень
шается и ломаная линия графика эмпирическо
го распределения становится более плавной и
правильной. Однако увеличение объема выборки
связано с целым рядом практических осложне ний. Поэтому в исследованиях идут по другому
пути, используя специальные методы вы
27
равнивания ломаных линий плавными кри выми.
Эмпирически установленному распределе
нию отвечает характерная для него теоретиче
ская форма распределения, изображаемая гра
фически в виде кривых нормального распреде
ления.
Кривую нормального распределения можно
определить как предел, к которому стремится
гистограмма по мере увеличения количества наблюдений изучаемого признака в данной со
вокупности. Кривая распределения в отличие
от гистограммы дает представление о теоретиче
ской форме распределения признака изучаемой
совокупности; она выражает общий закон дан
ного распределения.
Кривая нормального распределения может иметь различную степень пологости и крутизны в зависимости от величины варьирования. Кон стантами, характеризующими нормальное рас пределение, являются средняя арифметическая
распределения и среднее квадратическое от
клонение.
Рассмотрим порядок вычисления необходи
мых данных для построения гистограмм и кри вых нормального распределения на примере по казателей «себестоимость 1 т угля» по группе шахт с комбайновой выемкой (табл. 3) и «про
изводительность труда» по группе шахт с выем
кой угля отбойными молотками (табл. 4).
В первой графе табл. 3 приводится среднее
значение каждого интервала х = С; во вто
рой — соответствующая абсолютная частота ва
риант т \ х — обозначается |
взвешенная |
сред |
няя арифметическая. Если |
переменная |
вели- |
2 8
чина принимает к значений (вариант) Жь х2,...х1{,
каждое из которых встречается соответственно т 1 , т 2 , т К раз, то взвешенная средняя ариф метическая рассчитывается по формуле
|
|
|
|
к |
- |
xim1 + |
хгт 2+ |
. . . + |
х1.т К |
|
mi + |
m2 + |
. . . + |
т и |
В ряде проблем, которые решаются при по
мощи рядов распределения, основное место за
нимает вопрос измерения массового уровня
признака. Ответ на этот вопрос дает нахожде
ние средних величин, а на графике — положе ние кривой на оси абсцисс.
Второй основной проблемой является изме рение варьирования признака, которое харак теризуется рассеянием кривой распределения по оси абсцисс. В теории и на практике в каче стве меры варьирования служит среднее квад
ратическое отклонение.
Вычисление показателей рассеяния произ водится в следующем порядке. Вначале нахо дятся отклонения всех признаков от среднего
значения (х — х) по интервалам. При этом от
клонения в сторону больших вариантов счи таются положительными, а в сторону меньших—
отрицательными. Для устранения влияния зна ка эти отклонения возводятся в квадрат (х —
— х ) г (табл. 3, графа 5). Затем рассчитывается
полная дисперсия (от латинского |
dispercia — |
рассеяние) |
|
£ ( г — х)*т |
(4) |
Г* = — ------------ |
|
П |
|
29