
книги из ГПНТБ / Чесноков, Н. И. Оптимизация решений при разработке урановых месторождений
.pdfОценка размахов (пределов) колебаний значений выборки от средней осуществляется по формуле
]S a ”f™ = \ g x ± t o leX[. |
(2.26) |
Этот параметр, являясь производным от остальных, на глядно иллюстрирует дисперсию значений выборки. Величины Амакс и Ям,,,, представляют собой соответст венно логарифмы максимальных и минимальных гранич ных значений выборки, определяемых с заданной веро ятностью p = F (t).
Виды распределения случайных величин, встречаю щиеся в практике, разнообразны. В данном разделе рас смотрены в общих чертах лишь нормальный и логнор мальный законы распределений. Более подробно вопро сы распределения случайных величин изложены в рабо тах [6, 8, 10, 25, 28, 35, 36].
Статистические исследования совокупности призна ков. Для оценки структуры изучаемых совокупностей по нескольким признакам, а также характеристики каждой группы по их удельным весам и другим показателям используют метод группировок. При этом в качестве под лежащего группировки обычно принимают расчленен ную по какому-либо признаку совокупность, а в качест
ве сказуемого — систему признаков, характеризующих |
|
подлежащее. |
|
Составным элементом структурных группировок при |
|
нимают ряд распределения элементов |
совокупности по |
изучаемому признаку. Используют следующую схему |
|
построения аналитических группировок: |
х — технологи |
ческий фактор, влияющий на результат процесса; у — результативный признак.
Элементы группируют по признаку х*, п в каждой группе исчисляют среднее значение признака у (табл. 4).
При рассмотрении |
изменения средних |
значений |
у, |
|||
расположенных |
в порядке |
возрастания |
х, выясняют |
|||
|
|
|
|
|
Т а 6 л it к я |
4 |
Г р у п п ы ПО X |
ч |
*2 |
|
х к |
|
|
Г р у п п о в ы е с р е д |
У і |
2/2 |
Уз |
У к |
|
|
н ие |
у |
|
||||
|
|
|
|
|
||
* |
.Ѵі<.Ѵі+і. |
|
|
|
|
|
60
характер связи между вариацией сопоставляемых пере
менных.
Для изучения структур совокупностей применяется также метод комбинационной группировки с разделе нием подлежащего группировки на два и более признака (подгруппы). _ «I Чтобы избежать логических ошибок при использо вании метода аналитических группировок для изучения совокупности взаимосвязей элементов изучаемой струк туры, повторение одинаковых элементов в подлежащем
и сказуемом группировок необходимо исключить.
Основные понятия корреляционно-регрессионного анализа
Применение методов корреляционного анализа позволяет количественно оценивать степень тесноты свя зи между процессами горнорудного производства, вклю чая экономические явления. Пользуясь методами регрес сионного анализа, можно определить вид зависимости между переменными величинами, выразить ее в виде математической формулы и проанализировать ее.
Основным условием объективного анализа производ ственных и экономических взаимосвязей является кон кретная постановка задачи и четкое представление о видах связей в горнорудном производстве.
При рассмотрении основных понятий математической статистики отмечалось, что протекание процессов гор ного производства носит вероятностный (стохастиче ский) характер.
Связь между двумя переменными х и у может быть функциональной (полной) или корреляционной (непол ной). Последнее означает, что каждому конкретному значению х соответствует не одно, а несколько значе ний у\ с изменением х меняется распределение значе ний признака у.
В производстве строгие функциональные зависимости
между исследуемыми величинами относительно |
редки. |
В абсолютном большинстве случаев изменения |
одних |
явлений не вызывают строго обусловленных изменений других — налицо стохастическая форма связи. Частными случаями стохастической формы связи и являются кор реляционная и регрессионная связи.
61
Две случайные величины являются корреляционно связанными, если математическое ожидание одной из них меняется в зависимости от изменения другой. Соот ветственно метод математической статистики, изучаю щий корреляционные связи между явлениями, назы вается корреляционным анализом. Связь между слу чайной и неслучайной величинами называется регрес сионной. Исследование вида зависимости между пере менными величинами называется регрессионным ана лизом.
Регрессионный анализ тесно связан с корреляцион
ным. |
Основными предпосылками |
их применения яв |
||
ляются: |
|
распределение |
случайных величин; |
|
1) |
нормальное |
|||
2) |
случайные величины Х\ и х2 |
(в многомерном слу |
||
чае— Х\, х2, ..., |
хт) |
можно рассматривать как выборку |
||
из двумерной |
(в многомерном случае— многомерной) |
генеральной совокупности с нормальным законом рас пределения;
3)дисперсия случайной величины л'і остается посто янной при изменении величины х2 или пропорциональна известной функции х2;
4)математическое ожидание величины х, при х2, принявшей определенное значение, можно выразить в виде функции X\ = f{x2), линейной относительно опреде ляемых параметров.
Функция f(x, а) считается линейно зависимой от а если соблюдается равенство
/(*!, ö! + Oj) = Фі (лі, аа) + ф2 (ха> аа).
Регрессионный анализ предъявляет менее жесткие требования к исходной информации. Его применение возможно даже при некотором отличии распределения случайных величин от нормального, что важно для ана лиза процессов горного производства, так как распреде ление изучаемых величин процессов горного производ ства, включая экономические, часто бывает асиммет рично.
В качестве функции (зависимой переменной) в ре грессионном анализе принимают случайную перемен ную, а аргументом (независимой переменной), как пра вило, является неслучайная переменная.
Корреляционный анализ двух переменных. Приме нение методов корреляционного анализа возможно толь
62
ко при условии выполнения вышеуказанных предпосы лок. Если отсутствует какая-либо из них, то использо вание этих методов неправомерно. Поэтому конкретно выполняемую работу целесообразно разбивать на эта пы (шаги):
1. Выявление корреляционной связи между компо нентами графическим методом выполняется путем нане-
У |
а |
У |
S' |
|
|
||
|
9 |
|
|
|
с |
|
X |
|
X |
|
Р и с. 7. Графический способ выявления корреляционной связи между компонентами:
а — отсутствие корреляционной связи; б— наличие корреляционной связи.
сения единичных значений выборки на миллиметровую бумагу в прямоугольной системе координат (рис. 7). Здесь на осях координат — переменные величины, связь между которыми нужно установить. Если поле точек по кажет отсутствие корреляционной связи между компо нентами (рис. 7, а), то дальнейшее вычисление коэффи циентов парной корреляции при анализе двух перемен ных нецелесообразно. Корреляционная связь или отсут ствует, или она завуалирована влиянием прочих величин и необходимо использовать методы множественного корреляционного анализа, на которых мы остановимся позднее.
2. Следующий этап — выявление характера распреде ления случайных величин. Если графический метод по казал наличие корреляционной взаимосвязи между из учаемыми случайными величинами (рис. 7,6), необ ходимо установить характер распределения их единич ных значении в соответствующих статистических вы борках.
63
Поскольку методы корреляционного и регрессионного анализов приемлемы для статистических выборок толь ко с нормальным распределением случайных величин или выборок, которые можно привести к нормальному виду распределения (например, логнормальные распре деления), все дальнейшие рассуждения относятся толь ко к этому виду распределений случайных величин.
Уже при построении кривой распределения признака (см. рис. 6) можно качественно определить, насколько она близка к симметричному виду. В сомнительных слу чаях следует рассчитать асимметрию кривой распреде ления А и эксцесс Е.
3. Последний шаг исследования — анализ корреля ционных и регрессионных связей между изучаемыми яв лениями. При этом решаются две основные задачи: устанавливается степень тесноты связи между перемен ными признаками путем вычисления коэффициента кор реляции или корреляционного отношения и с помощью уравнений регрессии определяется аналитическая фор ма связи между вариациями признаков.
Уравнения регрессии между вариацией признаков* и у определяют форму связи между ними. Влияние про чих посторонних факторов выражено в уравнениях регрес сии в виде средних постоянных величин.
Для установления аналитического выражения варьи рования признака у, в зависимости от хгприменяют ме тод выравнивания, сущность которого заключается в за мене эмпирической линии, построенной в прямоугольной системе координат по данным единичных значений выборки (рис. 8), линией, представляющей аналитиче ское выражение искомой зависимости.
Для отыскания коэффициентов уравнения регрессии применяют метод наименьших квадратов, согласно кото рому отыскиваются такие значения коэффициентов урав нения регрессии, при которых сумма квадратов отклоне ний фактических значений варьирующего признака от вычисленных по уравнению была бы наименьшей из всех возможных. Это значит, находят параметры регрес сионного уравнения при условии
2 (Ух— У)2 |
= min. |
(2.27) |
п |
|
|
Исследуемые регрессионные зависимости могут быть прямолинейными или криволинейными.
64
В случае прямолинейной зависимости изменение одной из величин сопровождается прямо пропорциональ ными изменениями другой. При этом уравнения регрес сии имеют следующий вид:
|
|
Ух — ах, |
|
|
где а — |
или |
|
|
|
|
|
Ух = |
ах-\-Ь, |
|
где |
а — |
Zy + nb |
6 = |
2 ху —aZx2 |
|
|
Zx |
|
Zx |
Угловой коэффициент b уравнения регрессии харак теризует долю состояния исследуемого признака, зави сящего не от переменного х , а от других факторов.
X
Р н с. 8. Аппроксимация эмпирической ли нии регрессии расчетной кривой.
При криволинейной зависимости исследуемого при знака у от X для нахождения регрессионных уравнений используются степенные зависимости.
Формы связи, определяемые уравнениями регресссии, характеризуют количественную зависимость пере менных X и у . Для определения тесноты связи (отраже ния степени сопряженности варьирования признаков х и у ) находят их корреляционные отношения. При этом следует учитывать, что использование корреляционных отношений в качестве меры зависимости оправдано лишь тогда, когда доказано, что случайные величины х и у распределены по одинаковому закону.
5 Н. И. Чесноков и др. |
65 |
Корреляционные отношения изучаемых признаков в общем виде определяются по формуле
R = |
V |
^ r - ' |
(2-28) |
где о2 — дисперсия признака у за счет признака х: |
|
||
2 |
_ |
2 (у — УхУ2 |
(2.29) |
Х |
|
П |
|
|
|
Величина у—ух характеризует отклонения конкретных значений у от переменной средней ух.
В случае корреляционной связи исследуемых пере
менных |
величин 0 < R < [ . |
При |
функциональной связи |
|||||||
а2= 0 и R = 1, |
при отсутствии связи а 2 =ст2 |
и R = 0. |
||||||||
При линейной форме связи определяют коэффициен |
||||||||||
ты корреляции гхіу, |
характеризующие степень линейной |
|||||||||
зависимости между случайными величинами: |
||||||||||
|
|
|
|
|
гх/у |
х у - х - у |
|
|
(2.30) |
|
|
|
|
|
|
|
у |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
где |
ху — среднее |
произведение; х - у — произведение |
||||||||
средних; |
ах и |
аѵ— средиеквадратпческие |
отклонения. |
|||||||
Оценка тесноты связи осуществляется по следующей |
||||||||||
схеме: ух = у - х — полное |
отсутствие связи; у х > у - х — |
|||||||||
прямая |
связь |
между признаками; у х < у - х — обратная |
||||||||
связь |
между |
признаками; |
ух—у-х = охаѵ— функцио |
|||||||
нальная связь между признаками. |
|
коэффициента |
||||||||
Среднеквадратическая |
погрешность |
|||||||||
корреляции равна |
± а г |
|
1 —г“ |
|
|
|||||
|
|
|
|
|
|
|
(2.31) |
|||
|
|
|
|
|
|
Ѵп |
|
|
||
|
|
|
|
|
|
|
|
|
||
Степень |
надежности |
вычисленных |
коэффициентов |
|||||||
корреляции определяется по формуле |
|
|
||||||||
|
|
|
|
|
|Х = |
\r \V n |
|
|
(2.32) |
|
|
|
|
|
|
1—/-2 |
* |
|
|||
|
|
|
|
|
|
|
|
|||
При (х^2,6 |
связь между признаками можно считать на |
дежной.
Статистическая связь между признаками считается также устойчивой при условии гхіу> 0,7.
При отклонении исследуемой зависимости от линей ного вида коэффициент корреляции гхіи теряет свой смысл как характеристика степени тесноты связи между признаками х и у.
Если при равномерном возрастании аргумента наблюдается ускоренное возрастание или убывание ре зультативного признака, то статистическая связь между ними может быть выражена уравнением параболы вто рого порядка ух= а + Ьх + сх2.
Параметры уравнения параболы определяются путем
решения системы |
трех нормальных уравнений: |
||
|
|
па + |
ЬУх -f- сУх2, --= Уу, |
|
|
аУ,* + ЬУ>х2+ с2 х 3 = У>ху, .. |
|
|
|
а£х2+ ЬУх3+ сУх*=Ух2у. |
|
При |
криволинейной связи между изучаемыми при- |
||
знаками |
ух= |
а , , |
|
-----Ьо параметры уравнения регрессии |
определяются по формулам
При степенной зависимости между изучаемыми признаками ух= ахь выравнивание уравнений регрессии осуществляется путем приведения их к линейному виду y = \ga + bx', откуда находят коэффициенты а и Ь.
Соответствие аппроксимирующего уравнения эмпи рической линии регрессии можно проверить выраже нием
|
|
(2.33) |
где Уі — единичные значения |
признака у , определяемые |
|
из |
эмпирического уравнения |
регрессии в зависимости |
от |
изменения признака х; у — среднее значение призна |
ка, по экспериментальным данным; у* — единичные зна чения признака, по экспериментальным данным.
В общем виде величина Rxy представляет собой квадратный корень из частного от деления суммы квад
ратов отклонений единичных значений признака |
у, |
5 |
67 |
определенных из эмпирического уравнения _регрессии,
от среднего значения по опытным данным у на сумму квадратов отклонений фактических единичных значений уі от эмпирического среднего у.
Рассмотрим пример аппроксимации эмпирической линии регрессии. Исследуется зависимость суммы пря-
|
Р и с. |
9. |
Зависимость суммы прямых затрат на добычу |
|
|||
|
металла |
(в |
условных единицах) от условной продук |
||||
|
тивности |
отрабатываемой |
жильной |
площади. |
|
||
мых |
затрат |
на |
добычу |
условной единицы |
металла |
||
(у, |
руб/усл. |
ед.) |
при очистной |
выемке на |
жильном |
урановом месторождении от продуктивности отрабаты ваемой жильной площади х, выражаемой числом добы
тых условных единиц |
металла с |
1 м2 отработанной |
жильной площади (рис. |
9). Единичные значения услов |
|
ных затрат на добычу |
условной |
единицы металла с |
1 м2 жильной площади по очистным блокам представ лены в табл. 5. Нанесенные на график в прямоуголь ной системе координат, они показали наличие корреля ционной связи между независимой переменной х и функцией у, форма которой могла быть аппроксимиро вана уравнением второй степени.
Это предположение было подтверждено при нанесе нии единичных значений выборки на график в логариф мическом масштабе (рис. 10), где была получена четкая линейная зависимость
і§у — f 0 ё х)-
68
С О і Г Э С С Щ — СОСО — < t | -0 — t ' - . C O O O C O l O I ' - C O C D — Ь - Ю С Ч О Я О І » . |
O - C O O W O O |
|
rtcowiC'4,ortria)''OOiTfNN —ine4nco^,wc4-0'ntoT*i*‘'4,NO)-p3tooto |
||
c o c o — N. — P M O C V | W N ® W > —'Ю Р З П 5 - ч - С-1 Ю СО О —. C 0 « 0 M C O ' f <ß |
- V r ’ S O N |
|
COMOOOOO'^CO'O - COO'J'O — CO^ - CCICO - NC'IOO |
--------'0 r U : 0 |
0 - < N N M N |
ОСОООООтг — C n Q O O rfO O O JO O O r^ - O O O O O — O - O - O O O O O C O O
ю
cnTfcoc^oc^(Mio^f^ooC5cocoocoh-cMO!M<s3ooc'ioo —cvof^.coaD~co—co'f
C O W N ^ O K ) — r O r t n i ^ ( M ( N -^ a c O C ) N l O O ! £ ) i n W W “O C O W ? K M — t t O S C O q q .
l O O l O l O O O l Q O W O N l O c O - O W i O N - i O O ^ W O O C O O T t O P J C O U j M O S C l g j r ; |
|||||||
■^4<-i(ONONCO —n01'rO)<ONlO«OC4 —03NC'I'4'<CfO''tt|CONl/5N-'ö>COoiN |
|||||||
сосот.................................................................................................................................}‘ю-<опмосгіт}-сосп<ло^ло'лаі''иососок(5со-ѵсо'^юмтгсо |
t^-CT) |
||||||
„ . |
|||||||
— o i i ß |
с о — е я — m і л |
— t ^ c -j c o — о — ю — |
с о — n с ч n is. |
— ю е о с о - ^ |
|||
U5 |
<M — CO |
CO |
<M |
CO |
— |
CO — i n |
|
C 0 N C 0 N M , t 0 O 0 5 W |
tf i t s - ' C ' l N C 0 |
O) N C l ffi о Я - |
N CT> — ( O W N - СО N |
N N ч** СО N |
Ю — Ю — O O C O O O C O ' t O i n O — N I O C O C O C T J N 'O C T I C 'J — Л Ю Ю С О О і т р О Ю ^ ^ і л ^ 0счеосоюоггс> C D i O C 0 4 j ’ C O'tіФсчсОQ C 4 f » 0 > '—і’Сіоo n o)c—o мсооюооююмоьстючc o o i c o c 'i n g g c o c o — ъ - с ч с-оосоосччо с о е о о і с -о^—сою><м ^—
r C 4 C ' I O ) C O C O ,!t, C O O O C ' J C ' O N O C O N
— (М c s
СО О 00 ч* — C O N N < 0 4 - . © l O l O O O a 5 N C O N O > 4 * « c O T l M C O i n c O C O O O i O © C O e 4 C ' l © C C C O ©
CllsO lO O O - O W C 'IO O tC O O O cO 'S’ - 'C - O C l O O N - n c i O i O O - O l ß t O O
O v O O ° 0 0 ) W S O - ОС 0 ООЮ ОООС 5 О — О О О — О — O ^ — O O — (MO —
о— оо о о ю о — о о о о о о о о о о со о о а о о о о о о о о о о о м сч о
оо о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о о
ОЮіО—05 —іОЮ—0)00> —rf'T—0)<0 —О) ———СО>т — •<“05СОО>ОіО)СОСО
O i M C M O - « " * 4 - i M ( M ( N ^ O - Q . O c O O i M W — O t I M M C O O i O C O ( M O o o O C * J t O O > i C O ' 3 ' C O — ь . |
|
O O O C 0 - r O O ( 0 ' - a 3 v O O < M N N N |
C d O W i / 3 ^ - — < O < 5 O — о о ю с о ^ а з о — w o |
o r t i o o o M w i c r t i ^ T j - o c o c c i o m |
s N - v i o w N r t — — с о — о * « - — с о с о с о с ч — с о N |
© — N — O |
— O — СО © СЧ ІО — со — IS . L OO JC O C 'J |
|
W’TC'l'sriOWPJvN- N —СЮСО ©«4) |
—Ю—-4*10 |
|
(М — |
с о |
ю со |
- —01©С'105С001ЮС'|чг< —lOCONO-srCO-rcO-
0©л——©cO‘O^COO-<'a'«tsNN<OWNOOOC'IO'S,©lOinO)OC^C'lVO —W(
сfincoNcociO — «mco ^ ioconoocjo — csco-s-iocoNcoCiO — cmcottiocon
—— —. — — — — — — — C'J04C'JC'JC'J<NC'|C4C'1C4COCOCOCOCOCOCOCO
%