Учебн. пособия-ОНИ / 2. Бабиюк_Алчевск-07
.pdf
Основы научных исследований
ЛЕКЦИЯ 9
4.5 Вероятностно-статистические методы исследований
Во многих случаях в горной науке необходимо исследовать не только детерминированные, но и случайные процессы. Все геомеханические процессы протекают в непрерывно изменяющихся условиях, когда те или иные события могут произойти, а могут и не произойти. При этом возникает необходимость анализировать случайные связи.
Несмотря на случайный характер событий, они подчиняются определенным закономерностям, рассматриваемым в теории вероятностей, которая изучает теоретические распределения случайных величин и их характеристики. Способами обработки и анализа случайных эмпирических событий занимается другая наука, так называемая математическая статистика. Эти две родственные науки составляют единую математическую теорию массовых случайных процессов, широко применяемую в научных исследованиях.
Элементы теории вероятностей и матстатистики. Под со-
вокупностью понимают множество однородных событий случайной величины х, которая составляет первичный статистический материал. Совокупность может быть генеральной (большая выборка N), содержащей самые различные варианты массового явления, и выборочной (малая выборка N1), представляющая собой лишь часть генеральной совокупности.
Вероятностью Р(х) события х называют отношение числа случаев N(х), которые приводят к наступлению события х, к общему числу возможных случаев N:
P(x)=N(x)/ N . |
(4.51) |
В математической статистике аналогом вероятности является поня-
тие частости события y(x) , представляющей собой отношение числа случаев n(x) , при которых имело место событие, к общему числу событий:
y(x)=n(x)/n . (4.52)
101
|
|
|
Методы теоретических исследований |
|||
При неограниченном возрастании числа событий частость y(x) |
||||||
стремится к вероятности Р(х). |
|
|
|
|
||
Допустим, имеются какие-то статистические данные, представлен- |
||||||
ные в виде ряда распределения (гистограммы) на рис. 4.11, тогда частость |
||||||
yоi характеризует вероятность появления случайной величины в интервале |
||||||
і, а плавная кривая f (x) носит название функции распределения. |
||||||
40 |
|
|
|
|
|
|
yi, Pi |
|
|
|
|
|
|
30 |
|
|
|
|
f(x) – теоретическое |
|
% |
|
|
|
|
||
25 |
|
|
|
|
распределение |
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
15 |
|
|
|
|
y0i |
– эмпирическое |
10 |
|
|
|
|
распределение |
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
0 |
|
|
|
|
|
82 xi (Vс, м/мес) |
4 |
17 |
30 |
43 |
56 |
69 |
|
Рисунок 4.11 – Гистограмма, теоретическое и эмпирическое |
||||||
|
распределения для скорости сооружения выработок |
|||||
Вероятность случайной величины – это количественная оценка возможности ее появления. Достоверное событие имеет Р=1, невозможное событие – Р=0. Следовательно, для случайного события
n
0 ≤ P(x) ≤ 1, а сумма вероятностей всех возможных значений åPi =1 .
|
|
|
|
|
0 |
В исследованиях недостаточно |
иметь кривую |
распределения |
|||
f (x) , а необходимо знать и ее характеристики: |
|
||||
|
|
n |
x |
|
|
|
|
|
|||
а) среднеарифметическое – x =å |
i |
; |
(4.53) |
||
|
|||||
1 |
n |
|
|||
б) размах – R = xmax – xmin, который можно использовать для ориентировочной оценки вариации событий, где xmax и xmin – экстремаль-
102
Основы научных исследований
ные значения измеренной величины;
n |
|
в) математическое ожидание – m(x)=åxi Pi . |
(4.54) |
1 |
|
Для непрерывных случайных величин математическое ожидание записывается в виде
+∞ |
|
m(x)= òx× f (x)dx , |
(4.55) |
−∞
т.е. равно действительному значению наблюдаемых событий х, а соответствующая матожиданию абсцисса называется центром распределения.
n |
2 |
|
г) дисперсия – Д (x)=å[xi -m(x)] ×Pi , |
(4.56) |
|
1 |
|
|
которая характеризует рассеивание случайной величины по отношению к математическому ожиданию. Дисперсию случайной величины иначе еще называют центральным моментом второго порядка.
Для непрерывной случайной величины дисперсия равна
+∞ |
|
||
Д (x)= ò(x-m(x))2 × f (x)dx ; |
(4.57) |
||
−∞ |
|
||
д) среднеквадратичное отклонение или стандарт – |
|
||
σ (x)= |
|
. |
(4.58) |
Д(х) |
|||
е) коэффициент вариации (относительное рассеяние) – |
|
||
kb =s(x)/m(x)<1, |
(4.59) |
||
который характеризует интенсивность рассеяния в различных совокупностях и применяется для их сравнения.
Площадь, расположенная под кривой распределения f (x) , со-
ответствует единице, это означает, что кривая охватывает все значения случайных величин. Однако таких кривых, которые будут иметь площадь, равную единице, можно построить большое количество, т.е. они могут иметь различное рассеяние. Мерой рассеяния и является дисперсия или среднеквадратичное отклонение (рис. 4.12).
103
|
|
|
Методы теоретических исследований |
||||
f(x) |
|
|
|
|
|
|
|
0,6 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
∞ |
|
|
|
|
|
0,4 |
|
ò f (x)dx=1 |
|
2 |
|
|
|
|
−∞ |
|
|
|
|
|
|
0,2 |
|
|
|
|
3 |
|
|
0 –x |
–6 |
–4 |
–σ 0 |
σ |
4 |
6 |
x |
Рисунок 4.12 – Характер рассеяния нормальной кривой |
|
||||||
|
|
распределения 1 – σ=0,5; 2 – σ=1,0; 3 – σ=2,0 |
|
||||
Выше мы рассмотрели основные характеристики теоретической кривой распределения, которые анализирует теория вероятностей. В статистике оперируют эмпирическими распределениями, а основной задачей статистики является подбор теоретических кривых по имеющемуся эмпирическому закону распределения.
Пусть в результате n измерений случайной величины получен вариационный ряд х1, х2, х3, … хn. Обработка таких рядов сводится к следующим операциям:
– группируют хі в интервале и устанавливают для каждого из
них абсолютную и относительные частости yi и yoi ;
– по значениям xi и yoi строят ступенчатую гистограмму(рис. 4.11);
– вычисляют характеристики эмпирической кривой распределе-
|
|
|
1 |
n |
|
1 |
n |
|||||
ния: среднеарифметическое |
x |
= |
åxi ; дисперсию |
Д= |
å(xi − |
x |
)2 ; |
|||||
n |
n |
|||||||||||
|
|
|
1 |
|
|
1 |
|
|
||||
среднеквадратичное отклонение σ = |
|
|
. |
|
|
|
|
|
||||
|
Д |
|
|
|
|
|
||||||
Значениям х , Д и σ эмпирического распределения соответствуют величины х , Д(х) и σ(х) теоретического распределения.
104
Основы научных исследований
|
а) |
|
б) |
f(x) |
1 |
f(x) |
1 |
|
|
||
|
2π |
|
2π |
0 m(x) x –x 0 x
Рисунок 4.13 – Общий вид кривой нормального распределения:
а) m(x) ¹ 0 ; б) m(x) = 0.
Рассмотрим основные теоретические кривые распределения. Наиболее часто в исследованиях применяют закон нормального распределения (рис. 4.13), уравнение которого при m(x)¹0 имеет вид:
|
|
|
|
é |
- |
(x-m(x))2 ù |
|
||
|
|
1 |
ê |
|
ú |
|
|||
|
|
2s2 |
|
||||||
|
|
ê |
|
ú |
|
||||
f (x)= |
|
|
|
|
eë |
|
|
û. |
(4.60) |
|
|
|
|
|
|
||||
s |
|
2p |
|
|
|||||
|
|
|
|
|
|
|
|
||
Если совместить ось координат с точкой m, т.е. принять m(x)=0 и
принять σ 2 = 1 , закон нормального распределения будет описываться более простым уравнением:
|
|
1 |
|
-x2 |
|
|
f (x)= |
|
|
e 2 . |
(4.61) |
||
|
|
|
||||
2p |
||||||
|
|
|
|
|
Для оценки рассеяния обычно пользуются величиной σ . Чем меньше σ, тем меньше рассеяние, т.е. наблюдения мало отличается друг от друга. С увеличением σ рассеяние возрастает, вероятность по-
грешностей увеличивается, а максимум кривой |
(ордината), |
равный |
|||||
1 |
|
, уменьшается. Поэтому значение у=1/ s |
|
|
|
||
|
2p при σ = 1 назы- |
||||||
|
s |
|
|
||||
2p |
|||||||
вают мерой точности. Среднеквадратичные отклонения (+σ ) |
и (-σ ) |
||||||
105 |
|
|
|
||||
Методы теоретических исследований
соответствуют точкам перегиба (заштрихованная область на рис. 4.12) кривой распределения.
f(x) |
|
|
|
|
|
|
m=1 |
|
|
|
|
0,4 |
|
|
|
|
|
|
|
m=2 |
|
|
|
0,2 |
|
|
|
m=5 |
|
|
|
|
|
|
|
0 |
2 |
4 |
6 |
8 |
x |
Рисунок 4.14 – Общий вид |
|
||||
кривой распределения Пуассона |
|||||
При анализе многих случайных дискретных процессов используют распределение Пуассона (краткосрочные события, протекающие в единицу времени). Вероятность появления чисел редких событий х =1, 2, … за данный отрезок времени выражается законом Пуассона (см.
рис. 4.14):
|
mx |
- |
|
(λ×t)x - × |
|
|
||
f (x)= |
|
e |
m = |
|
e λ |
t , |
(4.62) |
|
x! |
x! |
|||||||
|
|
|
|
|
|
|||
где х – число событий за данный отрезок времени t;
λ– плотность, т.е. среднее число событий за единицу времени;
λ×t = m – среднее число событий за время t;
Для закона Пуассона дисперсия равна математическому ожиданию числа наступления событий за время t , т.е. σ 2 =m .
Для исследования количественных характеристик некоторых процессов (времени отказов машин и т.д.) применяют показательный закон распределения (рис. 4.15), плотность распределения которого выражается зависимостью
f (x) = λ ×e−λx , (4.63)
где λ – интенсивность (среднее число) событий в единицу времени.
Основы научных исследований |
|
|
|
|
|
|
|
|
|
||||
|
В показательном распределении интенсивность λ является величи- |
||||||||||||
ной, обратной математическому ожиданию λ= 1/m(x). Кроме того, справед- |
|||||||||||||
ливо соотношение σ 2 = [m(x)]2 . |
|
|
|
|
|
|
|
|
|
||||
f(x) |
|
|
|
|
|
|
|
В |
различных |
облас- |
|||
|
|
|
|
|
тях |
исследований |
широко |
||||||
|
|
n=3 |
|
|
|
||||||||
|
|
|
|
|
применяется |
закон |
распре- |
||||||
0,4 |
|
μ=5 |
|
|
|
||||||||
|
|
|
|
деления |
|
|
|
Вейбулла |
|||||
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
(рис. 4.16): |
|
|
|
|
|||
0,2 |
|
|
n=2 |
|
|
f (x)=n×μn×xn-1×e-μn×xn |
, (4.64) |
||||||
|
|
|
μ=3 |
|
|
где n, |
μ, – параметры зако- |
||||||
|
|
|
|
|
|
||||||||
0 |
0,2 |
0,4 |
0,6 |
0,8 |
x |
на; х – аргумент, чаще всего |
|||||||
время. |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|||
Рисунок 4.16– Общий вид кривой |
|
|
|
Исследуя |
процессы, |
||||||||
|
|
распределения Вейбулла |
связанные |
с |
постепенным |
||||||||
|
|
|
|
|
|
снижением |
|
|
параметров |
||||
|
|
|
|
|
|
(снижением прочности по- |
|||||||
f(x) |
|
|
|
|
|
род во времени и т.д.), при- |
|||||||
|
|
|
|
|
меняют |
|
закон |
гамма- |
|||||
|
2 |
|
|
|
|
|
|||||||
|
|
|
|
|
распределения (рис. 4.17): |
||||||||
|
|
|
|
|
|
||||||||
0,4 |
|
|
|
|
|
|
|
|
λα |
|
|
|
|
|
|
1 |
|
|
|
f (x) = |
α! xα -1e-λx , |
(4.65) |
|||||
|
|
|
|
|
где λ, α – параметры. Если |
||||||||
0,2 |
|
|
|
|
|
||||||||
|
|
|
|
|
α=1, |
|
гамма |
функции пре- |
|||||
|
|
3 |
|
|
|
|
|||||||
|
|
|
|
|
вращается в показательный |
||||||||
|
|
|
|
|
|
||||||||
0 |
1 |
2 |
3 |
4 |
x |
закон. |
|
|
|
|
|
|
|
|
|
Кроме |
приведенных |
||||||||||
Рисунок 4.17– Общий вид кривых |
|
|
|
||||||||||
|
выше законов применяют и |
||||||||||||
гамма-распределения: 1 – a=1; λ=0,5; |
другие виды распределений: |
||||||||||||
2– a=2; λ =3; 3– a=5; λ =2 |
|
|
|||||||||||
|
|
Пирсона, Рэлея, бета – рас- |
|||||||||||
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
пределение и пр. |
|
|
|||||
|
Дисперсионный анализ. В исследованиях часто возникает во- |
||||||||||||
прос: В какой мере влияет тот или иной случайный фактор на иссле- |
|||||||||||||
дуемый процесс? Методы установления основных факторов и их влия- |
|||||||||||||
|
|
|
|
107 |
|
|
|
|
|
|
|
|
|
Методы теоретических исследований
ние на исследуемый процесс рассматриваются в специальном разделе теории вероятностей и математической статистике – дисперсионном анализе. Различают одно – и многофакторный анализ. Дисперсионный анализ основывается на использовании нормального закона распределения и на гипотезе, что центры нормальных распределений случайных величин равны. Следовательно, все измерения можно рассматривать как выборку из одной и той же нормальной совокупности.
Теория надежности: Методы теории вероятностей и математической статистики часто применяют в теории надежности, которая широко используется в различных отраслях науки и техники. Под надежностью понимают свойство объекта выполнять заданные функции (сохранять установленные эксплуатационные показатели) в течение требуемого периода времени. В теории надежности отказа рассматриваются как случайные события. Для количественного описания отказов применяют математические модели – функции распределения интервалов времени (нормальное и экспоненциальное распределение, Вейбулла, гамма-распределения). Задача состоит в нахождении вероятностей различных показателей.
Метод Монте-Карло. Для исследования сложных процессов вероятностного характера применяют метод Монте-Карло.С помощью этого метода решают задачи по нахождению наилучшего решения из множества рассматриваемых вариантов.
Метод Монте-Карло иначе еще называют методом статистического моделирования. Это численный метод, он основан на использовании случайных чисел, моделирующих вероятностные процессы. Математической основой метода является закон больших чисел, который формулируется следующим образом: при большом числе статистических испытаний вероятность того, что среднеарифметическое значение случайной величины стремится к ее математическому ожиданию, равна 1:
ì |
|
å |
x |
|
|
ü |
|
|
|
|
|||||
ï |
|
-m(x) |
|
ï |
(4.64) |
||
limPí |
|
|
|
<eý®1, |
|||
ï |
|
n |
|
|
|
ï |
|
î |
|
|
|
|
|
þ |
|
|
|
|
|
|
где ε – любое малое положительное число.
Последовательность решения задач методом Монте-Карло:
108
Основы научных исследований
–сбор, обработка и анализ статистических наблюдений;
–отбор главных и отбрасывание второстепенных факторов и составление математической модели;
–составление алгоритмов и решению задач на ЭВМ.
Для решения задач методом Монте-Карло необходимо иметь статистический ряд, знать закон его распределения, среднее значение
x , математическое ожидание m(x) и среднеквадратичное отклонение. Решение эффективно лишь с использованием ЭВМ.
4.6. Методы системного анализа
Системный анализ – это комплекс приемов и методов изучения сложных систем, представляющих собой совокупность взаимодействующих элементов, характеризующихся прямыми и обратными связями. Суть системного анализа и состоит в выявлении этих связей и установлении их влияния на систему в целом. С использованием системного подхода изучается развитие сложных систем, таких как экономика отрасли, шахтостроительного управления и пр. Наиболее полно можно выполнить системный анализ с использованием научных положений кибернетики.
Системный анализ складывается из четырех этапов:
–постановка задачи (определяют объект, цели и задачи исследования);
–установление границ изучаемой системы и определение ее структуры (все объекты и процессы, имеющие отношение к поставленной цели, разбиваются на внешнюю среду и собственно изучаемую систему (замкнутую или открытую), затем выделяются части системы (элементы) и устанавливается взаимодействие между ними и внешней средой;
–составление математической модели системы (описывают выделенные элементы системы и процессы взаимодействия с помощью тех или иных параметров; математический аппарат использует в зависимости от особенностей процессов (непрерывные и дискретные, детерминированные и вероятностные);
109
Методы теоретических исследований
– анализ системы (анализируют математическую модель, находят ее экстремальные условия, оптимизируют процессы и систему, формулируют выводы).
Наиболее ответственный момент – оптимизация, которая заключается в нахождении оптимума рассматриваемой функции и соответственно оптимальных условий поведения данной системы. Оптимизацию производят по критерию. Известны различные математические методы оптимизации исследуемых моделей (аналитические, градиентные, математическое программирование, вероятностно-статистиче- ские, автоматические).
Оптимизация систем аналитическими методами состоит в том, что необходимо определить экспериментальное (минимальное или максимальное) значение некоторой функции ϕ(x1, x2 , ...,xn ) в опреде-
ленной области S значений параметров x1, x2 , ...,xn . Аналитические методы для оптимизации сложных процессов используют редко.
Чаще применяют метод градиентного (наискорейшего) спуска и подъема. Допустим, что необходимо найти экстремум целевой функ-
ции |
f (x1, x2 ), описывающей некоторую поверхность (рис. 4.18). |
||||
x2 |
|
|
Нахождение |
экстремума |
|
90 |
|
начинают с любой точки А0 (х01, |
|||
|
80 |
|
х02). Определяют наиболее крутое |
||
|
Aопт |
|
|||
|
A1 |
70 |
направление, которое называют |
||
|
ciдi |
|
|||
|
|
|
|
|
→ |
|
c0д0 |
|
градиентом и обозначают g . По |
||
0 |
A0 |
x1 |
направлению градиента начинают |
||
|
движение и оптимуму с шагом |
||||
|
|
|
|||
|
Рисунок 4.18 – Схема |
|
→ |
постоянная |
величина, |
движения к оптимуму |
|
cg , с – |
|||
|
зависящая |
от точности измере- |
|||
|
|
|
|||
ния. В результате получаем новую точку А1 (х11, х22), в которой снова повторяют процедуру до тех пор, пока не достигнут экстремума.
Если целевая функция f и граничные уравнения являются линейными, то для нахождения экстремума чаще всего применяют ме-
110
