Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
монография ОНИ.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
14.16 Mб
Скачать

5 Вероятностно-статистические методы

ИССЛЕДОВАНИЙ

В научных исследованиях рассматриваются не только детерминированные, но и случайные вероятностные (стохастические) процессы.

В горном деле (производстве) процессы выполняются в условиях непрерывно меняющейся обстановки (переброска бригад на объекты, вынужденные простои машин, перебои с поставками материалов, неравномерная работа транспорта, непрерывное изменение микроклиматических факторов и т.д.). Те или иные события могут произойти или не произойти. В связи с этим приходится анализировать случайные, вероятностные или стохастические связи, в которых каждому аргументу соответствует множество значений функции. Наблюдения показали, что несмотря на случайный характер связи, рассеивание имеет вполне определенные закономерности. Для таких статистических законов теория вероятностей позволяет предсказать исход не одного какого-либо события, а средний результат случайных событий и тем точнее, чем больше число анализируемых явлений. Несмотря на случайный характер событий, они подчиняются определенным закономерностям, рассматриваемым в теории вероятностей.

Теория вероятностей является математическим отражением законов, изучает случайные события и базируется на следующих основных показателях.

Под совокупностью понимают множество однородных событий. Совокупность случайной величины Х составляет первичный статистический материал. Совокупность, содержащая самые различные варианты массового явления, называют генеральной совокупностью или большой выборкой N. Обычно изучают лишь часть генеральной совокупности, называемой выборочной совокупностью или малой выборкой N1.

Вероятностью Р(х) события Х называют отношение числа случаев N(x), которые приводят к наступлению события Х к общему числу возможных случаев N :

. (41)

Теория вероятностей рассматривает теоретические распределения случайных величин и их характеристики. Математическая статистика занимается способами обработки и анализа эмпирических событий. Эти две родственные науки составляют единую математическую теорию массовых случайных процессов, широко применяемую для анализа научных исследований.

В математической статистике важное значение имеет понятие о частоте события , представляющего собой отношение числа случаев , при которых имело место событие, к общему числу событий п :

. (42)

При неограниченном возрастании числа событий, частота стремится к вероятности .

Допустим, имеются статистические наблюдения за количеством автомобилей , прибывающих ежечасно на склад:

Количество автомоби-лей х1

0

1

2

3

4

5

6

7

8

9

Частота абсолютная у1

2

4

10

14

7

5

4

3

1

0

Частота относительная

0,04

0,08

0,20

0,28

0,14

0,10

0,08

0,06

0,02

А бсолютная частота уi или относительная характеризует вероятность появлений случайной величины. Относительные частоты представляют собой ряд распределения (рис. 8), а плавная кривая – закон (функцию) распределения .

Вероятность случайной величины (события) – это количественная оценка возможности ее появления. Достоверное событие имеет вероятность , невозможное событие – .

Следовательно, для случайного события , а сумма вероятностей всех возможных значений

. (43)

В исследованиях иногда недостаточно знать одну функцию распределения. Необходимо еще иметь ее характеристики: среднеарифметическое, математическое ожидание, дисперсию, размах ряда распределения.

Пусть среди п событий случайная величина х1 повторяется п1 раз, величина х2п2 раза и т.д. Тогда среднеарифметическое значение имеет вид:

. (44)

Размах можно использовать для ориентировочной оценки вариации ряда событий

, (45)

где – максимальное и минимальное значение измеренной величины или погрешности.

Если вместо эмпирических частот принять их вероятности , то получим важную характеристику функции распределения – математическое ожидание:

(46)

Пример: Имеется 5 измерений одной выборки:

Среднее значение .

По формуле (46) математическое ожидание равно

.

Для непрерывных случайных величин математическое ожидание равно

, (47)

т.е. оно равно действительному значению хД наблюдаемых событий.

Таким образом, если систематические погрешности измерений полностью исключены, то истинное значение измеряемой величины равно математическому ожиданию, а соответствующая ему абсцисса называется центром распределения.

Дисперсия характеризует рассеивание случайной величины по отношению к математическому ожиданию и вычисляется с помощью формулы

. (48)

Для рассмотренного выше примера

Важной характеристикой теоретической кривой распределения является среднеквадратичное отклонение или стандарт:

(49)

В данном случае 0,911.

Площадь, расположенная под кривой распределения, соответствует единице вследствие того, что кривая охватывает все значения случайных величин, т.е. все результаты измерений. Для одной и той же площади можно построить большое количество кривых распределения, т.е. они могут иметь различное рассеяние. Мерой рассеяния (точности измерений) является дисперсия или среднеквадратичное отклонение.

Коэффициент вариации

(50)

применяется для сравнения интенсивности рассеяния в различных совокупностях, определяется в относительных единицах, < 1. В нашем случае = 0,30.

Выше были рассмотрены основные характеристики теоретической кривой распределения, которые характеризует теория вероятностей. В статистике оперируют с эмпирическими распределениями. Основной задачей статистики является подбор теоретических кривых по имеющемуся эмпирическому закону распределения.

Пусть в результате п измерений случайной величины получен вариационный ряд Первичная обработка таких рядов сводится к следующему:

группируют в интервалы и устанавливают для каждого из них частоты и ;

по значениям и строят ступенчатую гистограмму частот;

вычисляют характеристики эмпирической кривой распределения.

Основными характеристиками эмпирического распределения является среднеарифметическое значение

(51)

дисперсия

(52)

и среднеквадратичное отклонение

.

Значениям эмпирического распределения соответствуют величины теоретического распределения.

Рассмотрим основные теоретические кривые распределения.

Н аиболее часто в исследованиях применяют закон нормального распределения (рис. 9) . (53)

Это уравнение соответствует функции нормального распределения при .

Если совместить ось ординат с точкой т0, т.е. , и принять , то закон нормального распределения описывается зависимостью (за единицу масштаба принята дисперсия ).

. (54)

Эта формула более проста и чаще применяется при анализе.

Для оценки рассеяния обычно пользуются величиной .

Чем меньше , тем меньше рассеяние т.е. большинство наблюдений мало отличается друг от друга (рис. 10).

С увеличением рассеяние возрастает, вероятность появления больших погрешностей увеличивается, а максимум кривой распределения (ордината), равный , уменьшается. Поэтому величину при или называют мерой точности.

Таким образом, чем меньше , тем больше сходимость результатов измерений, а ряд измерений более точен. Как видно из уравнений (53), (54), среднеквадратичное отклонение определяет закон распределения.

Среднеквадратичное отклонение и соответствует точкам перегиба кривой (заштрихованная площадь на рис. 10). Вероятность того, что случайные события не выйдут за эти пределы, равен 0,683. В общем случае, для предела вероятность того, что событие попадет в данный предел, вычисляется по распределению Лапласа

. (55)

Функция табулирована и используется в исследованиях.

П ри анализе многих случайных дискретных процессов пользуются распределением Пуассона. Например, поток автомобилей, прибывающий на асфальтобетонный завод, поток автомобилей перед светофором и другие краткосрочные события, протекающие в единицу времени.

Вероятность появления числа событий в единицу времени выражается законом Пуассона (рис. 11):

, (56)

где х – число событий за данный отрезок времени t;

– плотность, т.е. среднее число событий за единицу времени;

– среднее число событий за время

Распределение Пуассона относят к редким событиям, т.е. – вероятность того, что событие в период какого-то испытания произойдет х раз при очень большом числе измерений т. Для закона Пуассона дисперсия равна математическому ожиданию числа наступления событий за время , т.е. . Как видно из формулы (56), пуассоновский процесс можно задать двумя параметрами х и т. Табличные значения вероятностей для х от 0 до 25 и т от 0,1 до 18 составляет соответственно от 0,904 до 0,023.

Рассмотрим пример. С помощью наблюдений установлено, что за пять минут на погрузку под экскаватор поступает 6 самосвалов. Какова вероятность поступления 10 автомобилей за 5 минут? В этом случае

х = 10; = 6; .

Как видно, эта вероятность очень мала.

Рассмотрим второй пример. Вероятность возникновения брака составляет 0,02. Какова вероятность того, что в партии из 100 единиц окажется 5 бракованных изделий? имеем 100·0,02=2; х = 5, тогда

0,036, т.е. вероятность очень мала.

Для исследования количественных характеристик некоторых процессов (время обслуживания строительных машин в ремонтных мастерских и автомобилей на станциях технического обслуживания, время отказов машин и изделий, длительность телефонных разговоров между диспетчером и передвижными оперативными пунктами и т.д.) можно применять показательный закон распределения (рис. 12).

П лотность вероятности показательного закона выражается зависимостью

, (57)

где – плотность или интенсивность (среднее число) событий в единицу времени.

В показательном законе плотность является величиной, обратной математическому ожиданию . Кроме того, имеет место соотношение .

В различных областях исследований широко применяется закон распределения Вейбулла (рис. 13).

. (58)

Здесь – параметры закона;

– аргумент, чаще принимаемый как время.

И

Рис. 13. Общий вид кривой распределения Вейбулла

сследуя процессы, связанные с постепенным снижением параметров (ухудшение свойств материалов во времени, деградация конструкций, процессы старения, износовые отказы в машинах и др.), применяют закон гамма-распределения (рис. 14)

, (59)

где – параметры.

Если , гамма-функция превращается в показательный закон (см. рис. 14)

. (60)

При исследовании многих процессов, связанных с анализом климатических и гидрологических воздействий на сооружения, установлении расчетных характеристик грунтов и материалов и т.д. используют закон распределения Пирсона. Из двенадцати типов этого закона чаще всего применяется третий (рис15):

, (61)

где а – максимальная ордината;

– соответственно расстояние от максимальной ординаты до центра распределения и начала координат.

Кроме приведенных выше применяют и другие виды распределений – Рэля, бета-распределения, Шарлье, Гудрича.

В исследованиях всегда возникает вопрос – в какой мере существенно влияет тот или иной фактор или комбинация факторов на исследуемый процесс? Так, при измерении какой либо величины, результаты зависят от многих факторов, но основными являются следующие: техническое состояние прибора и внимание оператора.

Методы установления основных факторов и их влияние на исследуемый процесс рассматриваются в специальном разделе теории вероятностей и математической статистике – дисперсионном анализе. Различают одно- и многофакторный анализ.

Суть однофакторного дисперсионного анализа рассмотрим на примере. Пусть необходимо проверить степень точности группы нивелиров (т приборов) и установить, являются ли их систематические ошибки одинаковыми, т.е. изучить влияние одного фактора-прибора на погрешность измерения. Каждым прибором выполнено п измерений одного и того же объекта. Всего выполнено пт измерений. Обозначим отдельные измерения через ,

где i – номер прибора; j – номер выполненного на этом приборе измерения. Значение i изменяется от 1 до т, j – от 1 до п.

Дисперсионный анализ допускает, что отклонения подчиняются нормальному закону распределения. Вычисляют для каждой серии измерений среднеарифметическое значение и среднее из показаний первого прибора и т.д. для каждого из измерений и приборов. В результате таких расчетов устанавливают и :

; , (62)

где – среднеарифметическое для измерения;

– среднеарифметическое для всех серий измерений (общее среднее значение);

– отдельное i-е измерение на j-м приборе;

Величину Q1 называют суммой квадратов отклонений между измерениями серий. Она показывает степень расхождения в систематических погрешностях всех т приборов, т.е. характеризует рассеивание исследуемого фактора между приборами.

Величину Q2 называют суммой квадратов отклонений внутри серии. Она характеризует остаточное рассеивание случайных погрешностей опыта (одного прибора).

Метод анализа допускает следующую гипотезу: центры нормальных распределений случайных величин равны (или равны с определенной степенью точности), следовательно, все тп измерений можно рассматривать как выборку из одной и той же нормальной совокупности. Вычисляют критерий

. (63)

Нетрудно видеть, что числитель и знаменатель критерия F представляют собой дисперсии для т и п наблюдений.

В зависимости от значений и (числа степеней свободы) и вероятности Р (например, 0,95; 0,99 и др.) составлены табличные значения Fp . Если , то гипотеза удовлетворяется, т.е. в данном примере все приборы имеют одинаковые (допустимые) систематические ошибки. При > гипотеза не удовлетворяется.

Дисперсионный анализ называют многофакторным, если он имеет два и более факторов. Суть его не отличается принципиально от однофакторного, но усложняются выкладки и существенно увеличивается количество расчетов.

Очень часто применяют методы вероятностей и математической статистики в теории надежности, которая в настоящее время широко используется в различных отраслях науки и техники.

Под надежностью понимают свойство изделия (объекта) выполнять заданные функции (сохранять установленные эксплуатационные показатели) в течение требуемого периода времени. Обеспечение надежности, исключение отказов (нарушения работоспособности) продукции стало одной из основных народнохозяйственных задач.

В теории надежности отказы рассматриваются как случайные события. Для количественного описания отказов применяют математические модели – функции распределения вероятностей интервалов времени. Наиболее часто применяют следующие законы: нормального и экспоненциального распределения, Вейбулла, гамма-распределения.

Основной задачей теории надежности является прогнозирование (предсказание с той или иной вероятностью) различных показателей – безотказной работы, долговечности, срока службы и т.д. Она связана с нахождением вероятности.

Для исследования сложных процессов вероятностного характера в последнее время (с 1950 г.) стали применять метод Монте-Карло. С помощью этого метода в настоящее время решают широкий круг задач, в которых ставят цель отыскать наилучшее решение из множества рассматриваемых вариантов: отыскать наилучший вариант размещения баз, складов, предприятий; определить оптимальное количество автомобилей, обслуживающих экскаватор или смеситель; установить наилучшие параметры выпускаемой продукции; уточнить пропускную способность транспортных путей и др.

Метод Монте-Карло, называемый методом статистического моделирования или статистических испытаний, представляет собой численный метод решения сложных задач. Он основан на использовании случайных чисел, моделирующих вероятностные процессы. Результаты решения метода позволяют установить эмпирические зависимости исследуемых процессов. Математической основой метода является закон больших чисел, разработанный П.Л. Чебышевым, который формулируется так: при большом числе статистических испытаний вероятность того, что среднеарифметическое значение случайной величины стремится к ее математическому ожиданию, равна 1, то есть

< , (64)

где – любое малое положительное число.

Из формулы (64) видно, что по мере увеличения числа испытаний п среднеарифметическое неограниченно (асимптотически) приближается к математическому ожиданию.

Последовательность решения задач методом Монте-Карло сводится к следующему:

– сбору, обработки и анализу статистических наблюдений исследуемого процесса;

– отбору главных и отбрасыванию второстепенных факторов и составлению адекватной математической модели (уравнения), графиков, циклограмм и т. д.;

– составлению алгоритмов и решению задачи на ЭВМ.

Для решения задач методом Монте-Карло необходимо иметь статистический ряд, знать закон его распределения, среднее значение и математическое ожидание , среднеквадратичное отклонение. С помощью метода можно получить сколько угодно заданную точность решения, т.е. . При нормальном законе распределения оценить точность результатов, полученных методом Монте-Карло, можно по формуле

< . (65)

Пусть по условию задачи задана допустимая ошибка . Если при имеющемся числе ряда и ошибка окажется больше, чем , то увеличивают число испытаний до и вычисляют новое значение ошибки и т. д., пока не будет соблюдаться условие . Решение задач методом Монте-Карло эффективно лишь с использованием быстродействующих ЭВМ.