Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационные системы менеджмента - Бажин И.И

..pdf
Скачиваний:
168
Добавлен:
24.05.2014
Размер:
12.28 Mб
Скачать

Глава 4. Стохастические модели управления

201

4.1.3. ФОРМУЛА БАЙЕСА

Формулу Байеса можно записать на основании приведенного выше правила умножения вероятностей

Р(АВ) = Р(А) х Р(В/А) или Р(АВ) = Р(В) х Р(А/В),

откуда

Р(А/В) = Р(АВ)/ Р(В)

Это и есть формула Байеса.

Вероятность Р(А) рассчитывается до проведения опыта, поэтому носит тео­ ретический, в определенной мере предварительный характер. Вероятность Р(А/В) основывается на данных уже проведенного эксперимента, и в этом смыс­ ле более точна с практической точки зрения.

Пример. В центральную бухгалтерию корпорации поступили пачки накладных для проверки и обработки. 90% пачек были признаны удовлетворительными: они содержали только 1% неправильно оформленных накладных. Остальные 10% пачек накладных были признаны неудовлетворительными, так как содер­ жали 5% неправильно оформленных накладных.

1.Какова вероятность того, что следующая партия поступивших накладных бу­ дет признана неудовлетворительной?

2.Взятая наугад из пачки накладная оказалась оформленной неправильно. Учитывая это, какова вероятность того, что вся пачка накладных будет при­ знана не соответствующей стандартам?

3.Вторая, взятая наугад накладная тоже была неправильно оформленной. Приняв во внимание оба факта, определить вероятность, что вся пачка на­ кладных окажется неудовлетворительной.

Ввиду объемности каждой пачки накладных будем считать, что вероятность по­ явления неправильной накладной существенно не изменится.

1.Без дополнительной информации, на основании данных прошлых экспери­ ментов, вероятность того, что пачка накладных будет признана недействи­ тельной, равна 0,1.

2.Полная вероятность Р(В) обнаружения неправильной накладной (как в удов­ летворительных, так и в неудовлетворительных пачках) равна

Р(В) = 0,009 + 0,005 = 0,014

Вероятность Р(А/В) признания пачки накладных неудовлетворительной по­ сле обнаружения первой неправильно оформленной накладной вычисляется с использованием формулы Байеса. При этом вероятность события А - пачка дефектна и накладная неправильна - определяется как произведение вероят­ ностей того, что пачка дефектна (0,1) и накладная в ней неправильна (0,05).

Тогда по формуле Байеса

202

Часть 1. Новые принципы работы

Р(А/В) = Р(АВ)/Р(В) = 0,005/0,014 = 0,357

3. Вероятность Р(В) того, что первые две накладные неправильны, равна (читателю предлагается с помощью "дерева вероятностей" проверить правиль­ ность приведенных ниже чисел):

Р(В) = 0,00009 + 0,00025 = 0,00034

Вероятность Р(АВ) того, что и пачка накладных дефектна и две накладные не­ правильны, определяется с использованием правила умножения вероятностей

Р(АВ) = 0,1x0,05x0,05 = 0,00025

Тогда по формуле Байеса

Р(А/В) = Р(АВ)/Р(В) = 0,00025/0,00034 = 0,735

Итак, если, по предварительным данным, вероятность того, что пачка на­ кладных будет неудовлетворительна, составила 0,1, то после первого экспери­ мента она составила 0,36, после второго - 0,74.

4.1.4. МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ

Рассмотрим теперь только те эксперименты, результаты которых имеют численное значение. Например, бросив монету 10 раз, зафиксируем выпавшее число "решек".

При многократном повторении эксперимента можно вычислить среднее зна­ чение величины. Среднее значение случайной величины (полученное при неог­ раниченно большом числе опытов) называется математическим ожиданием М(х) случайной величины х. Математическое ожидание определяется как сумма произведений всех возможных значений случайной величины на вероятности появлений этих значений, то есть

М(х) = Zpx

Здесь суммирование осуществляется по всем возможным значениям случайной величины х.

Пример 1. Стандартная монета брошена 4 раза. Каково ожидаемое число (математическое ожидание) "решек"?

Возможны 16 исходов: рррр, ррро, ррор, рорр, oppp, ppoo, poop, oopp,

орор, роро, орро, рооо, ороо, ооро, ооор, оооо.

Вероятность каждого из исходов равна 1/16. Поэтому

Глава 4. Стохастические модели управления

203

Р(0 "решек" за 4 броска) = 1/16 Р(1 "решка" за 4 броска) = 4/16 Р(2 "решки" за 4 броска) = 6/16 Р(3 "решки" за 4 броска) = 4/16 Р(4 "решки" за 4 броска) = 1/16

Легко убедиться, что вероятность полной группы событий равна 16/16 = 1.

Следовательно, математическое ожидание числа "решек" за 4 броска равно:

М(х) = £рх = 0x1/16 + 1x4/16 + 2x6/16 + 3x4/16 +4x1/16 = 2,

то есть ожидаемое количество "решек" при четырех бросках равно 2.

Пример 2. Вероятность того, что игрок выиграет 1000 долларов, составляет 0,1. Вероятность выигрыша 500 долларов равна 0,2. В случае проигрыша игроку не­ обходимо будет уплатить 300 долларов. Какова ожидаемая прибыль от игры?

Вероятность проигрыша = 1 - Р(выигрыш) = 1 - (0,1 + 0,2) = 1 - 0,3 = 0,7

Ожидаемая прибыль (математическое ожидание прибыли) такова:

М(х) = Zpx = 0,1x1000 + 0,2x500 + 0,7х(-300) = - 10 долл. за игру.

Таков средний размер убытка за одну игру, если играется множество игр при идентичных условиях. В каждой отдельной игре игрок может выиграть 1000, 500 долларов или проиграть 300 долларов, но при большом количестве игр убыток составит 10 долларов в расчете на одну игру.

4.2.ВЕРОЯТНОСТНЫЕ РАСПРЕДЕЛЕНИЯ

Впредыдущем разделе были рассмотрены эксперименты со случайным ис­ ходом. Для численного вы'ражения возможности появления того или иного исхо­ да используется понятие вероятности. Вероятность сложных событий была по­ лучена путем обобщения вероятностей отдельных исходов.

Теперь рассмотрим вероятностные распределения сначала дискретных, а затем и непрерывных случайных величин. Дискретные случайные величины представляют собой целочисленные значения исходов, непрерывные - любые возможные значения. Основные виды вероятностных распределений дискрет­ ных величин - биномиальное и распределение Пуассона. Они особенно час­ то используются в аудиторском деле. Например, при аудиторской проверке бу­ хучета может строиться распределение счетов по доле ошибок.

Для непрерывных случайных величин также существует несколько видов вероятностных распределений, среди которых наиболее часто используется

204

Часть 1. Новые принципы работы

нормальное распределение. Особенно важную роль нормальное распределе­ ние играет при рассмотрении средних значений случайных величин.

Часто расчеты биномиального и пуассоновского распределений отнимают много времени, поэтому используются их приближения, что позволяет упростить расчеты, почти не снижая точности.

4.2.1.ВЕРОЯТНОСТНЫЕ РАСПРЕДЕЛЕНИЯ ДИСКРЕТНОЙ

СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Если значения исходов эксперимента целочисленны, то они представляют собой дискретные величины. Обычно случайную величину обозначают буквой R, а ее значение - г.

Рассмотрим пример с проверкой 10 накладных. Существует 11 исходов экс­

периментов, которые помещены в таблицу ниже

 

 

 

 

 

 

 

Номер исхода

1

2

3

4

5

6

7

8

9

10

11

Число правильных

0

1

2

3

4

5

6

7

8

9

10

накладных

Число неправильных

10

9

8

7

6

5

4

3

2

1

0

накладных

Число правильных накладных представляет собой дискретную случайную величину. Когда мы собираемся произвести эксперимент, заранее неизвестно, какой исход из одиннадцати возможных будет иметь место, однако можно про­ считать вероятность каждого из них.

Если принять за R эксперимент, состоящий из дискретных случайных вели­ чин R, то набор вероятностей, соответствующих каждому из исходов экспери­ ментов (определенному значению г величины R), будет называться вероятност­ ным распределением величины R. Вероятность того, что дискретная случайная величина примет какое-то значение г, обозначается так: P(R=r).

Пример. Эксперимент: дважды бросаем монету и регистрируем число "решек". Возможные исходы: [ОО, РО, OP, PP].

Значения дискретной случайной величины: г = 0, 1, 2 Вероятности: P(R=r) = [1/4, 2/4, 1/4].

В приведенном примере вероятностное распределение представлено спи­ ском вероятностей, что достаточно неудобно при больших экспериментах. В связи с этим каждый раз, когда это возможно, распределение вероятностей дис­ кретной случайной величины выражается математической функцией f(r), где

P(R=r) = f(r).

Глава 4. Стохастические модели управления

205

Биномиальное распределение

Биномиальное распределение описывает вероятность появления интере­ сующего нас события ("успеха") для эксперимента, отвечающего следующим важными характеристикам:

1.Условия проведения опытов в эксперименте абсолютно идентичны.

2.Результаты опытов друг от друга не зависят.

3.Для каждого опыта возможны два исхода - "успех" или "неудача".

4.Для каждого опыта вероятность "успеха" одинакова.

При соблюдении этих условий в любом эксперименте, где для п идентич­ ных, независимых опытов с двумя возможными исходами ("успех" и "неудача") вероятность успеха одна и та же, вероятность г "успехов" в п опытах равна:

Р(Г) = r!(n"-r)!prq'W

r = °> 1, 2, , . . ., п,

(4.1)

где р - вероятность "успеха" в очередном опыте; q - вероятность "неудачи" (р + q = 1).

Пример. Вероятность поломки одного из пяти работающих независимо друг от друга станков равна 0,2. Если происходит поломка, станок до конца дня не рабо­ тает. Какова вероятность, что 0, 1, 2, 3, 4, 5 станков сломаются в течение дня?

В данном примере присутствуют все условия биномиального распределе­

ния:

1.Пять станков представляют собой пять идентичных опытов.

2.Станки работают независимо друг от друга.

3.Возможны два исхода для каждого из станков - или он ломается или нет.

4.Вероятность поломки одинакова и составляет 0,2.

Вследствие этого можно применить формулу биномиального распределения (4.1), описывающую вероятность поломки ровно г станков. Следует при этом учесть, что вероятность бесперебойной работы q = 1 - 0,2 = 0,8.

Тогда интересующие-нас вероятности в соответствии с (4.1) вычисляются

так

Р(г) = C;s (0,2)г(0,8)5"г, г = 0, 1, 2, .... 5,

(4.2)

г г

5!

где С= = —7TZ — - число сочетании из пяти элементов по г, выражающее

г 1(5 - г ) !

число возможных вариантов появления каждого конкретного события (поломки в точности определенного числа станков).

Результаты расчетов по формуле (4.2) сведены в таблицу (4.1), содержа­ щую полный набор данных по интересующим нас исходам эксперимента.

206

Часть 1. Новые принципы работы

Таблица .4.1. Вероятность поломки станков в течение дня.

Число станков

Число вариантов

Вероятность

 

 

появления

 

 

 

сломав­

не сломав­

С-

Р(г сломавшихся стан­

шихся г

шихся (5-г)

ков в день)

 

0

5

5!/0!/(5-0)! = 1

1х(0,2)°х(0,8)5

=

0,3277

1

4

5!/1!/(5-1)!=5

5х(0,2)1х(0,8)4

= 0,4096

2

3

5!/2!/(5-2)! = 10

10х(0,2)2х(0,8)3 = 0,2048

3

2

5!/3!/(5-3)! = 10

10х(0,2)3х(0,8)2 = 0,0512

4

1

5!/4!/(5-4)! = 5

5х(0,2)4х(0,8)1

=

0,0064

5

0

5!/5!/(5-5)! = 1

1х(0,2)5х(0,8)° =

0,0003

 

 

Всего

 

 

1,0000

Дискретное вероятностное распределение Р(г) для всех г можно проиллюстри­ ровать графиком (рис.4.2)

P(r)i к 0,5 -

0,4 -

0 , 3 -

0,2 _

0 , 1 -

i

2

1

1

1 *" '

0

3

4

5

2

Рис.4 2.

Для случайной величины с биноминальным распределением вероятностей ма­ тематическое ожидание вычисляется по формуле

M(r) = SrP(r) = np,

(4.3)

где п - число опытов, р - вероятность успеха в каждом из них, Р(г) -

биноми­

альная вероятность.

 

Глава 4. Стохастические модели управления

207

Вариация вероятностного распределения может быть измерена при помощи

среднего квадратичного отклонения (стандартного отклонения) или диспер­ сии дискретной случайной величины. Дисперсия а2 связана с математическим ожиданием следующим соотношением

а2 = Ir'Pfr) - (М(г))2

(4.4)

Среднее квадратичное отклонение а (или стандартное отклонение) вычис­ ляется как корень квадратный из дисперсии, то есть

а = VZ"r2 P(r)-(M(r))T

(4.5) '

Для случайной величины с биномиальным распределением вероятностей стандартное отклонение вычисляется следующим образом

а = Jnpq

(4-6)

и, следовательно, дисперсия определится так

ст2 = npq,

(4.7)

где q - вероятность "неудачи" в любом из опытов.

Распределение Пуассона

Распределение Пуассона можно представить следующим образом. Напри­ мер, регистрируется количество дорожных происшествий за неделю на опреде­ ленном участке дороги. Это число представляет собой случайную величину, ко­ торая может принимать значения: 0, 1, 2, 3, ... (верхнего предела нет). Число дорожных происшествий может быть каким угодно большим. Если рассмотреть какой-либо короткий временной промежуток в течение недели, скажем, минуту, то происшествие либо произойдет на его протяжении, либо нет. Вероятность дорожного происшествия в течение отдельно взятой минуты очень мала, и при­ мерно такая же она для всех минут.

Распределение вероятностей Пуассона может быть использовано не только со случайными величинами на временных интервалах, но и, например, при уче­ те дефектов дорожного покрытия на километр пути или опечаток на страницу текста - в общем случае в тех ситуациях, которые могут быть охарактеризованы следующими особенностями:

1.Каждый малый интервал времени (или пространства) может рассматри­ ваться как опыт, результатом которого является одно из двух: либо про­ исшествие имеет место ("успех"), либо оно отсутствует ("неудача"). Ин-

208

Часть 1. Новые принципы работы

тервалы столь малы, что может быть только один "успех" в одном интер­ вале, вероятность которого мала и неизменна.

2.Число "успехов" в одном большом интервале не зависит от их числа в другом, то есть "успехи" беспорядочно разбросаны по рассматриваемым промежуткам (времени или пространства).

3.Среднее число "успехов" постоянно на всем протяжении времени (или пространства).

Общая формула распределения вероятностей Пуассона (г "успехов" на за­ данном интервале) имеет вид

тгет

. г = 0, 1,2,3

(4.8)

Р{г)=-ш^Г-

где m - среднее число успехов на заданном интервале, е -

основание нату­

рального логарифма (е = 2,718...).

 

 

В таблицах распределения вероятностей Пуассона значения Р(г) табулиро­ ваны для определенных значений m и г.

Пример. В среднем на телефонной станции заказывают три телефонных разго­ вора в течение пяти минут. Какова вероятность, что будет заказано 0, 1, 2, 3, 4 или более четырех разговоров в течение пяти минут?

Для решения можно применить распределение вероятностей Пуассона, так

как:

1.Существует неограниченное количество опытов, то есть маленьких от­ резков времени, когда может появиться заказ на телефонный разговор, вероятность чего мала и постоянна.

2.Считается, что спрос на телефонные разговоры беспорядочно распре­ делен во времени.

3.Считается, что среднее число телефонных разговоров в любом 5- минутном отрезке времени одинаково.

Вэтом примере среднее число заказов равно 3 за 5 минут. Отсюда распре­ деление Пуассона:

Зге~3 Р(г заказов за 5 минут) = ———, г = 0, 1, 2, 3,

г!

Тогда

з°е_3

Р(0 заказов за 5 минут) = Р(0) = —^гу— = 1/1x0,0498 = 0,0498;

Р(1 заказа за 5 минут) = Р(1) =

3 V

3

,

= = 3/1хР(0) = 3/1x0,0498 = 0,1494;

Р(2 заказа за 5 минут) = Р(2) =

3 V

3

 

= 3/2хР(1) = 3/2x0,1494 = 0,2240;

it

Глава 4. Стохастические модели управления

209

Р(3 заказа за 5 минут) = Р(3) =

,

= 3/ЗхР(2) = 3/3x0,2240= 0,2240;

Р(4 заказа за 5 минут) = Р(4) =

34е"3

 

 

^-fj—

= 3/4хР(3) = 3/4x0,2240= 0,1680;

Р(более 4 заказов за 5 минут)

Р(3) = {Р(5) + Р(6) + Р(7) + Р(8) + . . . }

=

 

1 - {Р(0) + Р(1) + Р(2) + Р(3) +Р(4)} =

 

1 - {0,0498 + 0,1494 + 0,2240 + 0,2240 + 0,1680} =

1 -0,8152 = 0,1848.

При распределении Пуассона, зная среднее число "успехов" на 5-минутном промежутке, можно легко определить г - среднее число "успехов" за один час простым умножением на 12. В нашем примере это среднее число заказов в час составит 3x12 = 36. Аналогично, если требуется определить среднее число за­ казов в минуту, то это составит 3/5 = 0,6.

Математическое ожидание (или среднее число "успехов" на каком-то интер­ вале) определяется по данным каждой конкретной ситуации. Если же найдено математическое ожидание, то и дисперсия известна, так как одно из свойств распределения вероятностей Пуассона состоит в следующем:

М(г) = а2

(4.9)

Отсюда известно и стандартное отклонение

а = VM(r)

(4.10)

4.2.2.РАСПРЕДЕЛЕНИЕ НЕПРЕРЫВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Если в ходе эксперимента все значения случайной величины оказываются на определенном замкнутом участке и могут принимать в нем любые значения, то, значит, мы имеем дело с непрерывной случайной величиной. Непрерыв­ ная случайная величина имеет и специфику в распределении вероятностей.

Например, если измерить объемы производимых заводом пластмассовых бутылок для сока, которые должны быть равны 200 мл, то полученные цифры попадут в какой-то определенный интервал, допустим, от 190 до 210 мл. В дан­ ном случае непрерывная случайная величина будет иметь неограниченное мно­ жество значений в этих пределах. Предположим, мы имеем непрерывную слу­ чайную величину X, которая принимает любое значение х в интервале x-i и х2, для которого функция вероятности является непрерывной. В этом случае функ­ цию распределения вероятности называют плотностью вероятности f(x) на отрезке х^ < х < х2. График функции распределения непрерывной случайной ве-

210

Часть 1. Новые принципы работы

 

 

 

 

 

личины - плотности вероятности -

f(x)

 

 

представляет собой не дискретную

А к

 

 

линейную диаграмму, как для рас­

1,5-

 

 

пределения дискретной

случайной

 

 

 

величины (см. рис.4.2), а непре­

 

 

 

рывную

кривую. Так,

например,

1,0 -

 

 

для функции распределения f(x) =

 

 

6х(1-х) на отрезке 0 < х < 1 график

 

 

 

 

 

 

функции

плотности

вероятности

0 , 5 -

 

 

имеет вид кривой, представленной

 

 

на рис.4.3.

 

 

 

 

 

Есть еще важное отличие рас­

 

 

 

пределений для дискретной и не­

 

I

*

прерывной случайных

величин.

0,25

Любому значению дискретной слу­

0,5

 

чайной

величины

соответствует

 

Рис.4.3

 

 

 

определенная вероятность. Оче­

видно, что это невозможно для не­ прерывной случайной величины, где вероятность, соответствующая любому конкретному значения х, равна нулю, поскольку множество значений непрерыв­ ной случайной величины бесконечно и несчетно. Это важно понять и прочувст­ вовать - например, вероятность того, что объем взятой наугад пластмассовой бутылки составляет в точности 195 мл, равна нулю. Здесь можно говорить о не­ нулевой вероятности лишь для некоторой области значений непрерывной слу­ чайной величины. Например, какова вероятность того, что объем взятой наугад пластмассовой бутылки находится в переделах от 195 до 197 мл? Такая поста­ новка вопроса правильна.

Графически вероятность представляет собой площадь под кривой функции плотности вероятности, ограниченная интересующими нас пределами значений переменной. Так, например, на рис.4.13 заштрихованная площадь соответствует значению вероятности того, что выбранная наугад величина X лежит в пределах значений от 0,25 до 0,5. Общая площадь под кривой плотности вероятности со­ ответствует полной группе событий, а, значит, вероятности, равной 1.

Равномерное распределение

Равномерное распределение - простейший пример распределения непре­ рывной случайной величины. Проиллюстрируем это на примере.

Пример. Два бухгалтера ездят на работу, у первого дорога отнимает 20-25 мин., у второго - 20-30 мин. Любое время на дорогу в этих пределах равновероятно. В таком случае плотность вероятности имеет постоянное значение в исследуе­ мом диапазоне случайной величины. Ниже приведены графики функций плотно­ стей вероятностей для обоих случаев (рис.4.4 и 4.5).

Соседние файлы в предмете Экономика