Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационные системы менеджмента - Бажин И.И

..pdf
Скачиваний:
168
Добавлен:
24.05.2014
Размер:
12.28 Mб
Скачать

Глава 4. Стохастические модели управления

 

 

 

211

Плотность

Распределение времени в

Для первого бухгалте­

ра: интервал времени

вероятности

пути для 1-го бухгалтера

- 5 мин.,

значит, ши­

f(t)

 

 

 

рина

прямоугольника

 

 

Вся площадь

1/5

 

равна 5, следователь­

 

 

прямоугольника

но,

его

высота

 

 

должна быть равна 1

(плотность

вероятно­

1/10-

 

 

 

сти) должна быть 1/5,

 

 

 

тогда

площадь

под

 

 

 

 

 

 

 

 

прямой

 

(площадь

/I

 

 

 

прямоугольника

равна

1

Г

-*> t

(1/5) х

5

=

1. Анало­

 

гично для второго бух­

20 22 24

26

28

30 Время в пути, мин.

галтера:

 

интервал

 

 

 

 

 

 

Рис.4.4.

 

времени

-

10

мин.,

 

 

следовательно,

плот­

 

 

 

 

ность вероятности -

1/10, тогда 1/10x10 = 1 - полная вероятность

(вероятность

полной группы событий). Теперь мы в состоянии подсчитать вероятность того, что дорога на работу tn занимает у каждого бухгалтера от 20,5 до 22,8 минут. Эта

Плотность

Распределение времени в

вероятности

пути для 2-го бухгалтера

f(t)

А

Вся площадь

1/5

 

прямоугольника

 

должна быть равна 1

1/10-

 

А

• > t

20 22

24 26 28 30 Время в пути, мин.

 

Рис.4.5.

составит:

 

вероятность представляет собой пло­ щадь, ограниченную сверху прямой плот­ ности вероятности, а по бокам - этими дву­ мя пределами.

Для первого бухгалте­ ра эта вероятность составит:

Р(20,5 < tn < 22,8) =

(1/5) х (22,8-20,5) =

1/5 х 2,3 = 0,46

Для второго бухгалте­ ра эта вероятность

Р(20,5 < tn < 22,8) = (1/10) х (22,8-20,5) = 1/10 х 2,3 = 0,23

Нормальное распределение

Нормальное распределение используется в ситуациях, связанных с измере­ ниями веса или объема товаров, роста людей, срока работы электроламп и т.п.

212

Часть 1. Новые принципы работы

Характерные свойства равномерного распределения, рассмотренные выше, от­ носятся также и к нормальному распределению:

1.Площадь, образуемая кривой нормального распределения, представляет со­ бой вероятность того, что непрерывная случайная величина примет значения из заданного интервала.

2.Общая площадь под кривой нормального распределения равна полной веро­ ятности, то есть 1.

3.Вероятность того, что непрерывная случайная величина принимает в точно­ сти какое-то конкретное значение, равна нулю.

Нормальное вероятностное распределение - это распределение, симмет­

ричное относительно среднего значения случайной величины. Теоретически значения случайной величины находятся в интервале от минус до плюс беско­ нечности, то есть непрерывная случайная величина может принимать любые значения, как положительные, так и отрицательные. Однако на практике нор­ мальное распределение обычно используется для случайной величины, значе­ ния которой расположены в ограниченном интервале.

Функция плотности вероятности, зависящая от среднего значения случайной величины m и ее дисперсии а2, для нормального (гауссового) распределения имеет вид

f(x; m, a) =

2ст2

ал/271

Для нормально распределенной величины с произвольными m и а введением нормированной величины у (число стандартных отклонений от среднего значе­ ния)

у = Х - Ш

можно все нормальные распределения свести к единому стандартному вероят­ ностному распределению, которое также является нормальным (гауссовым), но с параметрами т = 0 и а = 1и имеет вид

г

f(y) =

График функции плотности вероятности для стандартного нормального рас­ пределения представлен на рис.4.6. Здесь площадь заштрихованной зоны численно выражает вероятность того, что значение случайной величины у больше у-].

Глава 4. Стохастические модели управления

213

Интегральная функция этого распределения за­

писывается в виде

 

 

F(y) =

dt

 

Для определения значений f(x; m, ст) и F(x; m, о) достаточно располагать таблицами для f(y) и F(y) нормированной случайной величины. Обыч­ но в таких таблицах приводятся значения только для у > О, так как из симметрии нормальной кри­ вой следует, что f(-y) = f(y) и F(-y) = 1 - F(y).

Функцию F(y) можно записать в виде

у if

u

2 d t ,

V271 '

dt +

л/2тс J \

2тг •

где первый интеграл равен 0,5 (так как вероятность полной группы событий рав­ на 1, а указанный интеграл составляет половину площади кривой под графиком плотности вероятности), а второй интеграл является стандартной функцией, на­ зываемой интегралом Лапласа

У Л

0(y)=-7=fe"ydt

V2TI Jn

Вероятность попадания в заданный интервал для нормально распреде­ ленной случайной величины с параметрами m и а определяется соотношением

 

 

• - 1

 

sal

 

 

Р(х1<х<х2) = a^Jln

(x-"0z

dy,

 

la1

dx

 

где у-, = (xi-m)/a, y2 = (x2-m)/cj,

и выражается через интегралы Лапласа сле­

дующим образом

 

 

 

 

 

 

Уг

_f

 

Уг __yz

 

 

Р ( Х 1 < х < х 2 ) = - ^ je

2 d y - - 7 = - J e

2 dy = Ф(у2) - Ф Ы

(4.11)

V271 „

 

у/2%

 

 

 

с учетом приведенных выше значении yi и у2.

Нормальное распределение занимает особое место в теории вероятностей, а нормально распределенные величины широко применяются на практике. Это

214 Часть 1. Новые принципы работы

связано со следующим положением, вытекающим из центральной предель­

ной теоремы А.М.Ляпунова.

Если случайная величина х представляет собой сумму очень большого чис­ ла взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то х распределена по закону, близкому к нормальному.

Такое положение имеется, например, при измерении физических величин, технологических параметров производственных процессов, определении объе­ мов сбыта продукции и т.п. Так как на результат измерения влияет большое ко­ личество различных независимых факторов, то можно полагать, что ошибка из­ мерения имеет нормальное распределение. Этот вывод часто подтверждается на практике.

Пример. Производителю электроламп известно, что средний срок работы элек* тролампы составляет m = 600 час, а стандартное отклонение срока работы а = 40 час. Какова вероятность того, что срок работы лампы х менее 700 часов?

Перейдем к стандартному нормальному распределению, введя нормиро­ ванную величину

у = (x-m)/ a = (700-600)/40 = 2,5

По таблице нормального распределения находим

Р(у > 2,5) = 0,0062

Так как общая вероятность (вероятность полной группы событий) равна 1, то

Р(у < 2,5) = 1 - 0,0062 = 0,9938,

то есть вероятность того, что лампа проработает меньше 700 часов, равна 99,38%. Иными словами, 99,38% ламп проработают 700 часов и меньше.

4.3.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ И ИСПЫТАНИЕ ГИПОТЕЗ

Обратимся теперь к статистическому методу, имеющему важное значение при принятии решений в условиях неопределенности, - выборке.

Термин совокупность обозначает общую группу людей или предметов, с которыми связано статистическое исследование. Совокупность, включающую все единицы, которые составляют объект исследования, обычно называют ге­ неральной совокупностью. Термин выборка обозначает некоторую группу, отобранную из генеральной совокупности. Для обозначения какой-либо характе­ ристики совокупности используют термин параметр, а ту же характеристику вы­ борки называют статистика.

Глава 4. Стохастические модели управления

215

Использование данных, полученных по выборкам, неизбежно приводит нас в область статистического вывода виду того, что возникает необходимость по­ лучить заключение относительно генеральной совокупности по данным выборки. По выборке, отобранной соответствующим образом, можно оценить параметры совокупности, можно использовать выборочные данные для испытания предпо­ ложений относительно характеристик генеральной совокупности.

Статистический вывод является большой и важной областью статистики, в которой рассматривается вся информация, собираемая по выборке, для того, чтобы сделать заключение относительно некоторых характеристик совокупно­ сти. Так, например, аудитор может проверить выборочные данные о сделках компании и, если отобранные документы удовлетворяют всем требованиям, он делает вывод, что документы о всех сделках компании правильно оформлены. Аудитор использует выборку для своего заключения, потому что она дешевле, ее можно быстрее провести и, следовательно, она более практична, нежели проверка всех документов о сделках компании.

Чтобы применить статистические методы анализа, выборка должна быть случайной. Это означает, что каждая единица должна иметь равный шанс по­ пасть в выборку. Существуют разные процедуры, обеспечивающие случайность отбора. Простой случайный отбор является основным. Члены генеральной сово­ купности нумеруются, тем самым создается основа для проведения отбора. Но­ мера выбираются или по таблице случайных чисел, или отбираемые номера оп­ ределяются генератором случайных чисел компьютера. Эти случайные числа используются для идентификации тех единиц, которые попали в выборку.

Если мы произведем все возможные выборки объема п из нормально рас­ пределенной генеральной совокупности и вычислим выборочные статистики для каждой из них, то сможем получить выборочное распределение для этой стати­ стики. Это позволяет увидеть, как выборочная статистика связана с генераль­ ным параметром. Распределение всех выборочных средних, например, для вы­ борки объемом п единиц называется выборочным распределением выбо­

рочных средних.

Все стандартные распределения предполагают, что выборка представляет собой случайную выборку из нормально распределенной генеральной совокуп­ ности, Мы можем обеспечить случайность отбора, но не можем контролировать нормальность распределения генеральной совокупности. Самый простой способ проверки приближения к нормальности состоит в использовании для этой цели выборочных данных. Если графическое изображение выглядит симметрично, то тогда можно предположить соответствие нормальному распределению. Что ка­ сается средней величины, центральная предельная теорема позволяет пользо­ ваться нормальным распределением, если размер выборки равен, по крайней мере, 30-ти единицам и более. Согласно центральной предельной теореме, ес­ ли мы берем достаточно большую выборку из совокупности, независимо от ее распределения, со средней m и стандартным отклонением а, то распределение выборочных средних будет приблизительно нормальным. В общем, при выборке объемом более 30 единиц можно не поднимать вопрос о нормальности распре­ деления генеральной совокупности.

216

Часть 1. Новые принципы работы

Таким образом, выборка может быть использована для оценки параметра генеральной совокупности. При использовании такого подхода необходимо иметь представление о надежности такой оценки. Представление о надежности дает стандартная ошибка. Чем меньше стандартная ошибка, тем меньше дис­ персность выборочного распределения, и, следовательно, менее изменчива вы­ борочная статистика. Лучшим подходом к оценке будет установление интервала значений, в пределах которого, как мы можем быть уверены, лежит параметр генеральной совокупности. Этот предел значений называется доверительным интервалом. Доверительные интервалы могут быть установлены для любого параметра генеральной совокупности. Чаще всего они определяются для сред­ них и относительных величин.

4.3.1.ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ

Если исходная генеральная совокупность нормальная, то выборочное рас­ пределение выборочных средних также будет нормальным. Если генеральная совокупность имеет среднюю величину m и стандартное отклонение а, то выбо­ рочное распределение средних будет иметь среднюю величину М(х) = m и

стандартную ошибку s = и//- • Как было отмечено, данные утверждения спра-

/Vn

ведливы и для ненормальной генеральной совокупности, если объем выборки п не меньше 30.

Если мы отобрали п единиц из генеральной совокупности N и нашли по вы­

борке среднюю величину

х, то эта величина

х может быть использована для

оценки генеральной средней т . Насколько надежна эта оценка?

 

 

 

 

 

f f(X)

 

На рис.4.7

показано

выборочное

95% выборочного

 

распределение

выборочных сре­

 

 

 

 

 

 

 

 

 

 

распределения

 

 

дних. Величины

\ j

и х2

распо­

 

 

 

 

 

 

ложены

симметрично

относи­

 

 

 

тельно

генеральной

средней

ве­

 

 

 

личины. Площадь под кривой, ог­

 

 

 

раниченная

этими

 

пределами,

 

 

 

включает 95% выборочного рас­

2,5%

 

2,5%

пределения. Область

ниже изги­

 

vi

ба кривой до величины Xj вклю­

 

 

 

 

 

 

чает 2,5%, и область ниже изгиба

 

 

• X

кривой

после

величины

х2

-

х,

m

х2

2,5% распределения.

Следова­

 

Рис.4.7

 

тельно, можно сказать, что выбо­

 

 

рочная

совокупность

п

единиц,

 

 

 

взятая из исходной генеральной совокупности, с вероятностью 95% будет иметь среднюю величину, лежащую между х, и х г

Глава 4. Стохастические модели управления

217

Поскольку интервал между х\ и х2 включает 95% распределения, мы мо­ жем определить из таблицы нормального распределения, что х2 соответствует 1,96 стандартных ошибок выше средней т , и х, соответствует 1,96 стандартных ошибок ниже средней m

X j = m - 1,96s; х2 = m + 1,96s

Обычно проводят всего одну выборку из генеральной совокупности; рассчи­ тывают среднее значение выборки х и используют его для вывода о среднем значении m генеральной совокупности, из которой была взята выборка. На 95% мы уверены, что наше единственное значение х лежит между х, и х2 , то тогда m должно находиться где-нибудь в пределе

х ± 1,96s

Можно сказать, что мы уверены в этом на 95%. Следовательно, х + 1,96s явля­ ется доверительным интервалом для среднего значения генеральной совокуп­ ности с вероятностью 95%. Если, например, х точно равно х , , т о т находится

правее точки х г Если х меньше х,, то m не лежит в доверительном интерва­ ле. Это означает, что в этом случае мы выбрали одну из 5% выборочных сово­ купностей, для которой вывод, сделанный выше, неверен. Мы ограничились 95% выборочного распределения. Это был совершенно субъективный выбор. Может быть использован любой размер интервала и любая степень уверенности, что мы в нее попадем в зависимости от того, насколько мы хотим быть уверены, что среднее значение генеральной совокупности лежит внутри указанного интерва­ ла. Типичными являются 90%, 95% или 99% доверительные интервалы. Какую бы величину мы не выбрали, построение доверительного интервала остается тем же. Изменяется лишь величина стандартизованной нормальной перемен­ ной, отвечающей выбранной степени уверенности.

Пример. Импортер упаковывает чай в пакеты по 125 г. Известно, что напол­ няющая машина работает со стандартным отклонением а, равным 10 г. Выборка 50 пакетов (п = 50) показала средний вес х = 128,5 г.

Найти доверительный интервал для среднего веса m в генеральной сово­ купности с вероятностью 95%.

Доверительный интервал с вероятностью 95% для среднего значения гене­ ральной совокупности находится по формуле

х+1,96 о / - ,

(4.12)

/ л/п

 

где 1,96 является числом стандартных ошибок выше и ниже среднего значения для интервала, включающего 95% нормального распределения. Следователь-

218

Часть 1. Новые принципы работы

но, доверительный интервал для генеральной средней находится так

128,5 + 1,96(10/^50) = 128,5 + 2,77 г.

Мы на 95% уверены, что средний вес m пачки чая в генеральной совокупно­ сти находится между 125,73 г и 131,27 г. Интервал в ± 2,77 г составляет пример­ но ± 2% среднего веса пачки в выборке, который равен 128,5 г. Это не очень большое отклонение для данного примера. Следовательно, среднее значение выборки может считаться надежной оценкой среднего значения генеральной со­ вокупности. Однако необходимо помнить, что в 5% случаев мы можем ошибить­ ся и получить значение вне доверительного интервала.

4.3.2. ИСПЫТАНИЕ ГИПОТЕЗ

Для оценки доказательств выборки мы должны формулировать наши гипо­ тезы так, чтобы можно было использовать известное вероятностное распреде­ ление. Такая исходная гипотеза называется нулевой гипотезой и обозначается Н0. Нулевая гипотеза всегда формулируется для утверждения того, что выбо­ рочная статистика согласуется с принятым параметром генеральной совокупно­ сти. Сформулировав нулевую гипотезу, мы исследуем выборку для того, чтобы увидеть, согласуется ли она с этой гипотезой. Заметим, что для обеспечения как можно большей объективности важно, чтобы гипотеза формулировалась до то­ го, как собираются данные. Весь спектр возможных результатов обычно подраз­ деляется на три категории:

1)доказательство согласуется с нулевой гипотезой;

2)доказательство не согласуется с нулевой гипотезой;

3)доказательство является неубедительным, поэтому требуется больше

данных для принятия решения.

Если результат соответствует категории 1,,то решением будет принятие ну­ левой гипотезы как наиболее верной. Предполагается, что различие между ве­ личиной выборочной статистики и параметром генеральной совокупности объ­ ясняется случайной вариацией, свойственной выборочному исследованию.

Если результат соответствует категории 2, то решением будет отклонение нулевой гипотезы, как вероятно неверной. Предполагается, что различие между выбррочной статистикой и параметром генеральной совокупности не объясняет­ ся случайной выборочной вариацией. В этом случае принято применять альтер­ нативную гипотезу. Испытание гипотез не включает доказательство согласова­ ния выборки с альтернативной гипотезой. При применении альтернативной гипо­ тезы мы можем предположить, поскольку нулевая гипотеза оказалась неприем­ лемой, что взамен нулевой гипотезы следует использовать альтернативную ги­ потезу.

Альтернативная гипотеза обычно обозначается Hi. Как и Н0, она должна быть сформулирована в самом начале исследования.

Например, машина изготавливает металлические планки. Она настроена

Глава 4. Стохастические модели управления

219

так, что средняя высота планки равна 5,0 см. Выборка из партии планок показа­ ла среднюю высоту, равную 5,3 см. Вопрос состоит в том, правильно ли все еще настроена машина?

Нулевая гипотеза предполагает, что машина настроена все еще правильно, и выборочная средняя согласуется с выборкой, взятой из нормальной генераль­ ной совокупности со средним значением, равным 5,0. Если при испытании гипо­ тезы мы обнаруживаем, что данные выборки не согласуются с нулевой гипоте­ зой, то тогда мы должны решить, какое примем альтернативное заключение. Альтернативной гипотезой может быть просто предположение, что среднее зна­ чение генеральной совокупности не равняется 5,0, а также альтернативной гипо­ тезой может быть предположение, что генеральная средняя больше, чем 5,0. Альтернативная гипотеза определяет точные условия испытания нулевой гипо­ тезы. Отмеченные две формулировки Hi можно записать следующим образом Случай 1:

Н0: m = 5,0 см Hi-, m Ф 5,0 см

Случай 2:

Н0: m = 5,0 см, Hi: m > 5,0 см

Если результат относится к категории 3, то никакое решение не может быть принято до тех пор, пока не будет получено больше данных, и испытание гипо­ тезы будет проведено вновь. Однако следует отметить, что разграничение этих трех категорий проводится лицом, принимающим решение. Какой бы результат ни был получен, мы никогда не сможем определенно (на 100%) доказать или опровергнуть нулевую гипотезу. Все, что можно сделать, - это или признать то, что нулевая гипотеза почти наверняка верна, или, что правильность нулевой ги­ потезы маловероятна.

Одним из важных аспектов, который должен приниматься во внимание, яв­ ляется природа альтернативной гипотезы. То, как задана альтернативная гипо­ теза, влияет на выбор границы между критической областью и областью дове­ рительных значений.

Вернемся к примеру,-в котором машина производит металлические планки со средней высотой 5,0 см. Случайная выборка изготовленных планок показала, что средняя высота равна 5,3 см. Если лицо, принимающее решение, просто ин­ тересуется, правильно ли его машина настроена, то не важно, больше или меньше выборочная средняя, чем предполагаемая средняя генеральной сово­ купности. Следовательно, нулевая и альтернативная гипотеза в этом случае бу­ дут:

Н0: m = 5,0 см Н-ь m Ф 5,0 см

Если принимается решение с 5% уровнем значимости, то можно предполо­ жить, что границы расположены симметрично по выборочному распределению, как это показано на рис.4.8.

220

Часть 1. Новые принципы работы

В этом случае принимается двусторонний тест (то есть для значений и больших, и меньших генеральной средней). Принимающему решение безраз-

Отклонение Н0

,

При нятие Н0

 

, Отклонение Н0

 

 

95%

\

 

 

 

2,5%

I

/

\

I

2,5%

 

 

 

I

 

 

 

 

граница

\

m

 

W

граница

средняя

 

 

["ч.

 

решения

 

Рис.4.8

 

 

решения

 

 

 

 

 

 

 

лично, будет ли среднее значение выборки в действительности больше или меньше предполагаемой генеральной средней. Он просто хочет знать, про­ изошли какие-либо изменения или нет.

Однако если лицо, принимающее решение, беспокоится, что средняя дей­ ствительно стала больше, то должна быть принята другая альтернативная гипо­ теза:

Н0: m = 5,0 см, Нл: m > 5,0 см

В этом случае лицо, принимающее решение, исследует существенность различий в определенном направлении. Если опять-таки решение должно быть

 

Принятие Н0

 

Отклонение Н0

/

95%

\

 

 

 

 

w

5%

 

 

I

 

 

 

 

m

*—_

граница

средняя

 

 

^ ^ - -

 

решения

Рис.4.9

Соседние файлы в предмете Экономика