Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книги / MODELIROVANIE_SISTEM_12.docx
Скачиваний:
240
Добавлен:
17.06.2016
Размер:
3.17 Mб
Скачать

6. Оценки искомых характеристик и их дисперсии

6.1. Структура оценок

ледуя традициям математической статистики, обозначим искомую характеристику символом , а ее приближенную оценку, найденную в результате модулирования . При моделировании СМО, как правило, оценки имеют вид дроби - отношения двух статистик

Это обусловлено тем, что нахождение оценки при имитационном моделировании обычно связано с осреднением, В числителе стоит некоторая сумма, накопленная в процессе имитации, а в знаменателе величина, характеризующая число слагаемых в этой сумме. Приведем несколько примеров.

1.  - вероятность потери заявки

а. Оценка по заявкам. Здесь  - число поступивших заявок,  - число потерянных.

б. Оценка по времени. Здесь  - пройденное системное время (длина реализации),  - суммарное время, в течение которого система была полностью занята (пришедшую в это время заявку некуда принять и поэтому она теряется).

В оценке 16 знаменатель не характеризует количество слагаемых в явном виде. Однако аналогию нетрудно усмотреть. Предположим, что время отсчитывается дискретно, и t - единица -времени. Тогда  - количество интервалов t, пройденных в процессе имитации, а  - количество интервалов, на которых наблюдалась полная занятость. В этом случае каждое из слагаемых числителя равно либо единице (если система полностью занята), либо нулю (в иных случаях), а знаменатель представляет собой количество слагаемых. Предположение о дискретном счете времени является даже не предположением, а фактом ввиду ограниченной разрядности ЭВМ. Под t можно понимать цену младшего разряда в представлении величин, связанных с системным временем.

2. - среднее время ожидания начала обслуживания

а. Оценка по заявкам с раздельным учетом времени ожидания.  - число обслуженных заявок,  - суммарное время, проведенное этими заявками в очереди (в буфере). Для каждой заявки надо хранить момент ее прихода t' и момент поступления на обслуживание t''.

Величина  складывается из разностей (t// -t/). Для тех заявок, которые сразу попадают на обслуживание, эта разность равна нулю. Хранить t/ и t// надо только до тех пор, пока их разность не добавлена в статистику , после этого их можно стереть из памяти. Добавление производится на том шаге, на котором имитируется поступление заявки на обслуживание.

б. Совместный учёт времени ожидания. Можно обойтись без запоминания моментов t/ и t// если вычислять  по шагам. На каждом шаге к накопленному значению  добавляется произведение (TT-TL)L, в котором (TT-TL)- системное время, пройденное от момента предыдущего события до момента текущего события, L- количество заявок, стоявших в очереди на этом интервале.

3. -средняя длина очереди

Необходимо уточнить смысл слова «средняя». Если интересоваться длиной очереди в произвольный момент времени, надо усреднять по всему пройденному времени. Если же интересоваться длиной очереди в момент прихода заявки, то надо рассматривать только моменты прихода заявок. Эти средние длины очереди, вообще говоря, неодинаковы. Приведём простой пример. Допустим, заявка некоторое время ждёт начала обслуживания, но успевает поступить на обслуживание к моменту появления следующей заявки, и так происходит для всех заявок. Тогда в момент прихода заявки длина очереди всегда равна нулю, и средняя длина очереди, следовательно, тоже равна нулю. Но средняя длина очереди по отношению к произвольному моменту времени не равна нулю, так как на некоторых отрезках времени длина очереди равна единице.

3. / Средняя длина очереди в момент поступления заявки.

- число поступивших заявок; , гдеLi - длина очереди в момент поступления i-й заявки.

3.// Средняя длина очереди в произвольный момент времени

-пройденное системное время (длина реализации); - то же, что в примере 2б, только роли другие: там (ТТL) – усредняемая величина, а L- коэффициент; здесь же L-осредняемая величина, а (ТТL)- коэффициент.

Поясним, почему в третьем примере варианты помечены штрихами, а не буквами, как в первых двух примерах. Это сделано, чтобы подчеркнуть различие: в третьем примере рассматриваются разные характеристики СМО, а в первых двух - разные виды оценок.

На этих трёх примерах мы убедились, что оценки имеют вид дроби. Рассмотрим теперь, как формируются числитель и знаменатель. Это - статистики, накапливаемые по шагам в ходе имитации. В состав алгоритма шага входят операторы, добавляющие к статистикам  и  приращения. Выбор той или иной оценки в конечном итоге сводится к определению вида этих приращений. Рассмотрим вид приращений для приведённых выше примеров оценки.

1а. Вероятность потери заявки, оценка по заявкам

1, если на данном шаге поступила и потеряна заявка,



0 в иных случаях

1, если на данном шаге поступила заявка,



0 в ином случае.

1б. Вероятность потери заявки, оценка по времени

TT-TL, если перед началом шага система полностью занята,



0 в ином случае

 = TT-TL (на всех шагах, независимо от их типа).

ТТ – момент текущего события (текущее системное время),

TL – момент предыдущего события.

2а. Среднее время ожидания, раздельный учёт ожидания

 t// - t/, если на данном шаге завершилось обслуживание заявки (т.е. освободился прибор)



0 в иных случаях

t/, t// - соответственно момент прихода этой заявки и момент начала обслуживания (они могут совпадать, тогда будет =0).

1, если на данном шаге освободился прибор



0 в ином случае.

2б. Среднее время ожидания, совместный учёт

 = (TT-TL)L (на всех шагах, независимо от их типа).

L - длина очереди перед началом шага (число занятых ячеек буфера; может быть равно и нулю)

 L, если на данном шаге освободился прибор



0 в ином случае.

3/. Средняя длина очереди в момент прихода заявки

L, если на данном шаге поступила и потеряна заявка,



0 в иных случаях

1, если на данном шаге поступила заявка,



0 в ином случае.

3//. Средняя длина очереди в произвольный момент времени

 = (TT-TL)L

 = TT-TL

По аналогии с приведёнными примерами можно выбрать вид оценки и приращений для других случаев с учётом смысла оцениваемой характеристики. Оценки некоторых характеристик можно вычислить через оценки других характеристик. Например, оценка средней длины очереди, наряду с оценкой 3//, может быть вычислена по формуле

где - оценка вероятности того, что в произвольный момент времени длина очереди равнаL (занято L ячеек буфера);

Lmax - число ячеек в буфере (емкость буфера).

Для получения этой формулы взята формула, определяющая математическое ожидание, и вместо входящих в неё величин подставлены оценки этих величин. Аналогичным путём получают и другие соотношения между оценками. В частности, оценку коэффициента загрузки буфера можно вычислить по формуле

Вопросы и задания:

1. Термин «статистика» употребляется во многих смыслах:

а) математическая наука, изучающая методы оценки параметров и проверки гипотез о законах распределения по результатам наблюдений (математическая статистика);

б) совокупность данных о явлениях, имеющих случайный характер (в этом смысле говорят «сбор статистики»)

в) функция выборки, т.е. функция, аргументами которой являются наблюдавшиеся значения случайной величины.

В каком смысле мы говорим, что оценка характеристики СМО обычно является отношением двух статистик?

2. Термин «оценка» тоже имеет несколько смыслов:

а) приближённое значение неизвестного параметра, вычисленное по выборке (точнее было сказать «значение оценки»);

б) правило (алгоритм или формула), по которому вычисляется значение оценки по выборке (в этом смысле можно говорить о свойствах оценки: несмещённости, состоятельности, эффективности, достаточности);

в) процесс выбора правила и вычисления по нему значения оценки (такой смысл имеет заголовок главы «оценка параметров» в учебниках по математической статистике, хотя в некоторых книгах пишут более удачно: «оценивание параметров»). В каком смысле употребляется термин «оценка» в этом разделе? В каком смысле можно утверждать, что оценка является статистикой?

3. Постройте оценки для следующих характеристик:

а) средняя длина очереди в момент освобождения прибора;

б) вероятность того, что в произвольный момент времени все приборы свободны;

в) среднее время пребывания обслуженной заявки в системе (время ожидания в очереди плюс время обслуживания).

Иными словами, укажите, что представляют собой    ?

4. Подумайте, всегда ли оценки 1а и 1б совпадают в среднем с вероятностью потери заявки. Если не всегда, то какая из двух оценок непригодна и чем это объяснить? (Ответ есть в следующем разделе).

6.2. Дисперсия оценки

Хорошая оценка должна быть несмещённой, т.е. в среднем должна совпадать с истинным значением оцениваемой характеристики. Это требование можно выразить формулой:

где - математическое ожидание оценки

 - истинное (но неизвестное) значение характеристики.

Несмещённость обеспечивается правильностью моделирующего алгоритма, в частности - правильным построением оценки и соответствующим выбором приращений  . Процедура вычисления этих приращений и добавление их к статистикам  и  является составной частью алгоритма шага. Особых рекомендаций для обеспечения правильности этой части алгоритма нет. Надо руководствоваться здравым смыслом и приведёнными примерами. Если же остаются сомнения в несмещенности выбранной оценки, можно осуществить статистическое тестирование, методика которого описана в разделе 7.

К сожалению, «здравый смысл» иногда подводит, и даже тестирование может ввести в заблуждение. К построению оценки следует подходить очень внимательно.

Хотя несмещенная оценка в среднем совпадает с истинным значением оцениваемой характеристики, но при каждом прогоне программы моделирования получается своё значение оценки, отличающиеся от истинного значения на некоторую случайную величину. Это обусловлено тем, что в разных прогонах используются разные отрезки последовательности случайных чисел. Желательно, чтобы отклонения были поменьше. Величина случайных отклонений характеризуется дисперсией. Для несмещенной оценки дисперсия определяется формулой:

Нас будет интересовать среднеквадратическое отклонение оценки

При моделировании СМО можно считать, что оценки имеют нормальное распределение. Это утверждение частично определяется ссылкой на центральную предельную теорему теории вероятностей, хотя она здесь непосредственно не применима и подтверждается практикой моделирования. Для нормального распределения известны вероятности тех или иных отклонений случайной величины от своего математического ожидания, в частности,

В общем случае

где доп- допустимая абсолютная погрешность, выраженная

через ;

 - коэффициент доверия (вероятность того, что отклонение не

превысит доп)

Между  и имеется однозначное соответствие, определяемое по таблицам нормального закона распределения. В частности, как только что отмечалось:=2=0,955;

=3=0,997

Итак, мы видим, что в 95% случаев значение несмещенной оценки отличается от точного значения искомой характеристики не более чем на 2. Следовательно, погрешность оценки удобно характеризовать величиной. Иногда удобнее иметь дело с дисперсией, равной 2, но это не имеет принципиального значения.

Проблема заключается в том, что дисперсия оценки обычно не известна и может быть приближённо определена лишь в ходе моделирования. С этой целью выполняют не один прогон, а n прогонов, например 10 или 20. В результате получают n значений оценки:

В качестве окончательного значения оценки берётся среднее арифметическое

Дисперсия у этой оценки будет та же, что у оценки, полученной по одному прогону, но в n раз более длительному. Однако, выполнив n коротких прогонов вместо одного длинного, мы получим информацию о дисперсии оценки. Действительно, имея выборку можно тем или иным способом (см. ниже) приближённо вычислить дисперсию частной оценки, а по ней определить дисперсию осреднённой оценки:

Здесь предполагается, что некоррелированы, поскольку в разных прогонах используются разные отрезки последовательности случайных чисел. При наличии корреляции дисперсия осреднённой оценки будет несколько иной: положительная корреляция увеличивает дисперсию, а отрицательная уменьшает. Иногда отрицательную корреляцию искусственно вводят для уменьшения дисперсии оценки [8]. Рассмотрим способы определения 1по выборке.

1. оценка по двум статистикам:

Эти статистики формируются в двух ячейках. По окончании очередного прогона в первую добавляется вычисленная оценка, а во вторую - её квадрат. Когда проведено n прогонов, вычисляется оценка дисперсии:

2. оценка по размаху:

где W- коэффициент между максимальными и минимальными элементами выборки. Коэффициент , на который надо разделить размах W, зависит от числа элементов выборки. Если элементы выборки распределены по нормальному закону (а дляэто верно), томожно найти в таблицах математической статистики. В частности,(10)=3.08,(20)=3.73.

Известен способ нахождения дисперсии оценки по одной реализации, разделённой точками регенерации на независимые отрезки. Точкой регенерации называется такой момент времени, после которого процесс развивается независимо от того, как он развивался этого момента. В точке регенерации процесс как бы начинается заново. При моделировании СМО точкой регенерации является момент, когда в пустую систему поступает заявка. Так как система пустая, её прошлые состояния не оказывают влияния на будущие состояния. Для приближённого вычисления дисперсии надо иметь хотя бы несколько десятков точек регенерации, т.е. за один прогон система должна несколько десятков раз опустеть. Если ввести исходные данные, соответствующим реальным СМО, то придётся очень долго ждать возвращения системы в полностью свободное состояние, так как реальные СМО работают с достаточной нагрузкой и пустыми практически не бывают. Однако за точку регенерации не обязательно брать пустую систему. Можно брать то состояние системы, к которому она чаще всего возвращается. При нагрузке 0.5 таким состоянием может быть состояние, когда в системе находиться одна, две или даже более заявок.

Вопросы и задания:

  1. Какая оценка называется несмещённой?

  2. Почему вместо погрешности оценки можно интересоваться дисперсией оценки либо среднеквадратическим отклонением?

  1. Во сколько раз надо увеличить длину реализации, чтобы уменьшить дисперсию оценки в десять раз?

  2. Во сколько раз надо увеличить длину реализации, чтобы уменьшить погрешность оценки в десять раз?

  3. Сколько примерно шагов надо выполнить, чтобы оценить вероятность события, примерно равную 10-4с точностью порядка 20%?

  4. Сопоставьте два варианта, одинаковых по затратам машинного времени: а)десять прогонов с длиной реализации Т; б) один прогон с длиной реализации 10Т. В чём преимущество первого варианта?