
Теория дискретизации
Предположим, что мы имеем выборку п независимых и равномерно распределенных (IID — Independent and Identically Distributed) величин наблюдения {Х{, Х2, ...,Хп} случайной переменной с неизвестной конечной средней величиной т{ и конечной дисперсией а2 (статистические параметры).
Средняя величина и дисперсия выборки определены следующим образом:
п
(15.1)
(15.2)
X и s2 — функции случайной переменной и поэтому также случайные переменные, определенные распределением, которое мы называем распределением выборки. X является центральной оценкой неизвестной средней величины совокупности mv то есть:
(15.3)
Кроме того, s2/n — центральная оценка неизвестной дисперсии средней величины выборки X, то есть:
(15.4)
Мы отображаем точность оценки типового параметра посредством доверительного интервала, который с данной вероятностью определяет, как оценка соотносится с неизвестным теоретическим значением. В нашем случае доверительный интервал средней величины равен:
(15.5)
где tn X 2 — верхний квантиль (1-а/2) t-распределения Стьюдента’ с п-1 степени свободы. Вероятность, с которой доверительный интервал включает неизвестную теоретическую среднюю величину, равна (1 - а) и называется доверительным уровнем. Некоторые значения t-распределения Стьюдента даются в таблице 15.1. Когда п становится большим, тогда t-распределение Стьюдента сходится к нормальному распределению, и мы можем использовать квантиль этого распределения. Предположение о независимости выполняется для измерений, взятых в различные дни, но, например, не для последовательных измерений методом сканирования в пределах ограниченного временного интервала, потому что число занятых каналов в данный момент будет коррелировать с числом занятых каналов в предыдущем и следующем сканировании.
В следующей секции мы вычисляем среднюю величину и дисперсию при измерении нагрузки в течение, например, одного часа. Это суммарное значение в течение данного дня может использоваться как единственное наблюдение в приведенной выше формуле, где мы имеем измерение с числом наблюдений, равным числу дней.
Это распределение получило название от псевдонима Student, которым подписывался английский ученый Вильям Госсет (1867-1937) - один из пионеров современных статистических методов (прим. переводчика).
Непрерывный
процесс наблюдения нагрузки
Дискретный
процесс наблюдения нагрузки
интервала
сканирования
Метод
сканирования
а
0
-►
1 1
1
1
0
—
1
0
0
0
b
0
0
— 1
1
— 0
0
0
-►
1
1
1
с
0
0
1 -►
0
0
0
1
1
1
-►
0
d
1
1
1
1
0
0
0
0
0
0
2
1
2
4
3
1
0
2
2
2
1
Рисунок 15.1. Наблюдение процесса нагрузки непрерывным методом измерения и методом сканирования с регулярными интервалами сканирования. При методе сканирования достаточно наблюдать только изменения состояния
Таблица
15.1. Квантили
/-распределения Стьюдента с п
степенями свободы. Заданное значение
а соответствует распределению
вероятностей (распределение массы*)
а/2 в обоих «хвостовых»’* направлениях
/-распределения Стьюдента. Когда п
является большим, тогда мы можем
использовать квантили нормального
распределения
п
a
=10%
a
=5%
a=
1%
1
6.314
12.706
63.657
2
2.920
4.303
9.925
5
2.015
2.571
4.032
10
1.812
2.228
3.169
20
1.725
2.086
2.845
40
1.684
2.021
2.704
ОО
1.645
1.960
2.576
Пример 15.2.1: Доверительный интервал для потерь по вызовам
На группе из 30 пучков каналов мы зафиксировали результат 500 попыток вызова. Это измерение повторено 11 раз, и мы находим следующие значения потерь по вызовам (в процентах):
{9,2; 3,6; 3,6; 2,0; 7,4; 2,2; 5,2; 5,4; 3,4; 2,0; 1,4}
Полная сумма наблюдений равна 45,4, исумма квадратов наблюдений—247,88. Мы находим по формуле (1 5.1)Х = 4,1273% и согласно формуле (15.2) s2 - 6,0502 (%). При 95% уровне, используя значения /-уровней из таблицы 15.1, получаем доверительный интервал (2.47 - 5.78). Заметим, что наблюдения получены при PCT-I нагрузке 25 Эрланг, которая предлагается 30 каналам. Согласно В-формуле Эрланга теоретическая вероятность блокировки — 5,2603%. Это значение — в пределах доверительного интервала. Если мы хотим уменьшить доверительный интервал с коэффициентом 10, то должны сделать в 100 раз больше наблюдений (см. формулу 15.5), то есть 50 000 опросов на каждое измерение. Выполняя такое моделирование, заметим, что потери по вызовам равняются 5,245% при доверительном интервале (5.093 - 5.398).
Распределение массы (probability mass) — термин, который применяется для обозначения распределения случайной дискретной величины.
** Хвостовое распределение (tail) обозначает распределение вероятностей, такое, что оцениваемая величина находится в пределах от до -х (или х до °°).