
- •1 Случайные события
- •1.1 Основные понятия и определения
- •1.2 Аксиомы теории вероятностей
- •1.3 Классическая схема вычисления вероятностей
- •1.3.1 Декартово произведение множеств и правило умножения
- •1.3.2 Размещения и перестановки
- •1.3.3 Сочетания при выборе с возвращением и без возвращения
- •1.3.4 Схема упорядоченных разбиений множества
- •1.4 Геометрическая, статистическая и экспертная схемы расчета
- •1.4.1 Геометрическая схема вычисления вероятности
- •1.4.2 Статистическая схема вычисления вероятности
- •1.4.3 Схема вычисления субъективной вероятности
- •1.5 Условная вероятность. Независимость событий. Формулы сло-
- •1.6 Формула полной вероятности и формулы Байеса
- •2 Случайные величины
- •2.1 Cлучайная величина и ее функция распределения
- •2.2 Дискретная случайная величина
- •2.2.1 Дискретный закон распределения
- •2.2.2 Числовые характеристики дискретного распределения
- •2.2.3 Производящая функция вероятностей
- •2.2.4 Биномиальное распределение
- •2.2.5 Распределение Пуассона
- •2.2.6 Геометрическое распределение
- •2.3 Непрерывные случайные величины
- •2.3.1 Функция распределения и плотность распределения
- •2.3.2 Числовые характеристики непрерывного распределения
- •2.3.3 Равномерное распределение
- •2.3.4 Нормальное распределение
- •2.3.5 Показательное распределение
- •2.4 Функция от случайной величины
- •3 Случайные векторы
- •3.1 Общие свойства случайного вектора
- •3.2 Случайные векторы дискретного типа
- •3.3 Непрерывные случайные векторы
- •4 Предельные теоремы
- •4.1 Закон больших чисел
- •4.2 Центральная предельная теорема
- •5 Элементы математической статистики
- •5.1 Выборка и выборочные законы распределения
- •5.2 Точечные оценки числовых характеристик случайных величин
- •5.3 Интервальные оценки
- •5.4 Проверка статистических гипотез
5.3 Интервальные оценки
Точечные оценки, обладая определёнными оптимальными свойствами,
не позволяют количественно судить о том, насколько оценка близка к истин-
ному значению оцениваемой характеристики случайной величины, сформи-
ровавшей данную выборку. Особенно актуальна эта проблема при малом объ-
ёме выборки. Решение данной задачи проводится с помощью доверитель-
ных интервалов , содержащих истинные значения θ параметров распреде-
лений или числовых характеристик случайных величин с доверительной
вероятностью γ = 1 − α . Значение α называют уровнем значимо-
сти . Нижняя θ∗1и верхняя θ2∗ границы доверительного интервала
(θ∗1; θ∗1) являются функциями выборки, т. е. некоторыми статистиками.
Двусторонний доверительный интервал Iθ(n; 1 − α) , содержа-
щий неизвестный параметр θ с доверительной вероятностью 1 − α , опреде-
ляется по выборке объема n по следующему правилу:
P {θ∗1< θ < θ2∗}= 1 − α.
Для решения некоторых задач могут применяться односторонние до-
верительные интервалы: левосторонние (неограниченные слева), гра-
ницы которых определяются из условия P {θ < θ2∗}= 1 − α и правосторон-
ние (неограниченные справа), определяемые из условия P {θ∗1< θ} = 1 − α .
Числовое значение доверительной вероятности γ = 1 − α выбирают
исходя из условий и значимости решаемой практической задачи. Обычно ис-
пользуют значения γ = 1 − α , равные 0, 90 , 0, 95 , 0, 99 .
При достаточно большом числе повторений выборок доверительные ин-
тервалы содержат оцениваемые характеристики в 100 (1 − α) % случаев.
Данное утверждение используют в задачах статистического моделирования
для контроля сходимости результатов.
Построение доверительных интервалов проводится в параметрической
модели по следующей схеме .
Сначала на основе имеющейся информации оговариваются свойства
случайной величины X (ω) , формирующей данную выборку. Затем рассмат-
105
ривается некоторая случайная величина Y , которая является функцией от
оцениваемого параметра θ и компонент n -мерного выборочного вектора XЇ
и имеет распределение FY(y) , не зависящее от параметра θ . По распреде-
лению FY(y) находят числа y1и y2, обеспечивающие выполнение условия
P {y1≤ Y ≤ y2} = 1 − α . Отметим, что при построении односторонних до-
верительных интервалов, рассматривается только одно из двух неравенств,
стоящих в фигурной скобке предшествующей формулы. Окончательно гра-
ницы θ1∗ и θ2∗ доверительного интервала Iθ(n; 1 − α) = (θ∗1; θ1∗)выражаются
через y1, y2и соответствующие статистики.
Пример 1. Найти доверительный интервал для математического ожи-
дания m при доверительной вероятности γ = 1 − α и условии, что выборка
объема n порождена нормально распределенной случайной величи-
ной с неизвестным параметром µ и известным параметром σ .
√
Решение. Рассмотрим случайную величину U = ( Ї − µ)
n/σ . Дока-
зано, что при оговоренных выше условиях данная случайная величина имеет
стандартное нормальное распределение N (0; 1) независимо от значения па-
раметра µ . Выберем значения y1, y2равными значениям квантилей uα/2
u1−α/2 стандартного нормального распределения N (0; 1) .
Тогда по определению данных квантилей выполняется условие
√
P}uα/2<( Ї − µ) n/σ < u1−α/2
{ = Φ(u1−α/2)− Φ(uα/2) = 1 − α − α= 1−α.
2
2
Решая неравенства в фигурных скобках относительно оцениваемого пара-
метра µ , получим, что с доверительной вероятностью 1 − α выполняются
√
√
условия XЇ − u1−α/2·√σ/
n < µ < XЇ − uα/2·σ/
n , которые задают нижнюю
θ∗1= ЇX − u1−α/2·σ/
√
n и верхнюю θ2∗= ЇX − uα/2·σ/ n границы довери-
тельного интервала Iµ(1 − α) = (θ∗1; θ∗2) , содержащего с доверительной веро-
ятностью 1 − α неизвестный заранее параметр µ . Так как для нормально-
го распределения математическое ожидание m равно параметру положения
µ , то полученный доверительный интервал содержит также математическое
ожидание m . Учитывая далее, что для квантилей стандартного нормального
распределения справедливо равенство uα/2=−u1−α/2 , получим окончатель-
но искомый доверительный интервал в виде
√
√
Im(1 − α) =(XЇ − u1−α/2·σ/
n; ЇX + u1−α/2·σ/
n .
Реализацию данного доверительного интервала рассчитывают как
√
√
Im(1 − α) =(Ї − u1−α/2·σ/
∑n
n; Ї + u1−α/2·σ/
n ,
∑n
подставляя вместо статистики XЇ =
k=1Xk
n
106
ее реализацию Ї =
k=1xk
n.
Пусть более конкретно имеется ранее рассмотренная выборка объёма
n = 10 (время ожидания обслуживания на автозаправочной станции в те-
чение суток) 3, 7, 7, 0, 2, 1, 2, 3, 5, 4. Построим 95% доверительный интервал
для математического ожидания при условии, что параметр масштаба нор-
мального распределения известен и равен 2.
Предварительно вычисляем среднее арифметическое по формуле
n
Ї =
∑
k=1
xk
n
= 34/10 = 3, 4.
По таблице стандартного нормального распределения находим кван-
тиль, соответствующий вероятности 1 − α/2 = 0, 975 в виде u0,975= 1, 96 .
Тогда доверительный интервал для математического ожидания mxпри
доверительной вероятности 0, 95 имеет следующий вид:
√
√
Im(0, 95) = 3, 4 − 1, 96 · 2, 0/
10 ; 3, 4 + 1, 96 · 2, 0/
10 = (2, 16 ; 4, 64).
Пример 2. Найти доверительные интервалы для дисперсии σx2 и стан-
дартного отклонения σxпри доверительной вероятности 1−α и условии, что
выборка объема n порождена нормально распределенной случайной
величиной с известным параметром µ и неизвестным парамет-
ром σ .
Решение. В данном случае для построения доверительного интерва-
ла для дисперсии σx2 при доверительной вероятности 1 − α используется
случайная величина
χ2n=S02·n/σ2,
имеющая независимо от значения параметра σ распределение ѕхи-квадратї
с числом степеней свободы n .
2
Используя статистику S02=∑nk=1(Xk−µ)
2
2
n , квантили χα/2 и χ1−α/2 рас-
пределения ѕхи-квадратї с числом степеней свободы n , построим событие
n
2
2
o
χ2α/2< S0·n/σ
< χ21−α/2)
с заданной доверительной вероятностью 1 − α .
Решая полученные неравенства относительно квадрата параметра мас-
штаба σ2, получим доверительный интервал
Iσ2 (1 − α) = S02·n/χ21−α/2;S02·n/χ2α/2,
содержащий с доверительной вероятностью 1−α квадрат параметра масшта-
ба σ2. Так как для нормального распределения дисперсия σx2 равна квадрату
параметра масштаба σ2, то полученный доверительный интервал содержит
107
и дисперсию σx2 . Реализация данного доверительного интервала имеет вид
Iσx2(1 − α) = s20·n/χ21−α/2;s20·n/χ2α/2,
2
где вместо статистики S02 подставлена ее реализация s20=∑nk=1(xk−µ)
n.
Извлекая квадратный корень из левой и правой границы доверитель-
ного интервала для дисперсии, вычисляют реализацию доверительного ин-
тервала для стандартного отклонения в виде
Iσx(1 − α) = s0·
q
n/χ21−α/2;s0·
q
-
n/χ
2
α/2.
В рассматриваемом конкретном примере построим 95% доверительные
интервалы для дисперсии и стандартного отклонения при условии, что пара-
метр положения нормального распределения известен и равен 3,2, а параметр
масштаба неизвестен. Вычисляем выборочную дисперсию
10
s20=
∑
k=1
(xk− 3, 2)2
10
= 5, 08,
а также находим квантили χ20,025= 3, 25 и χ20,975 = 20, 5 распределения
ѕхи-квадратї с числом степеней свободы 10 . Тогда реализация 95% довери-
тельного интервала для дисперсии имеет вид
Iσx2 (0, 95) = (5, 08 · 10/20, 5 ; 5, 08 · 10/3, 25) = (2, 48; 15, 63).
Реализацию 95% доверительного интервала для стандартного отклонения
находим извлекая квадратные корни из левой и правой границы доверитель-
ного интервала для дисперсии
Iσx(0, 95) = (Ⲛ2, 48; Ⲛ15, 63) = (1, 58 ; 3, 95).
Пример 3. Найти доверительные интервалы для математического ожи-
дания mx, дисперсии Dx= σx2 и стандартного отклонения σxпри довери-
тельной вероятности 1 − α и при условии, что выборка объема n порож-
дена нормально распределенной случайной величиной с неизвест-
ными параметрами µ и σ .
Решение. В данном случае для построения доверительного интервала
для параметра положения µ используется случайная величина
√
n
Xk
v
u
n
(Xk− XЇ )2
Tn−1 = ( Ї − µ)
n/S, где XЇ =
∑
k=1
n
∑
, S =ut
k=1
n − 1
.
108
Рассматриваемая случайная величина имеет в оговоренных выше усло-
виях распределение Стьюдента с (n − 1) -ой степенью свободы. По определе-
нию квантилей tα/2, t1−α/2 выполняется условие
√
P}tα/2<( Ї − µ)
n/S < t1−α/2{= FT(t1−α/2)− FT(tα/2) = 1 − α.
√
Тождественно преобразуем неравенства tα/2<( Ї − µ)
n/S < t1−α/2 в
фигурных скобках относительно параметра µ и учтем, что в силу симметрии
плотности распределения Стьюдента относительно оси Oy выполняется со-
отношение tα/2=−t1−α/2 . Тогда реализация доверительного интервала для
математического ожидания mx= µ при доверительной вероятности 1 − α
будет иметь следующий вид:
√
√
Im(1 − α) =(Ї − t1−α/2·s/
n ; Ї + t1−α/2·s/
n .
Для построения доверительного интервала для дисперсии σ2x=σ2при
доверительной вероятности 1 − α используется случайная величина
χ2n−1=S2(n − 1)/σ2,
имеющая распределение ѕхи-квадратї с числом степеней свободы n − 1 .
Используя квантили χ2α/2 и χ21−α/2 распределения ѕхи-квадратї, по-
строим событие
n
o
χ2α/2< S2(n − 1)/σ2< χ21−α/2)
, имеющее заданную дове-
рительную вероятность 1 − α .
Решая, как и ранее, полученные неравенства относительно оцениваемой
дисперсии σx2=σ2и подставляя вместо статистик XЇ , S2их реализации Ї ,
s2, получим реализацию доверительного интервала
Iσ2x(1 − α) = s2· (n − 1)/χ21−α/2;s2· (n − 1)/χ2α/2,
содержащего неизвестную дисперсию σx2 с доверительной вероятностью 1−α .
В практических задачах часто используют доверительный интервал
Iσx(1 − α) = s ·
q
(n − 1)/χ21−α/2;s ·
q
(n − 1)/χ2α/2
для стандартного отклонения σx. Данный интервал имеет доверительную
вероятность 1 − α , так как находится путем равносильных преобразований
(извлечения квадратного корня) из неравенств
s2(n − 1)/χ21−α/2 < σ2x< s2(n − 1)/χ2α/2.
109
Для конкретной выборки объемом в 10 наблюдений предварительно на-
ходим среднее арифметическое, несмещенную выборочную дисперсию и вы-
борочное стандартное отклонение по формулам:
Ї =
n
∑xk
n
k=1
= 34/10 = 3, 4; s2=
n
∑
k=1
(xk− Ї)2
n − 1
= 50, 4/9 = 5, 6; s =
√
s2= 2, 37.
Квантиль распределения Стьюдента при вероятности 1 − α/2 = 0, 975 и при
числе степеней свободы n−1 = 9 имеет значение t0,975(9) = 2, 26 . Подставляя
значения среднего арифметического, выборочного стандартного отклонения
и квантиля в соответствующую общую формулу, находим реализацию 95%
доверительного интервала для математического ожидания
√
√
Im(0, 95) = 3, 4 − 2, 26 · 2, 37/
9 ; 3, 4 + 2, 26 · 2, 37/
9 = (1, 71 ; 5, 19).
Квантили ѕхи-квадратї распределения уровней 0, 025 и 0, 975 при чис-
ле степеней свободы, равном девяти, имеют следующие значения:
χ2α/2=χ20,025= 2, 7, χ21−α/2=χ20,975 = 19, 0.
Подставляя в общую формулу значения квантилей и выборочной дисперсии
s2, находим доверительный интервал Iσx2 (1 − α) для дисперсии σx2 в виде
Iσ2x(0, 95) = (5, 6 · 9/19 ; 5, 6 · 9/2, 7) = (2, 65 ; 18, 67).
Извлекая корни квадратные из границ интервала Iσx2 (0, 95) , получим
доверительный интервал Iσx(0, 95) для стандартного отклонения σxв виде
Iσx(0, 95) = (1, 63 ; 4, 32).
Пример 4. Найти доверительный интервал для параметра p при до-
верительной вероятности 1 − α и при условии, что выборка объема n по-
рождена случайной величиной, имеющей распределение Бернулли
с неизвестным параметром p .
Решение. Доверительный интервал (p∗1, p∗2) для параметра p распре-
деления Бернулли находится с использованием вспомогательной случайной
величины Y = (p ∗ −p)/Ⲛpq/n , распределение которой при n > 50 , n ˜ 5
и n(1 − ˜) > 5 аппроксимируется стандартным нормальным распределением.
Во многих практических задачах под выборочной частотой p∗ = k/n
подразумевается относительная частота появления ѕуспехаї в серии из n
независимых испытаний по схеме Бернулли с вероятностью ѕуспехаї p и
110
вероятностью ѕотказаї q = 1 − p . Так как всегда выполняется условие
pq ≤ 1/4 , то более широкий приближенный доверительный интервал
√
√
Ip(1 − α) = (p ∗ −u1−α/22/
n ; p ∗ +u1−α/22/
n)
содержит неизвестное заранее значение вероятности успеха p с доверитель-
ной вероятностью не меньшей, чем 1 − α .
Пусть проводятся испытания по схеме Бернулли с одинаковой, но неиз-
вестной вероятностью p появления события A в каждом испытании. Най-
дем расширенный 95% доверительный интервал для параметра p , если в 400
испытаниях событие A появилось 160 раз. Предварительно вычисляем вы-
борочную частоту появления события A в виде p∗ = k/n = 160/400 = 0, 4
и по таблице стандартного нормального распределения находим квантиль
u0,975= 1, 96 уровня 0, 975 , обеспечивающий построение двустороннего 95%
доверительного интервала.
Подставляя найденные значения в общую формулу, получим
√
√
Ip(0, 95) = (0, 4 − 1, 96 · 2/
400 ; 0, 4 + 1, 96 · 2/
400) = (0, 2; 0, 6).
Пример 5. Найти доверительный интервал для медианы hxпри доверитель-
ной вероятности 1 − α и при условии, что выборка порождена случайной
величиной, имеющей любое непрерывное распределение.
Решение. Данные доверительные интервалыв могут быть построены с
помощью элементов вариационного ряда (порядковых статистик).
Доказано, что существует доверительный интервал
Ih(n; 1 − α) = (x(k), x(n−k+1)),
содержащий медиану hxс доверительной вероятностью не меньшей, чем
1 − α . Ниже приведена таблица значений номеров вариационного ряда k
и n − 1 + k , обеспечивающих гарантированную доверительную вероятность
0, 95 для различных объёмов выборок n .
111
n k n+1–k P
6 1
7 1
8 1
9 2
10 2
11 2
12 3
13 3
14 3
15 4
20 6
25 8
30 10
6
7
8
8
9
9
10
11
12
12
15
18
21
0,984
0,992
0,996
0,980
0,988
0,993
0,980
0,988
0,993
0,981
0,978
0,977
0,978
Для определения доверительного интервала для медианы hxпостроим
вариационный ряд, упорядочив нашу выборку по неубыванию
0 ≤ 1 ≤ 2 ≤ 2 ≤ 3 ≤ 3 ≤ 4 ≤ 5 ≤ 7 ≤ 7.
Используя приведенную ранее таблицу, найдём доверительный интер-
вал Ihx(n; 1 − α) = (x(k), x(n−k+1))в виде Ihx(10 ; 0, 95) = (x(2); x(9)) = (1 ; 7) .
Данный интервал содержит неизвестную медиану генеральной совокуп-
ности с доверительной вероятностью 0, 988 , которая больше, чем заранее
заданная и равная 0, 95 . Отметим, что более узкий интервал, строго отвеча-
ющий вероятности 0, 95 , невозможно построить в силу дискретности распо-
ложения порядковых статистик на числовой оси.