- •ВВЕДЕНИЕ
- •Глава XIV ТЕОРИЯ ВЕРОЯТНОСТЕЙ
- •Раздел I
- •Виды случайных событий
- •Классическое определение вероятности
- •Основные формулы комбинаторики
- •Статистическое определение вероятности
- •Непосредственное вычисление вероятностей
- •§ 2. Теорема сложения вероятностей несовместных событий
- •§ 3. Условная вероятность. Теорема умножения вероятностей
- •§ 4. Теорема сложения вероятностей совместных событий
- •§ 5. Формула полной вероятности
- •§ 6. Формула Бейеса
- •§ 7. Схема Бернулли
- •Раздел II
- •§ 2. Математическое ожидание, дисперсия и среднеквадратическое отклонение случайной величины, их свойства
- •Свойства математического ожидания
- •Свойства дисперсии
- •Примеры решения задач
- •§ 3. Примеры распределения случайных величин
- •3.1 Биномиальное распределение
- •3.2 Распределение Пуассона
- •3.3 Нормальное распределение
- •3.4. Равномерное распределение
- •3.5 Показательное (экспоненциальное) распределение
- •§ 4. Система случайных величин
- •§ 5. Ковариация и коэффициент корреляции
- •Свойства коэффициента корреляции
- •§ 6. Закон больших чисел. Теорема Чебышева
- •§ 7. Центральная предельная теорема Ляпунова
- •Глава XV МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
- •§ 1. Задачи математической статистики
- •§ 2. Выборочный метод
- •2.1 Генеральная и выборочная совокупности
- •2.2 Статистическое распределение выборки
- •2.3 Эмпирическая функция распределения
- •2.4 Полигон и гистограмма
- •2.5 Оценки математического ожидания
- •2.6 Оценки дисперсии
- •§ 3. О статистической проверке гипотез
- •ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ ВОПРОСОВ
- •КОНТРОЛЬНЫЕ ЗАДАНИЯ
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •ПРИЛОЖЕНИЕ
- •Список рекомендуемой литературы
52
Оценить с надежностью 0,95 математическое ожидание a нормально распределенного признака генеральной совокупности.
Решение.
a = xГ ≈ xВ = 1 |
n |
|
|
|
|
|
|
||||||||||||||
∑xi ni = |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
n |
i =1 |
|
|
|
|
|
|
||||||
|
|
|
|
= |
1 |
|
(−0,5 −0,8 −0,2 + 0 + 0,2 + 0,6 + 0,8 +1 + 2,4 +1,5) = 0,42 . |
|
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
12 |
P( |
|
|
|
|
<δ )= 2Ф(t) = 0,95. |
|
|
|
|||||||
γ = 0,95 , |
|
|
a − xВ |
|
|
|
|
||||||||||||||
|
|
|
|
|
|||||||||||||||||
δ = |
σ t |
, |
|
σ =σВ* = |
|
В* , |
|
|
|
|
|
|
|||||||||
D |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
n |
|
|
|
|
|
|
1 |
|
|
|
|
|||
|
|
В* = |
|
|
∑ni |
(xi − xВ)2 = |
|
(0,422 + 0,822 |
2 + 0,622 |
+ 0,222 + 0,182 |
+ |
||||||||||
D |
|
||||||||||||||||||||
|
n |
|
|
|
|
||||||||||||||||
|
|
|
|
−1 i =1 |
|
|
|
|
|
11 |
|
|
|
+0,382 + 0,422 + 0,582 + 0,782 2 +1,082 ) = 0,52 ,
σ= 0,52 = 0,72 .
Т.к. |
n < 30 |
и σ |
не |
определено, |
t определяем из таблицы: |
t(γ ; n) = t(0,95; 12) = 2,2 . |
|
|
|
||
δ = |
0,72 2,2 |
= 0,46 |
|
0,42 −0,46 < a < 0,42 + 0,46 , |
|
|
12 |
−0,04 < a < 0,88 с |
γ = 0,95 . |
||
|
|
Пример 7.
По данным выборки объема n =16 из генеральной совокупности найдено исправленное среднее квадратическое отклонение σВ* =1 нормально
распределенного количественного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с вероятно-
стью 0,95.
Решение.
σВ* (1 − q) <σ <σВ* (1 + q) , |
γ = 0,95 , n =16 , |
q(0,95; 16) = 0,44 , |
|
0,56 <σ <1,44 . |
|
§ 3. О статистической проверке гипотез
Пусть дана случайная величина X и проведено n независимых испытаний этой величины, в результате чего получены значения x1 , x2 , …, xn .
Такое множество называют статистической совокупностью.
|
53 |
Положим a = min xi , b = max xi и разделим отрезок [a ; b ] на m равных |
|
i |
i |
частей 1 , 2 , …, m . Пусть ki – количество элементов статистической совокупности, принадлежащих i .
Поставим следующий вопрос: насколько вероятно предположение о том, что данная случайная величина X распределена по дифференциальному закону f (t) ?
|
Этот вопрос решают обычно следующим образом. Предполагают, что |
|
X |
распределена по закону f (t) . Тогда событие, состоящее в том, |
что ре- |
зультаты n ее испытаний окажутся распределенными по интервалам |
1 , 2 , |
|
…, |
m с помощью чисел k1 , k2 , …, km , имеет некоторую вероятность γ , за- |
висящую главным образом от гипотетического распределения f (t) . Если эта вероятность окажется малой, то высказанную гипотезу (о распределении X по закону f (t) ) следует опровергнуть. Если же вероятность γ окажется
близкой к 1, то отвергать гипотезу нет оснований.
Наряду с понятием статистической совокупности используют понятие
статистического ряда. Если расположить интервалы |
i в порядке возраста- |
|
~ |
и для каждого интервала указать |
ki , то получится стати- |
ния их центров xi |
стический ряд. Статистический ряд гораздо более удобен для исследований, чем статистическая совокупность.
Уточнение поставленной задачи заключается в следующем. Каждому интервалу i соответствует вероятность pi того, что случайная величина X
примет значение в этом интервале ( теоретическая вероятность, которая рав-
на ∫ f (t) dt ), а также частота наступления этого события в серии из n испы- |
|||
i |
ki = p* |
|
|
таний, равная |
( эмпирическая вероятность того, что X примет значе- |
||
|
n |
i |
|
|
|
|
ние в i ).
Если сделанная гипотеза справедлива, то в силу закона больших чисел отклонения pi − pi* малы при большом количестве испытаний n .
Для выполнения описанной в общих чертах программы проверки гипотезы необходимо уметь вычислять вероятности того или иного отклонения
набора теоретических частот pi от набора эмпирических частот pi* . Оказывается, что существуют такие функции от случайных величин
p1* , p2* , …, pm* , распределение которых не зависит ни от гипотетического распределения f (t) , ни от количества испытаний n , если только оно велико. Среди таких функций чаще других рассматривают функцию:
|
|
2 |
m |
( p* − p )2 |
m |
(k |
|
− np )2 |
|
|||
|
|
= n ∑ |
= ∑ |
|
|
|||||||
χ |
|
i |
|
i |
|
i |
np |
i . |
(1) |
|||
|
|
p |
i |
|
||||||||
|
|
|
i =1 |
|
|
i =1 |
|
|
|
i |
|
54
Как установлено американским математиком К. Пирсоном, случайная величина χ2 при больших n распределена по дифференциальному закону:
|
0, |
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
||
|
|
|
|
|
|
|||
ϕ |
χ 2 (r, t) = |
|
|
|
|
|
|
|
|
r |
|
r |
|
||||
|
|
Г |
|
|
||||
|
22 |
|
||||||
|
|
|
|
|
|
|||
|
|
|
||||||
|
|
|
2 |
|
|
|
∞
где Г(r) = ⌠⌡ tr −1 e−t dt – гамма функция.
0
t < 0,
|
r −2 |
e− |
t |
(2) |
|
t |
2 |
2 |
, t > 0, |
Функция ϕχ 2 (r, t) табулирована.
Тот факт, что величина χ2 распределена по закону (2), позволяет вы-
числить вероятность того, что случайная величина χ2 принадлежит тому или другому интервалу.
Интерес представляют интервалы [0; h ] и [h ; ∞ ]. В случае хорошего совпадения теоретических и эмпирических частот величина χ2 не будет
принимать слишком больших значений. Поэтому вероятности P(χ2 > h) в случае справедливости гипотезы должны быть малы при больших h .
Можно задать некоторую малую вероятность α и найти hα такое, что P(χ2 > hα ) =α . При этом естественно считать, что в случае, когда полученное из опыта значение χ 2 будет больше, чем hα , гипотезу следует признать
противоречащей опытным данным, в противном случае – непротиворечащей им. В первом случае говорят, что гипотеза несостоятельна на уровне значимости α .
Иногда поступают так. Вычисляют по формуле (1) χ 2 , а затем по таблицам находят вероятность того, что случайная величина χ2 превзойдет зна-
чение χ 2 . Если вероятность такого события мала (это значит, что χ 2 неправдоподобно велико), то гипотеза опровергается.
Параметр r в формуле (2) находится из соотношения
r = m − s , |
(3) |
где m – количество интервалов i ,
s – количество связей, налагаемых на эмпирические частоты pi* .
Чаще всего s =1 ( ∑pi* =1 ) или s = 3 (условия на математическое ожидание
i
и дисперсию).
Распределение ϕχ 2 (r, t) называют χ2 – распределением с r степенями свободы, а изложенный способ проверки гипотез – χ2 – критерием Пирсона.
55
Пример.
Пусть результаты 50 испытаний дали следующее распределение значений величины X по интервалам:
|
|
|
|
|
[8; 10 ] |
|
i |
[0; 2 ] |
[2; 4 ] |
[4; 6 ] |
[6; 8 ] |
Σ |
|
|
|
|
|
|
|
|
ki |
8 |
11 |
9 |
15 |
7 |
50 |
|
|
|
|
|
|
|
Проверить гипотезу о равномерном распределении случайной величины X на отрезке [0; 10 ].
Решение.
p* = 0,16 , |
|
p* |
= 0,22 , |
p* = 0,18 , |
p* = 0,3, |
p* = 0,14 . |
||||||||
1 |
|
2 |
|
h |
|
|
|
|
|
3 |
|
4 |
5 |
|
p = ... = p |
5 |
= 0,2 = |
. |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
||||||
1 |
|
|
L |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
5 |
|
( p* − p )2 |
|
|
||||
|
|
|
|
|
|
|
2 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
∑ |
|
|
||||
По формуле (1) |
|
|
χ |
|
= 50 |
|
i |
i |
= 4 , |
|
||||
|
|
|
|
|
p |
|
||||||||
|
|
|
|
|
|
|
|
|
i =1 |
|
|
i |
|
|
r = m − s = 5 −1 = 4 . По таблице находим, что P(χ2 ≥ χ 2 ) = 0,4060 , следовательно, гипотеза опровергается при уровне значимости более 0,4060.