- •Кафедра “Прикладная и вычислительная математика”
- •Е.А. Коган
- •Москва 2007
- •Теорема сложения вероятностей для несовместных событий.
- •3.6. Показательный (экспоненциальный ) закон распределения
- •5. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
- •Пусть имеется последовательность независимых случайных величин
- •Теорема Бернулли
- •Часть вторая
- •МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
- •В настоящем пособии рассмотрены основные понятия математической статистики, наиболее часто используемые и определяемые в процессе статистической обработки опытных данных. Даны 30 вариантов домашнего задания для самостоятельной работы студентов.
- •6. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
- •Свойства
- •По формуле (7.3) имеем
- •При этом
- •Замечания.
- •Итак, выборки должны содержать не менее 60 лампочек.
- •Плотность вероятностей распределения Стьюдента равна
- •Поэтому вероятность осуществления неравенства (7.10) равна
- •Сумма всех частот (общее число наблюдений) равна
- •Интервалы Δ, мк
- •Значения Y
- •Согласно методу наименьших квадратов неизвестные параметры ai выбираются так, чтобы сумма квадратов отклонений была минимальной
- •Из (10.9) следует, что
- •ВАРИАНТ 1
- •ВАРИАНТ 2
- •ВАРИАНТ 3
- •ВАРИАНТ 4
- •ВАРИАНТ 5
- •ВАРИАНТ 6
- •ВАРИАНТ 7
- •ВАРИАНТ 8
- •ВАРИАНТ 9
- •ВАРИАНТ 10
- •ВАРИАНТ 12
- •ВАРИАНТ 13
- •ВАРИАНТ 14
- •ВАРИАНТ 15
- •ВАРИАНТ 16
- •ВАРИАНТ 17
- •ВАРИАНТ 18
- •ВАРИАНТ 19
- •ВАРИАНТ 20
- •ВАРИАНТ 21
- •ВАРИАНТ 22
- •ВАРИАНТ 23
- •ВАРИАНТ 24
- •ВАРИАНТ 25
- •ВАРИАНТ 26
- •ВАРИАНТ 27
- •ВАРИАНТ 28
- •ВАРИАНТ 29
- •ВАРИАНТ 30
110
Пример. Объем генеральной совокупности N = 10000, объем выборки n=1000. В результате измерения интересующего нас признака X получено: xв =15,5, D(X) = 3,15. Найти вероятность того, что среднее значение признака Х отличается от своей оценки на величину ε ≤ 0,1, если выборка повторная; бесповторная.
|
|
|
|
Выборка повторная: |
|
||||
|
|
|
|
По формуле (7.3) имеем |
|||||
|
|
|
|
|
|
|
ε |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
P( |
xв − x0 |
<ε)= 2Ф |
|
|
, |
|
|
||||||||
где σ = |
σ |
0 |
|
. |
|
σ |
|
||
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||
|
|
n |
|
|
|
|
Заменяя неизвестное σ , его оценкой, получим
σ0 ≈σ = D(X)= 3,15 =1,775,
следовательно,
|
σ |
|
|
|
|
1,775 |
|
|
|
|
|
|
|
|
|
|
P( |
|
|
|
|
|
|
|
≤ 0,1) |
|
|
0,1 |
|
|
|
||||||||||
σ = |
|
|
|
|
= |
|
|
|
|
|
|
|
= 0,056 |
и |
|
15,5− x0 |
= 2Ф |
|
|
|
= |
0,9265. |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
0,056 |
|||||||||||||||||||||||||||||
|
n |
|
|
1000 |
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Выборка бесповторная. |
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При этом |
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
σ |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
σ |
|
|
|
n |
|
|
3,15 |
|
|
|
1000 |
|
|
|
|
|
||||||||||||||
σ = |
|
|
|
0 |
|
1 |
− |
|
|
|
|
|
≈ |
|
n |
1 |
− |
|
|
|
|
= |
|
|
|
|
|
1− |
|
|
|
= 0,053 |
и |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1000 |
10000 |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
N |
|
|
|
|
|
N |
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
P( |
|
|
|
|
|
≤ 0,1)= |
|
|
0,1 |
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
15,5− x0 |
2 Ф |
|
|
|
|
= 0,9412. |
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
0,053 |
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7.5. Метод максимального правдоподобия
Для построения точечных оценок в статистике применяют различные методы: метод максимального правдоподобия, метод моментов, метод наименьших квадратов. Ограничимся первым из них.
Пусть X – случайная величина, которая в результате n независимых опытов приняла значения: x1, x2 ,...,xn , и пусть закон распределения X из-
111
вестен, но с точностью до некоторого параметра a, от которого он зав и- сит. Требуется найти подходящую точечную оценку a параметра a.
Введем обозначение: P(X = xi ) = P(xi ,a) и составим функцию L, равную произведению вероятностей независимых событий X = x1,...,X = xn , то есть вероятности их совместного осуществления:
L(x1,x2 ,...,xn ,a) = P(x1,a) P(x2 ,a) ... P(xn ,a).
Функция L(x1,x2 ,...,xn ,a) аргумента a (xi −фиксированные числа) называется функцией правдоподобия дискретной случайной величины X.
Идея метода заключается в том, что в качестве точечной оценки параметра a принимается такое значение a , при котором функция правдоподобия принимает максимальное значение. Действительно, в экспериментах реализуются обычно именно те значения x1, x2 ,...,xn случайной величины X, вероятность которых максимальна.
Оценку a называют оценкой максимального правдоподобия.
Для отыскания максимума функции правдоподобия применяются обычные правила отыскания экстремума функции:
Решается уравнение |
dL |
= 0 (его называют уравнением правдопо- |
||||||
|
da |
|
|
|
|
|
|
|
добия), затем вычисляется вторая производная |
d 2 L |
. |
Если она при |
a = |
a |
|
||
da2 |
|
|||||||
|
|
|
|
|
|
|
|
отрицательна, то a - точка максимума. Найденную точку максимума a и принимают за оценку наибольшего правдоподобия параметра a.
Замечания.
1.Функции L и lnL достигают максимума при одном и том же значении параметра a Поэтому вместо отыскания максимума функции L часто ищут максимум функции lnL – логарифмической функции правдоподобия, что оказывается удобнее.
2.Для непрерывной случайной величины X функцией правдоподобия называется функция параметра a вида:
L(x1,x2 ,...,xn ,a) = f (x1,a) f (x2 ,a) ... f (xn ,a),
где f (xi ,a) - плотность вероятностей.
112
Оценка максимального правдоподобия неизвестного параметра распределения непрерывной случайной величины строится так же, как и для дискретной случайной величины.
Пример. Найти методом максимального правдоподобия оценки параметров a и σ нормального закона распределения:
(x−a)2
f (x) = σ 12π e− 2σ 2 ,
если значения, принятые случайной величиной X в результате n испытаний равны: x1, x2 ,...,xn .
Так как нормальный закон распределения характеризуется двумя параметрами a1 = a и a2 =σ, то функция правдоподобия будет функцией
двух переменных:
|
|
1 |
|
|
|
(x |
−a)2 |
|
1 |
|
|
|
(x |
−a)2 |
|
1 |
|
|
|
(x |
−a)2 |
||||||
L = |
|
|
e |
− |
1 |
|
2 |
|
|
e |
− |
2 |
|
2 |
... |
|
e |
− |
n |
|
2 |
||||||
|
|
|
|
|
2σ |
|
|
|
|
|
2σ |
|
|
|
|
|
2σ |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
σ |
|
2π |
|
|
|
|
σ 2π |
|
|
|
|
σ 2π |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Логарифмируя это выражение, получим:
|
|
|
|
|
|
|
|
− |
∑(x |
−a)2 |
||
|
|
1 |
|
|
i |
|
= −nlnσ + ln( |
|||||
|
|
|
|
|
|
|
|
|
||||
ln L = ln |
|
|
|
|
|
+ lne |
|
2σ 2 |
||||
|
n |
|
|
|
|
n |
|
|||||
( |
|
2π ) |
|
|||||||||
σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑(x |
−a)2 |
|
|
|
1 |
|
e− |
i |
|
|
= |
|
|
|
2σ 2 . |
||||
|
|
|
|
|
||||
σ n ( |
|
2π )n |
||||||
|
|
|
|
|
2π )−n − ∑(xi −2 a)2 .
2σ
Частные производные от логарифмической функции правдоподобия по a и σ равны:
|
∂ln L |
= − |
|
1 |
|
[− 2(x1 |
− a) − 2(x2 − a) −...− 2(xn − a)]= |
1 |
∑(xi − na), |
|||||
|
∂a |
2σ 2 |
σ 2 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|||||
|
∂ln L |
= − |
n |
+ |
∑(xi |
− a)2 |
. |
|
|
|
|
|||
|
∂σ |
|
σ |
σ |
3 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||||
Поэтому система уравнений правдоподобия примет вид |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
∂ln L = 0, |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
∂a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ln L |
= 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
∂σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
или
113
σ12 ∑(xi − na)= 0,
− n + ∑(xi − a)2 = 0.
σ σ 3
Решая эту систему, получим:
a = |
∑xi |
, |
σ |
2 |
= |
∑(xi − a)2 |
. |
n |
|
n |
|||||
|
|
|
|
|
|
Следовательно, искомые оценки максимального правдоподобия бу-
дут:
|
|
|
|
|
|
|
|
|
|
|
|
∑xi |
|
|
|
|
|
|
∑(xi − a )2 |
|
|
a = |
= xв, |
σ* = D |
* |
= |
|
. |
||||
n |
|
|
n |
|||||||
|
|
|
|
|
|
|
|
|
7.6. Точность оценки. Доверительный интервал и доверительная вероятность
Точечные оценки параметров распределения при выборках малого объема могут существенно отличаться от действительных значений оцениваемых параметров. Поэтому в статистике часто пользуются интервальными оценками (особенно при небольшом числе наблюдений), которые служат для оценки точности и надежности точечных оценок. Интервальной называется оценка, которая определяется двумя числами – концами интервала, в котором заключено неизвестное значение параметра.
Пусть для неизвестного параметра θ найдена по данным выборки несмещенная оценка θ*. Чтобы оценить возможную при этом ошибку, назначим некоторую достаточно большую вероятность γ такую, что любое событие, происходящее с вероятностью γ, можно считать практически достоверным. Найдем далее такое ε > 0, при котором с вероятностью γ можно утверждать, что отклонение θ* от θ по модулю не будет превосходить ε, то есть
P( |
|
θ −θ |
|
<ε)=γ |
или |
P(θ −ε <θ <θ +ε)=γ. |
|
|
Величина ε называется точностью оценки. Вероятность γ, с которой осуществляется неравенство θ −θ <ε , называется доверительной
114
вероятностью или надежностью оценки. Обычно γ задается равным 0,95;
0,99; |
0,999. |
|
|
|
|
|
Интервал Iγ = |
|
θ* −ε; θ + ε |
|
, в котором с надежностью γ заклю- |
|
|
|
|||
|
|
|
|
|
|
чено неизвестное значение параметра θ, называется доверительным интервалом. Так как длина интервала и положение его на оси абсцисс, определяемое центром θ*, случайны, то говорят, что доверительный интервал Iγ накрывает неизвестный параметр θ с заданной надежностью γ.
|
|
7.7. Доверительный интервал для оценки |
|
|
генеральной средней при известном среднем |
|
|
квадратическом отклонении |
|
Пусть для случайной величины X с неизвестной генеральной сред- |
|
ней |
x0 по данным выборки объема n найдена точечная оценка |
|
xв = |
n |
Будем предполагать для простоты, что σ(xв ) известно. Для |
1∑xi . |
||
|
n i=1 |
|
построения доверительного интервала необходимо найти такое ε > 0, чтобы выполнялось неравенство
|
|
|
P( |
|
xв − x0 |
|
<ε)=γ . |
|
|||||
|
|
|
|
|
|
||||||||
Воспользуемся тем, что |
xв |
|
как сумма независимых |
одинаково рас- |
|||||||||
пределенных случайных величин |
|
Xi при достаточно большом n (а прак- |
|||||||||||
тически уже при n >10-20) |
согласно теореме Ляпунова имеет закон рас- |
||||||||||||
пределения, близкий к нормальному. Итак, считая, что X распределена по |
|||||||||||||
нормальному закону с параметрами M (xв )= x0 |
(так как |
xв -несмещенная |
|||||||||||
оценка) и σ(xв ), можно записать |
|
|
|
|
|
|
|
|
|
|
|||
P( |
|
xв − x0 |
|
<ε)= 2Ф |
ε |
|
. |
|
|||||
|
|
|
|||||||||||
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
σ |
|
|
Учитывая, что вероятность Р задана и равна γ, получим
P(xв − tσ < x0 < xв + tσ )= 2Ф(t)=γ,