- •Работа n4. Доверительные границы и интервалы
- •Основные положения
- •Определения и построение интервалов
- •Уровень доверия
- •Интервалы для параметров нормального распределения
- •Задание на самостоятельную работу
- •Выполнение в пакете statgraphics
- •Выполнение в пакете statistica
- •Выполнение в пакете spss
- •Заключение
- •Литература
Работа n4. Доверительные границы и интервалы
результатом применения тчечной оценкиâ(x1,...,xn)является одно числовое значение; оно не дает представления о точности, т.е. о том, насколько близко полученное значение к истинному значению параметра. Интуитивно ясно, что такое представление может дать, например, дисперсия оценки, так что истинное значение должно находиться где-то в пределах
â (24)
Внесем уточнения.
Основные положения
Определения и построение интервалов
Пусть (x1,...,xn) x -nнезависимых наблюдений над случайной величиной с законом распределенияF(z/a),зависящим от параметраa, значение которого неизвестно.
Определение 1.Функция наблюденийa1(x1,...,xn) (заметим, что это случайная величина) называется нижней доверительной границей для параметраaс уровнем доверияРД(обычно близким к 1), если при любом значении
P{ a1(x1,...,xn) a} PД
Определение 2.Функция наблюденийa2(x1,...,xn) (случайная величина) называется верхней доверительной границей для параметрас уровнем доверия РД, если при любом значении
P{ a2(x1,...,xn) a} PД.
Определение 3.Интервал со случайными концами (случайный интервал)
I(x) = ( a1(x), a2(x) ) ,
определяемый двумя функциями наблюдений, называется доверительным интервалом для параметра aс уровнем доверияРД , если при любом значенииa
P{I(x)a } P{ a1(x1,...,xn) a a2(x1,...,xn) } PД ,
т.е. вероятность(зависящая отa)накрытьслучайныминтерваломI(x) истинное значениеa -велика: больше или равнаРД.
Построение доверительных границ и интервалов.Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики=(x1,...,xn), по которой оценивается неизвестный параметр (такой статистикой может быть оценка = â(x1,...,xn)). Один из способов построения состоит в следующем. Предположим, что некоторая случайная величина=(, a), зависящая от статистикии неизвестного параметраaтакова, что
1) закон распределения известен и не зависит отa;
2) (, a) непрерывна и монотонна по.
Выберем диапазон для интервалтак, чтобы попадание в него было практически достоверно:
P{ f1 (, a) f2 } PД , (1)
для чего достаточно в качестве ивзять квантили распределенияуровня (1- РД)/2 и (1+ РД )/2 соответственно. Перейдем в (1) к другой записи случайного события, разрешив неравенства относительно параметраa; получим (полагая, чтомонотонно возрастает по):
P{ g(, f1) a g(, f2) } PД.
Это соотношение верно при любом значении параметра a(поскольку это так для (1)), и потому, согласно определению, случайный интервал
( g(, f1) , g(, f2) )
является доверительным для aс уровнем доверияРД .Еслиубывает по, интервалом является( g(, f2) , g(, f1) ).
Для построения односторонней границы для aвыберем значенияитак, чтобы
P{ (, a) f1 } PД, f1=Q(1 - PД)
или P{ (, a) f2 } PД , f2 = Q( PД),
где квантиль уровня. После разрешения неравенства под знакомполучим односторонние доверительные границы дляa.
Пример.Доверительный интервал с уровнем доверияРД для среднегоaнормальной совокупности при известной дисперсии.
Пусть x, ... , xn- выборка из нормальнойN(a, ) совокупности.Достаточной оценкой дляаявляется
â=â(x,...,xn) =,
распределенная по закону N(a,) ; пронормируем её, образовав случайную величину
, (2)
которая распределена нормально N(0,1) при любом значенииа.
По заданному уровню доверия РД определим дляотрезок-fp,fpтак, чтобы
, (3)
т.е. fp - квантиль порядка (1+ РД )/2 распределения N(0,1); заметим, чтозависит ота, но (3) верно при любом значенииа. Подставим в (3) выражение для из (2) и разрешим неравенство под знаком вероятности в (3) относительноа; получим соотношение
, (4)
верное при любом значении а. под знаком вероятности две функции наблюдений
, (5)
определяют случайный интервал
I(x1, ... , xn) =(a1( x1, ... , xn), a2( x1, ... , xn)), (5a)
который в силу (4) обладает тем свойством , что накрывает неизвестное значение параметра ас большой вероятностьюРД при любом значенииа, и потому, по определению доверительно интервала, он является доверительным с уровнем доверияРД .
В общем случае случайную величинув (1) можно построить следующим образом. Определим функцию распределенияF(z/a) статистики(F, конечно, зависит ота). Для непрерывной случайная величина(, а) F( /a), как нетрудно видеть, распределена равномерно на отрезке0, 1при любом значенииа; приняв f1= (1- PД)/2, f2 =(1+PД)/2, будем иметь в качестве (4)
P{f1 F( /a) f2} = PД .
Для дискретной ситуация аналогична.
Можно рассуждать иначе: при любом фиксированном значении аопределим отрезокz1(a), z2(a) так, что
P{ z1(a) z2(a) } РД ;(6)
ясно, что в качествеz1 и z2 можно взять квантили, т.е. определить из условий
F(z!/a)=(1- РД )/2, F(z2/a)=(1+ РД )/2.
Если z1(a)иz2(a)монотонно возрастают поа,то, разрешив два неравенства под знакомРв (6) и учитывая, что z1(a) < z2(a), получим:
P{ z2-1() a z1-1()} РД ,
вверное при любом а; ясно, что интервал (z2-1() , z1-1()), определяемый двумя функциями от , является доверительным с уровнем доверияРД.