3267
.pdfоцениваемый параметр с вероятностью 1-α или в 100(1-α)% случаев.
Часто применяют односторонние доверительные интервалы, границы которых определяются из условия
P(θ<θ2)=1-α или P(θ1<θ)=1-α.
Эти интервалы называются соответственно
левосторонними и правосторонними доверительными интервалами. Выбор доверительной вероятности определяется в каждом случае конкретными условиями. Обычно используемые значения 1-α равны 0,90; 0,95; 0,99. На практике часто рассматривают симметричные доверительные интервалы длиной 2δ. Соотношение (1) в этом случае записывается в виде
P |
|
1 |
или P |
|
1 . |
(2) |
Длина доверительного интервала играет важную роль: чем меньше длина доверительного интервала, тем точнее оценка. Если же длина доверительного интервала велика, то оценка малопригодна для практики.
Из соотношения (1) или (2) и из того, что θ1 и θ2 являются функциями выборки, следует, что длина доверительного интервала определяется двумя величинами: доверительной вероятностью 1-α и объемом п выборки.
Таким образом, величины δ, (1-α), п взаимосвязаны и, задавая определенные значения двум из них, можно определить значение третьей. Процедура нахождения границ доверительного интервала для параметра θ по заданной доверительной вероятности в простейшем случае состоит в следующем.
1. Из ГС с ФР F(x,θ) извлекается выборка объемом п. По этой выборке методом моментов или методом максимального
правдоподобия находится точечная оценка неизвестного параметра θ.
141
2.Составляется некоторая функция элементов выборки
-статистика Y( , ), связанная с параметром θ, такая, что ее
распределение не зависит от θ и других неизвестных параметров.
3.Задается доверительная вероятность (1-α).
4.Зная распределение статистики Y, определяют два числа у1 и y2, удовлетворяющих условию Р(y1<Y<y2)=1-α.
5.Границы доверительного интервала для параметра θ
определяются из решения относительно θ неравенства
y1<Y( , )<y2.
Используем указанную схему для нахождения доверительных интервалов параметров m и ζ нормального закона распределения.
17.2. Доверительный интервал для математического ожидания СВ X, распределенной по закону N(m, σ) при известном σ
Пусть CB X имеет нормальное распределение N(m,ζ). Требуется найти доверительный интервал для параметра m по результатам выборки x1,x2,...,xn объемом п при условии, что дисперсия ζ2 известна, а доверительная вероятность равна 1-α.
В качестве оценки параметра m возьмем выборочное
среднее x |
1 n |
xi . Рассмотрим выборку x1,x2,...,xn как |
||
|
|
|||
n i |
||||
|
1 |
реализацию случайного вектора (X1,..., Хп) с независимыми компонентами Xi, распределенными по нормальному закону
N(m,ζ). Тогда СВ |
X |
1 n |
Xi , также распределена по |
||
|
|
||||
n i |
|||||
|
|
1 |
нормальному закону с тем же МО и дисперсией D(X)=ζ2/n. В качестве статистики Y рассмотрим стандартизованную СВ
U X m , / n
142
имеющую cтандартизованное нормальное распределение |
||||||||
N(0,1), не зависящее от m и ζ. Из определения квантиля |
||||||||
порядка р распределения непрерывной СВ X имеем |
|
|||||||
|
|
|
Up |
|
|
|
|
|
P x |
tp |
p |
или |
f x dx |
p . |
|
|
|
построения доверительного интервала используется статистика |
||||||||
Отсюда |
|
|
|
|
|
|
|
|
u p |
|
|
|
-u p |
|
|
|
|
f x dx |
1 |
, и, так как |
f x |
dx |
|
/ 2 , то |
|
|
u p |
|
|
|
|
|
|
|
|
up |
|
|
|
|
|
|
|
|
f x dx |
/ 2 1 |
1 |
/ 2 |
p 1 |
/ 2 . |
|
||
|
|
|
f (x) |
|
|
|
|
|
|
|
0.4 |
|
|
|
|
|
|
|
|
0.3 |
|
|
|
|
|
|
|
|
|
1 |
a |
|
|
|
|
|
|
0.2 |
|
|
|
|
|
|
|
|
0.1 |
|
|
|
|
|
|
/ 2 |
|
|
|
|
|
|
/ 2 |
|
-2 |
-1 |
|
|
1 |
|
|
2 |
|
u p |
|
|
|
|
|
u p |
|
|
Таким образом, up |
u1 |
/ 2 . Очевидно, что u / 2 |
u1 |
/ 2 . |
||||
Согласно п.4 схемы, приведенной выше, |
|
|
|
|
|
|
|
|
|
P |
U |
u1 / 2 1 |
P |
X m / n |
u1 / 2 1 или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P X |
/ n u1 |
|
/ 2 m X |
/ n u1 / 2 |
1 |
; |
|
|||||||||||
|
|
|
|
|
|
|
|
1 |
u1 |
/ 2 |
|
|
|
|
u1 |
/ 2 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
2 |
|
P |
X m / |
|
n |
u |
/ 2 |
|
|
|
|
e t |
/ 2dt 2 / 2 |
|
e t |
/ 2dt , |
|||||
|
|
|
|
|
|
||||||||||||||
|
|
|
1 |
2 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
1 |
/ 2 |
|
|
|
|
0 |
|
|
так что u1-α/2 (квантиль стандартизованного нормального распределения) определяется как решение уравнения
143
|
|
|
|
|
u1 |
/ 2 |
|
u |
/ 2 |
1 |
/ 2 2 / 2 |
|
e t2 / 2dt 1 |
. |
|
1 |
|
|
|
|
|
|
0
Зная величину u1-α/2 получаем доверительный интервал для МО
|
|
|
|
|
|
|
|
|
|
|
(3) |
X |
/ n |
u1 / 2 ; X |
/ |
n u1 |
/ 2 |
|
|||||
|
Для u1-α/2 |
имеется таблица |
|
|
|
|
|
||||
|
|
1-α |
0,90 |
|
0,95 |
0,99 |
|
0,997 |
0,999 |
||
|
|
u1-α/2 |
1,64 |
|
1,96 |
2,58 |
|
3,00 |
3,37 |
Из анализа полученных соотношений можно сделать следующие выводы.
1.Увеличение объема п выборки приводит к уменьшению длины доверителъного интервала.
2.Увеличение доверительной вероятности (1-α) приводит к увеличению длины доверительного интервала, то есть к уменьшению точности δ.
3.Если задать точность δ, то есть предельную погрешность интервальной оценки, по формуле (2) и
доверительную вероятность 1-α, то из соотношения
.n u1 / 2 можно найти минимальный объем выборки, который обеспечивает заданную точность:
n |
2 / u2 |
. |
|
1 / 2 |
|
17.3. Доверительный интервал для МО СВ X, распределенной
по нормальному закону при неизвестном σ
На практике более естественной является ситуация, когда оба параметра т и ζ нормального распределения неизвестны. В этом случае для
T |
X |
m |
, |
|
|
|
|
||
|
|
|||
n 1 |
s0 / |
|
n |
|
|
|
144
|
|
|
|
|
n |
2 . |
где |
X - выборочное среднее, а s |
1/ n 1 |
x x |
|||
|
0 |
|
i |
|
||
|
|
|
|
|
i 1 |
|
В полных курсах математической статистики доказывается, что распределение СВ Тn-1, не зависит от параметров m и ζ нормального распределения, соответствующего выборке, и является распределением Стьюдента с п-1 степенями свободы.
Плотность вероятности распределения Стьюдента с п-1 степенями свободы имеет вид
|
|
|
|
|
|
1 |
|
|
|
|
|
|
n / 2 |
|
|
|
|
|
x2 |
|
n / 2 |
|||||
fT |
|
|
x |
|
|
|
|
|
|
|
|
1 |
|
|
|
, |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
n 1 |
|
|
|
|
|
|
n |
1 |
|
|
|
n |
|
|
1 / 2 |
|
|
|
n |
1 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
М(Х)=0, D X |
|
|
n |
1 |
. |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
3 |
|
|
||
Определим величину t1 |
|
|
/ 2,n 1 |
как решение уравнения |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
Tn 1 |
|
t1 / 2,n 1 |
P |
|
X |
|
m |
|
|
t1 |
/ 2,n 1 |
1 , |
||||||||||||
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
s / |
|
|
n |
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
или вытекающего из него уравнения |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
t1 |
/ 2,n 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
fT |
|
|
x dx |
1 |
, |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
n 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
учитывая при этом Г(1/2)= |
|
|
, |
Г(п+1)=пГ(п)=n! |
||||||||||||||||||||||
|
|
|||||||||||||||||||||||||
Для доверительного интервала получаем выражение |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
x s0 / |
|
|
n t1 |
|
/ 2,n 1; |
x |
|
s0 / |
|
|
n |
t1 / 2,n 1 . |
(4) |
Для нахождения квантилей распределения Стьюдента tp имеется таблица. Приведем ее для двух значений доверительной вероятности.
1-α |
5 |
10 |
20 |
30 |
∞ |
|
n |
||||||
|
|
|
|
|
||
0,95 |
2,571 |
2,228 |
2,086 |
2,042 |
1,960 |
|
0,99 |
4,032 |
3,169 |
2,845 |
2,750 |
2,576 |
|
|
|
|
|
|
|
|
|
|
145 |
|
|
|
Отметим, что средняя длина доверительного интервала
(4) больше средней длины доверительного интервала (3). В остальном доверительный интервал (4) обладает теми же свойствами, что и интервал (3) для МО при известном ζ.
17.4. Доверительный интервал для σ2 СВ X, распределенной по нормальному закону
Пусть СВ X имеет нормальное распределение N(m,ζ), причем m и ζ неизвестны. Требуется найти доверительный интервал для параметра ζ2 по выборке х1х2,..,xn объемом п с доверительной вероятностью 1-α. В качестве точечных оценок для m и ζ2 возьмем несмещенные оценки
m x |
|
1 n |
x |
|
для m и |
|
2 |
s2 |
1 |
|
|
n |
|
x |
x 2 для ζ2. |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
n i 1 |
i |
|
|
|
|
|
|
|
|
|
|
|
0 |
|
n |
1 i 1 |
|
i |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Для построения доверительного интервала для |
||||||||||||||||||||||||||||||
используем следующую статистику: |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
n 1 |
|
|
|
|
|
|
1 |
|
n |
|
|
|
|
|
|
|
n |
|
xi |
x |
2 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
x x 2 |
|
|
|
|
|
|||||||||||||
2 |
|
|
|
|
s2 |
|
|
|
|
|
|
|
|
|
|
|
|
. |
||||||||||||
n |
1 |
|
|
|
2 |
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
0 |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
i |
1 |
|
|
|
|
Ранее было показано, что она имеет распределение |
||||||||||||||||||||||||||||||
квадрат с п-1 степенью свободы. |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
f 2 |
x |
|
|
|
|
|
|
|
|
1 |
|
|
|
xn / 2 1e |
x / 2 , x 0 . |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
2 |
n / 2 |
|
n / 2 |
|
|
||||||||||||||||||||
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
2 |
|
|
|
|
|
|
n |
1 s2 |
2 |
|
|
|
|
|
|
|
|
|
|||||||
|
|
P |
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
1 |
, |
|
|||||||||
|
|
/ 2,n 1 |
|
|
|
|
|
|
|
2 |
1 |
/ 2,n |
1 |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P s2 |
|
n |
1 |
|
|
|
2 |
|
s2 |
|
n |
1 |
|
|
|
1 |
. |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
||||||||
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
1 |
|
/ 2,n 1 |
|
|
|
|
|
|
/ 2,n |
1 |
|
|
|
|
|
|
ζ2
n2 -
Получаем доверительный интервал
146
|
n |
|
1 s2 |
|
n 1 s2 |
|||
|
|
|
|
0 |
; |
0 |
. |
|
2 |
|
|
2 |
|||||
|
|
|
|
|||||
1 |
|
/ 2,n 1 |
|
/ 2,n 1 |
||||
Для квантилей |
2 |
|
имеются таблицы. |
|||||
p,n 1 |
||||||||
|
|
|
|
|
|
Замечание. Так как при п→∞ распределение
2 n
приближается к нормальному, то при достаточно большом объеме выборки (п≥50) доверительный интервал можно найти по формуле
s0 |
|
s0 |
|
, |
||
|
|
|
|
|
|
|
1 u1 / 2 / 2n |
1 u1 / 2 / 2n |
где u1-α/2 квантиль стандартизованного нормального распределения, соответствующая доверительной вероятности
1-α.
17.5. Сглаживание экспериментальных зависимостей.
Метод наименьших квадратов
Пусть величины X и Y связаны функциональной зависимостью вида Y=θ(Х), причем функция θ нам не известна, и ее требуется определить по результатам наблюдений. Предположим, что имеется возможность экспериментально измерить значение величины Y при различных заданных значениях xi величины X. Обозначая результат i-го измерения через у, можно записать:
yi |
xi |
i , |
(5) |
где i - случайная ошибка измерения с М( i )=0, то есть |
yi |
является значением СВ.
Если нанести на график точки (xi,yi) и соединить их отрезками прямой, то вид ломаной будет отличаться от кривой у=θ(х) из-за наличия случайных погрешностей при определении ее ординат.
Возникает вопрос: как обработать опытные данные , чтобы наилучшим образом определить зависимость Y от Х?
147
y
|
|
(xn , yn ) |
|
|
|
(x3 , y3 ) |
|
|
|
|
|
(x2 , y2 ) |
|
|
(x1 , y1 )
0 |
x |
Эта задача называется задачей о сглаживании экспериментальных зависимостей. При полном отсутствии информации о характере функции θ(х) невозможно получить достаточно удовлетворительное ее приближение. Рассмотрим случай, когда заранее известно, что функция θ(х) принадлежит к некоторому классу функций, зависящему от одного или нескольких параметров, то есть
θ(х)=θ(х, θ1, θ2,…, θk). (6)
В этом случае отыскание наилучшей функции θ(х) сводится к задаче определения соответствующих параметров θ1, θ2,…, θk по экспериментальным данным. Для определения оценок неизвестных параметров в практике чаще всего применяется метод наименьших квадратов.
Условимся говорить, что неизвестные параметры θ1, θ2,…, θk функции θ(х)=θ(х, θ1, θ2,…, θk), задающей зависимость y=θ(х, θ1, θ2,…, θk) определены наилучшим образом в смысле метода наименьших квадратов, если минимальна величина
|
n |
|
2 |
|
|
|
|
|
|
2 |
yi |
xi , 1, 2 ,... k |
. |
(7) |
|
i 1
Для нахождения точки минимума величины δ2(θ1, θ2,…, θk) в обычных аналитических условиях нужно приравнять нулю ее частные производные по θ1, θ2,…, θk. При этом получаем
n |
|
xi , |
1, 2 ,... k |
|
|
yi |
xi , 1, 2 ,... k |
|
|
0 , |
(8) |
|
|
||||
i 1 |
|
|
j |
|
|
148
где 1≤j≤k, то есть систему k уравнений с k неизвестными, решая которую, определяем искомые оценки параметров θ1,
θ2,…, θk.
Заметим, что система (8) содержит СB yi, поэтому ее решение 1, 2 ,... k также случайно. Величины j являются
оценками неизвестных параметров θj по результатам наблюдений.
В предположении, что величины уi, имеют одинаковые распределения, метод наименьших квадратов может быть применен для оценки неизвестных параметров распределения.
17.6. Линейная регрессия
Для примера рассмотрим оценку по методу наименьших квадратов параметров k и b линейной функции у=kx+b. Пусть из опыта известна совокупность значений (xi,уi,), i=1,2,…,п. Рассмотрим величину
|
|
|
|
|
|
n |
|
|
|
2 |
|
|
|
|
2 |
|
|
|
|
|
|
||||
|
|
|
yi |
kxi |
b . |
|
||||||
|
|
|
|
|
|
|
|
|||||
Дифференцируя δ2 по k и b, получаем следующую |
||||||||||||
систему: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
yi |
kxi |
b xi |
0, |
||
|
|
k |
||||||||||
|
|
i |
1 |
|
|
|
|
|
||||
|
|
2 |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
yi |
kxi |
b |
|
0. |
|
|
|
b |
|
|||||||||
|
|
i |
1 |
|
|
|
|
|
||||
Из второго уравнения находим |
|
|
|
|||||||||
|
|
1 |
|
n |
|
1 |
n |
|
|
kx . |
||
b |
|
|
|
|
y |
k |
|
x |
y |
|||
|
|
|
|
|
||||||||
|
|
|
n i |
i |
|
|
i |
|
|
|
||
|
|
|
1 |
|
n i 1 |
|
|
|
Подставляя найденное значение в первое уравнение, приходим к равенству
n |
n |
|
x y k x2 |
nx y kx 0 , |
|
i i |
i |
|
i 1 |
i 1 |
|
|
149 |
откуда
|
|
|
n |
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi yi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nx |
|
y |
yi |
|
y xi |
x |
|
|
||||||||||||||
|
k |
|
i |
1 |
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
n |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
||
|
|
|
|
x2 |
|
|
2 |
|
|
x |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
nx |
|
x |
|
|
||||||||||||||||||
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
i 1 |
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если ввести обозначения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
1 n |
|
|
|
|
|
|
|
2 |
1 |
|
n |
|
|
|
|
2 |
|
|||||||
Kx, y |
|
|
|
yi |
y xi |
x и Sx |
|
|
|
|
|
|
|
|
xi x |
|
, |
|||||||||
|
n i |
|
|
|
n i 1 |
|
||||||||||||||||||||
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
то коэффициент k запишется в виде k |
|
|
Kx, y |
|
. |
|
|
|
|
|
||||||||||||||||
|
|
|
S 2 |
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
Таким образом, поставленная задача решена и линейная функция
|
|
|
|
|
|
y |
Kx, y |
x y |
Kx, y |
x |
|
S 2 |
S 2 |
||||
|
|
|
|||
|
x |
|
x |
|
наилучшим образом среди всех линейных функций выражает зависимость у от х. Заметим, что величина
1
Kx, y n
n
yi y xi x
i 1
является эмпирическим центральным моментом второго порядка.
Ее применяют в качестве оценки ковариации СВ Х и Y.
18.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
18.1.Статистическая гипотеза. Общий метод построения критериев. Ошибки первого и второго рода
Во многих случаях ФР ГС бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Нередко из некоторых дополнительных соображений могут быть сделаны предположения (гипотезы) о виде ФР.
150