Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 2003

.pdf
Скачиваний:
3
Добавлен:
30.04.2022
Размер:
3.84 Mб
Скачать

оцениваемый параметр с вероятностью 1-α или в 100(1-α)% случаев.

Часто применяют односторонние доверительные интервалы, границы которых определяются из условия

P(θ<θ2)=1-α или P(θ1)=1-α.

Эти интервалы называются соответственно

левосторонними и правосторонними доверительными интервалами. Выбор доверительной вероятности определяется в каждом случае конкретными условиями. Обычно используемые значения 1-α равны 0,90; 0,95; 0,99. На практике часто рассматривают симметричные доверительные интервалы длиной 2δ. Соотношение (1) в этом случае записывается в виде

P

 

1

или P

 

1 .

(2)

Длина доверительного интервала играет важную роль: чем меньше длина доверительного интервала, тем точнее оценка. Если же длина доверительного интервала велика, то оценка малопригодна для практики.

Из соотношения (1) или (2) и из того, что θ1 и θ2 являются функциями выборки, следует, что длина доверительного интервала определяется двумя величинами: доверительной вероятностью 1-α и объемом п выборки.

Таким образом, величины δ, (1-α), п взаимосвязаны и, задавая определенные значения двум из них, можно определить значение третьей. Процедура нахождения границ доверительного интервала для параметра θ по заданной доверительной вероятности в простейшем случае состоит в следующем.

1. Из ГС с ФР F(x,θ) извлекается выборка объемом п. По этой выборке методом моментов или методом максимального

правдоподобия находится точечная оценка неизвестного параметра θ.

141

2.Составляется некоторая функция элементов выборки

-статистика Y( , ), связанная с параметром θ, такая, что ее

распределение не зависит от θ и других неизвестных параметров.

3.Задается доверительная вероятность (1-α).

4.Зная распределение статистики Y, определяют два числа у1 и y2, удовлетворяющих условию Р(y1<Y<y2)=1-α.

5.Границы доверительного интервала для параметра θ

определяются из решения относительно θ неравенства

y1<Y( , )<y2.

Используем указанную схему для нахождения доверительных интервалов параметров m и ζ нормального закона распределения.

17.2. Доверительный интервал для математического ожидания СВ X, распределенной по закону N(m, σ) при известном σ

Пусть CB X имеет нормальное распределение N(m,ζ). Требуется найти доверительный интервал для параметра m по результатам выборки x1,x2,...,xn объемом п при условии, что дисперсия ζ2 известна, а доверительная вероятность равна 1-α.

В качестве оценки параметра m возьмем выборочное

среднее x

1 n

xi . Рассмотрим выборку x1,x2,...,xn как

 

 

n i

 

1

реализацию случайного вектора (X1,..., Хп) с независимыми компонентами Xi, распределенными по нормальному закону

N(m,ζ). Тогда СВ

X

1 n

Xi , также распределена по

 

 

n i

 

 

1

нормальному закону с тем же МО и дисперсией D(X)=ζ2/n. В качестве статистики Y рассмотрим стандартизованную СВ

U X m , / n

142

имеющую cтандартизованное нормальное распределение

N(0,1), не зависящее от m и ζ. Из определения квантиля

порядка р распределения непрерывной СВ X имеем

 

 

 

 

Up

 

 

 

 

P x

tp

p

или

f x dx

p .

 

 

построения доверительного интервала используется статистика

Отсюда

 

 

 

 

 

 

 

 

u p

 

 

 

-u p

 

 

 

 

f x dx

1

, и, так как

f x

dx

 

/ 2 , то

 

u p

 

 

 

 

 

 

 

 

up

 

 

 

 

 

 

 

 

f x dx

/ 2 1

1

/ 2

p 1

/ 2 .

 

 

 

 

f (x)

 

 

 

 

 

 

 

0.4

 

 

 

 

 

 

 

0.3

 

 

 

 

 

 

 

 

1

a

 

 

 

 

 

 

0.2

 

 

 

 

 

 

 

0.1

 

 

 

 

 

/ 2

 

 

 

 

 

 

/ 2

 

-2

-1

 

 

1

 

 

2

 

u p

 

 

 

 

 

u p

 

Таким образом, up

u1

/ 2 . Очевидно, что u / 2

u1

/ 2 .

Согласно п.4 схемы, приведенной выше,

 

 

 

 

 

 

 

 

 

P

U

u1 / 2 1

P

X m / n

u1 / 2 1 или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

/ n u1

 

/ 2 m X

/ n u1 / 2

1

;

 

 

 

 

 

 

 

 

 

1

u1

/ 2

 

 

 

 

u1

/ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

P

X m /

 

n

u

/ 2

 

 

 

 

e t

/ 2dt 2 / 2

 

e t

/ 2dt ,

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

/ 2

 

 

 

 

0

 

 

так что u1-α/2 (квантиль стандартизованного нормального распределения) определяется как решение уравнения

143

 

 

 

 

 

u1

/ 2

 

u

/ 2

1

/ 2 2 / 2

 

e t2 / 2dt 1

.

1

 

 

 

 

 

 

0

Зная величину u1-α/2 получаем доверительный интервал для МО

 

 

 

 

 

 

 

 

 

 

 

(3)

X

/ n

u1 / 2 ; X

/

n u1

/ 2

 

 

Для u1-α/2

имеется таблица

 

 

 

 

 

 

 

1-α

0,90

 

0,95

0,99

 

0,997

0,999

 

 

u1-α/2

1,64

 

1,96

2,58

 

3,00

3,37

Из анализа полученных соотношений можно сделать следующие выводы.

1.Увеличение объема п выборки приводит к уменьшению длины доверителъного интервала.

2.Увеличение доверительной вероятности (1-α) приводит к увеличению длины доверительного интервала, то есть к уменьшению точности δ.

3.Если задать точность δ, то есть предельную погрешность интервальной оценки, по формуле (2) и

доверительную вероятность 1-α, то из соотношения

.n u1 / 2 можно найти минимальный объем выборки, который обеспечивает заданную точность:

n

2 / u2

.

 

1 / 2

 

17.3. Доверительный интервал для МО СВ X, распределенной

по нормальному закону при неизвестном σ

На практике более естественной является ситуация, когда оба параметра т и ζ нормального распределения неизвестны. В этом случае для

T

X

m

,

 

 

 

 

 

n 1

s0 /

 

n

 

 

144

 

 

 

 

 

n

2 .

где

X - выборочное среднее, а s

1/ n 1

x x

 

0

 

i

 

 

 

 

 

 

i 1

 

В полных курсах математической статистики доказывается, что распределение СВ Тn-1, не зависит от параметров m и ζ нормального распределения, соответствующего выборке, и является распределением Стьюдента с п-1 степенями свободы.

Плотность вероятности распределения Стьюдента с п-1 степенями свободы имеет вид

 

 

 

 

 

 

1

 

 

 

 

 

 

n / 2

 

 

 

 

 

x2

 

n / 2

fT

 

 

x

 

 

 

 

 

 

 

 

1

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

n

1

 

 

 

n

 

 

1 / 2

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

М(Х)=0, D X

 

 

n

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

3

 

 

Определим величину t1

 

 

/ 2,n 1

как решение уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

Tn 1

 

t1 / 2,n 1

P

 

X

 

m

 

 

t1

/ 2,n 1

1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s /

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или вытекающего из него уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

/ 2,n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

fT

 

 

x dx

1

,

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

учитывая при этом Г(1/2)=

 

 

,

Г(п+1)=пГ(п)=n!

 

 

Для доверительного интервала получаем выражение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x s0 /

 

 

n t1

 

/ 2,n 1;

x

 

s0 /

 

 

n

t1 / 2,n 1 .

(4)

Для нахождения квантилей распределения Стьюдента tp имеется таблица. Приведем ее для двух значений доверительной вероятности.

1-α

5

10

20

30

n

 

 

 

 

 

0,95

2,571

2,228

2,086

2,042

1,960

0,99

4,032

3,169

2,845

2,750

2,576

 

 

 

 

 

 

 

 

145

 

 

 

Отметим, что средняя длина доверительного интервала

(4) больше средней длины доверительного интервала (3). В остальном доверительный интервал (4) обладает теми же свойствами, что и интервал (3) для МО при известном ζ.

17.4. Доверительный интервал для σ2 СВ X, распределенной по нормальному закону

Пусть СВ X имеет нормальное распределение N(m,ζ), причем m и ζ неизвестны. Требуется найти доверительный интервал для параметра ζ2 по выборке х1х2,..,xn объемом п с доверительной вероятностью 1-α. В качестве точечных оценок для m и ζ2 возьмем несмещенные оценки

m x

 

1 n

x

 

для m и

 

2

s2

1

 

 

n

 

x

x 2 для ζ2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

i

 

 

 

 

 

 

 

 

 

 

 

0

 

n

1 i 1

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для построения доверительного интервала для

используем следующую статистику:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

n

 

xi

x

2

 

 

 

 

 

 

 

 

 

 

 

 

x x 2

 

 

 

 

 

2

 

 

 

 

s2

 

 

 

 

 

 

 

 

 

 

 

 

.

n

1

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

i

1

 

 

 

 

Ранее было показано, что она имеет распределение

квадрат с п-1 степенью свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

f 2

x

 

 

 

 

 

 

 

 

1

 

 

 

xn / 2 1e

x / 2 , x 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

n / 2

 

n / 2

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

n

1 s2

2

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

1

,

 

 

 

/ 2,n 1

 

 

 

 

 

 

 

2

1

/ 2,n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P s2

 

n

1

 

 

 

2

 

s2

 

n

1

 

 

 

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

/ 2,n 1

 

 

 

 

 

 

/ 2,n

1

 

 

 

 

 

 

ζ2

n2 -

Получаем доверительный интервал

146

 

n

 

1 s2

 

n 1 s2

 

 

 

 

0

;

0

.

2

 

 

2

 

 

 

 

1

 

/ 2,n 1

 

/ 2,n 1

Для квантилей

2

 

имеются таблицы.

p,n 1

 

 

 

 

 

 

Замечание. Так как при п→∞ распределение

2 n

приближается к нормальному, то при достаточно большом объеме выборки (п≥50) доверительный интервал можно найти по формуле

s0

 

s0

 

,

 

 

 

 

 

 

1 u1 / 2 / 2n

1 u1 / 2 / 2n

где u1-α/2 квантиль стандартизованного нормального распределения, соответствующая доверительной вероятности

1-α.

17.5. Сглаживание экспериментальных зависимостей.

Метод наименьших квадратов

Пусть величины X и Y связаны функциональной зависимостью вида Y=θ(Х), причем функция θ нам не известна, и ее требуется определить по результатам наблюдений. Предположим, что имеется возможность экспериментально измерить значение величины Y при различных заданных значениях xi величины X. Обозначая результат i-го измерения через у, можно записать:

yi

xi

i ,

(5)

где i - случайная ошибка измерения с М( i )=0, то есть

yi

является значением СВ.

Если нанести на график точки (xi,yi) и соединить их отрезками прямой, то вид ломаной будет отличаться от кривой у=θ(х) из-за наличия случайных погрешностей при определении ее ординат.

Возникает вопрос: как обработать опытные данные , чтобы наилучшим образом определить зависимость Y от Х?

147

y

 

 

(xn , yn )

 

 

 

(x3 , y3 )

 

 

 

 

 

(x2 , y2 )

 

 

(x1 , y1 )

0

x

Эта задача называется задачей о сглаживании экспериментальных зависимостей. При полном отсутствии информации о характере функции θ(х) невозможно получить достаточно удовлетворительное ее приближение. Рассмотрим случай, когда заранее известно, что функция θ(х) принадлежит к некоторому классу функций, зависящему от одного или нескольких параметров, то есть

θ(х)=θ(х, θ1, θ2,…, θk). (6)

В этом случае отыскание наилучшей функции θ(х) сводится к задаче определения соответствующих параметров θ1, θ2,…, θk по экспериментальным данным. Для определения оценок неизвестных параметров в практике чаще всего применяется метод наименьших квадратов.

Условимся говорить, что неизвестные параметры θ1, θ2,…, θk функции θ(х)=θ(х, θ1, θ2,…, θk), задающей зависимость y=θ(х, θ1, θ2,…, θk) определены наилучшим образом в смысле метода наименьших квадратов, если минимальна величина

 

n

 

2

 

 

 

 

 

2

yi

xi , 1, 2 ,... k

.

(7)

 

i 1

Для нахождения точки минимума величины δ2(θ1, θ2,…, θk) в обычных аналитических условиях нужно приравнять нулю ее частные производные по θ1, θ2,…, θk. При этом получаем

n

 

xi ,

1, 2 ,... k

 

 

yi

xi , 1, 2 ,... k

 

 

0 ,

(8)

 

 

i 1

 

 

j

 

 

148

где 1≤jk, то есть систему k уравнений с k неизвестными, решая которую, определяем искомые оценки параметров θ1,

θ2,…, θk.

Заметим, что система (8) содержит СB yi, поэтому ее решение 1, 2 ,... k также случайно. Величины j являются

оценками неизвестных параметров θj по результатам наблюдений.

В предположении, что величины уi, имеют одинаковые распределения, метод наименьших квадратов может быть применен для оценки неизвестных параметров распределения.

17.6. Линейная регрессия

Для примера рассмотрим оценку по методу наименьших квадратов параметров k и b линейной функции у=kx+b. Пусть из опыта известна совокупность значений (xi,уi,), i=1,2,…,п. Рассмотрим величину

 

 

 

 

 

 

n

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

yi

kxi

b .

 

 

 

 

 

 

 

 

 

Дифференцируя δ2 по k и b, получаем следующую

систему:

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

2

yi

kxi

b xi

0,

 

 

k

 

 

i

1

 

 

 

 

 

 

 

2

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

2

yi

kxi

b

 

0.

 

 

b

 

 

 

i

1

 

 

 

 

 

Из второго уравнения находим

 

 

 

 

 

1

 

n

 

1

n

 

 

kx .

b

 

 

 

 

y

k

 

x

y

 

 

 

 

 

 

 

 

n i

i

 

 

i

 

 

 

 

 

 

1

 

n i 1

 

 

 

Подставляя найденное значение в первое уравнение, приходим к равенству

n

n

 

x y k x2

nx y kx 0 ,

i i

i

 

i 1

i 1

 

 

149

откуда

 

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nx

 

y

yi

 

y xi

x

 

 

 

k

 

i

1

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

x2

 

 

2

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

nx

 

x

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если ввести обозначения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 n

 

 

 

 

 

 

 

2

1

 

n

 

 

 

 

2

 

Kx, y

 

 

 

yi

y xi

x и Sx

 

 

 

 

 

 

 

 

xi x

 

,

 

n i

 

 

 

n i 1

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

то коэффициент k запишется в виде k

 

 

Kx, y

 

.

 

 

 

 

 

 

 

 

S 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

Таким образом, поставленная задача решена и линейная функция

 

 

 

 

 

y

Kx, y

x y

Kx, y

x

S 2

S 2

 

 

 

 

x

 

x

 

наилучшим образом среди всех линейных функций выражает зависимость у от х. Заметим, что величина

1

Kx, y n

n

yi y xi x

i 1

является эмпирическим центральным моментом второго порядка.

Ее применяют в качестве оценки ковариации СВ Х и Y.

18.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

18.1.Статистическая гипотеза. Общий метод построения критериев. Ошибки первого и второго рода

Во многих случаях ФР ГС бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Нередко из некоторых дополнительных соображений могут быть сделаны предположения (гипотезы) о виде ФР.

150