Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

terver_23-60

.pdf
Скачиваний:
7
Добавлен:
14.05.2015
Размер:
242.34 Кб
Скачать

Производную суммы искать ощутимо проще чем производную произведения, а точки экстремума у 6 и 7 совпадают

Пример.

0 1

P p

1-p

0

1

mn

L = pm(1 − p)n

 

ln L = m ln p + n ln(1 − p)

(ln L)=

m

 

 

n

 

=

m − mp − np

=

m − p(m + n)

p

1

 

p

 

 

 

 

 

 

p(1

p)

 

p(1

p)

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда оценка вероятности Θ

= p =

m

 

 

 

 

 

 

 

 

 

 

 

 

m + n

 

 

 

 

Получили ту же самую оценку для вероятности что и при методе моментов - относительную частоту события.

Зам. Если оцениваемых параметров несколько, метод по сути не меняется.

L1; : : : ; Θl) = A(P1n1 1; : : : ; Θl)P2n2 1; : : : ; Θl)Pknk 1; : : : ; Θl))

@L1; : : : ; Θl)

= 0 i = 1; l

@Θi

(b)Непрерывная случайная величина Рассмотрим общий случай - k-мерную непрерывную случайную величину с плотностью p(x1; x2; : : : ; xn). Вокруг т. xi возьмем некоторый интервал dxi. Вероятность попасть в k-мерный параллелепипед с центром в т.(x1; x2; : : : ; xn) и с ребрами длины dx1; : : : ; dxk равна

P(x1

dx1

< 1

< x1 +

dx1

; : : : ; xk

 

dxk

< k < xk +

 

dxk

) =

2

2

2

2

 

 

k

 

 

 

 

 

 

 

 

k

 

 

 

 

(8)

 

 

 

dxi

 

 

 

dxi

i

 

 

 

 

 

=

P(xi

2

< i < xi +

2

) =

 

P(xi; Θ)dxi

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

xi не зависит от длины ребер.

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

k

 

 

L(x1; x2; : : : ; xn; Θ) =

P(xi; Θ)

 

lnL(x1; x2; : : : ; xn; Θ) =

 

 

ln(P(xi; Θ))

 

 

 

 

=1

 

 

 

 

 

 

 

i=1

 

 

Далее аналогично.

Достоинства метода:

Уравнение максимального правдоподобия имеет решение, которое является состоятельной оценкой для оцениваемого параметра.

Оценка является асимптотически эффективной для оцениваемого параметра.

11

Решение уравнения максимального правдоподобия является асимптотически нормальным распределением. Это значит что при n → ∞ распределение стремится к нормальному.

Если у параметра существует эффективная оценка, то она будет получена методом максимального правдоподобия.

Недостатки метода:

Оценка по методу максимального правдоподобия может оказаться смещенной.

Громоздкость метода.

12

3ОСНОВНЫЕ РАСПРЕДЕЛЕНИЯ

3.1Квантиль и квартиль

Квантилью порядка p функции распределения F(x) называется обратное распределение p = F 1(p). То есть F ( p) = p. 0<p<1. Нарисовать график функции распределения и показать где откладывается квантиль (на оси Ox). Медиана - квантиль порядка 1/2. Квартиль - квантиль порядка 1/4 или 3/4.

3.2Основные распределения теории вероятностей

Напомним основные распределения тервера, потому что они активно будут использоваться в дальнейшем в рамках данного курса.

Распределение

Плотность,

функция

распределе-

Матожидание, дисперсия

 

ния

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Равномерное

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a + b

 

 

на [a, b]

 

0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

X

=

 

 

 

P (x) =

1

 

 

 

 

 

 

если x = [a; b]

[

 

] (b

 

 

 

2a)2

 

 

 

 

 

 

 

 

 

 

 

;

 

если a<x<b

D[X] =

 

 

b

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

0;

 

 

 

 

 

 

 

 

 

 

 

 

 

x < a

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x) =

 

x − a

;

 

если a < x < b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

a

если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если x > b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показательное

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

с пар-ром

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0;

 

 

 

 

 

 

 

 

 

если x < 0

M[X] =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P (x) = { e− x;

 

 

если x ≥ 0

D[X] =

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0;

 

 

 

 

 

 

 

 

 

 

 

 

если x < 0

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x) = {1 − e− x;

если x ≥ 0

 

 

 

 

 

 

 

 

 

 

 

 

Нормальное с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x − m)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пар-рами ;

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

M[X] = m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2

 

 

 

 

 

 

 

 

 

 

 

 

N( ; )

P (x) =

 

 

 

 

 

e

D[X] = 2

2

 

 

 

 

 

1

 

 

 

 

 

 

 

x

 

 

( − m)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x) =

 

 

e

2 2 d

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−∞

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Нарисовать графики плотностей и функций распределений.

1. Равномерное распределение. Характеризуется равной вероятностью в лю-

13

бой точки отрезка. Пример: равномерной случайной величиной на [a,b] является координата случайно выбранной точки на отрезке.

2.Показательное распределение. Характеризуется свойством отсутствия памяти:

P(x1 < < x1 + ∆x) = 1 − ex = P(x2 < < x2 + ∆x)

Пример: Время работы большинства современных технических устройств. Вероятность, что телевизор проработает еще год одинакова, несмотря на то сколько он уже проработал: хоть 1 год, хоть 10 лет.

3.Нормальное распределение. Характеризуется наибольшей вероятностью средних значений и уменьшения вероятностей при смещения к крайним значениям. Пример: считается, большинство реальных случайных величин распределены по нормальному закону.

Стандартизация нормального распределения: Приведение к стандартному нормальному распределения N(0,1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

 

 

 

x −

 

 

 

1

 

 

 

 

 

(x) = F

 

(

) =

 

e 2

 

d

 

 

 

 

 

 

 

 

N(0;1)

 

N( ; )

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−infty

 

 

 

 

 

F

 

(x) =

1

 

+ Φ(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N(0;1)

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ(x) - табличная функция (Лапласа)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x

 

2

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

e 2 d

 

 

 

 

 

 

Φ(x) =

 

 

 

 

 

 

 

2

 

 

 

 

 

.

Эти распределения интересны нам именно потому, что они моделируют многие явления реальной жизни и могут использоваться как приблизительные распределения рассматриваемых в статистике наблюдений.

3.3Основные распределения статистики

0; 1; : : : ; n - независимые стандартизованные нормально распределенные случайные величины. ( i N(0; 1))

Величина 2n = 12 + · · · + n имеет распределение хи-квадрат с n степенями свободы. Обозначается 2(n − 1).

Величина n =

 

0

=

0

имеет распределение Стьюдента с n

 

 

n1 12 + · · · + n

n1 Ξn2

степенями свободы (t-распределение).

14

 

2

; 2

- величины,

распределенные по хи-квадрат со степенями свободы n1

 

 

n1

n2

 

n2

1

=n1

 

 

и n2. Величина Fn1;n2

=

 

 

 

имеет распределение Фишера со степенями

 

n2

2

=n2

свободы n1 и n2.

Плотности этих величин могут быть найдены в явном виде, однако они довольно громоздки и не используются в дальнейшем, так как все эти распределения протабулированы. Это значит что есть таблицы, по которым можно найти любую квантиль распределения по заданному x и степеням свободы.

Теорема 1

 

x1; x2; : : : ; xn - выборка из нормально распределенной генеральной со-

 

вокупности с параметрами (a, ).

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

1

n

1

 

n

 

 

 

 

 

 

X =

n

xi

m2(X) =

n

 

(xi − X)2

 

 

 

 

 

 

 

 

 

=1

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nm2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X и m2(X) являются взаимно независимыми, причем X N(a;

 

) Тогда

 

 

2

n

имеет распределение хи-квадрат с (n-1) степенью свободы. (

nm2

 

 

 

2(n − 1))

 

 

2

 

 

Доказательство. Без доказательства

 

 

 

 

 

 

 

 

 

 

Теорема 2

 

x1; x2; : : : ; xn - выборка из нормально распределенной генеральной со-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вокупности с параметрами (a,

 

). Тогда

X − a√

 

 

 

 

 

 

имеет распределение Стью-

n

 

1

 

 

 

 

 

 

 

 

 

 

 

 

m2

 

 

 

 

 

 

 

 

 

дента с (n-1) степенью свободы. (

X

 

− a√

 

 

 

 

 

 

 

t(n

 

 

 

 

 

1)

)

 

 

 

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство.

 

Без доказательства

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теорема 3

 

 

 

 

(x1; x2; : : : ; xn1 ), (x1; x2; : : : ; xn

2 ) - 2 выборки из нормально распреде-

 

 

 

 

 

 

 

 

ленной генеральной совокупности с параметрами (a, ).

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m2(X) =

 

n1

(xi

x

)2

 

 

m2(X) =

 

n2

 

=1

(xi− x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

m2 n1(n2 1)

имеет распределение Фишера с

n

 

 

 

 

1

,

n

2

1

степенями свободы.

m2

 

n2(n1 1)

 

 

1

 

 

 

 

 

 

 

x

− a√

 

 

 

 

 

t(n

 

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство. Следует из определения распределения Фишера и теоремы 1.

По теореме 1:

n1m2

 

n2m

 

2(n1 1)

2

2(n2 1)

2

2

15

По определению распределения Фишера:

/

 

n1m2

(n1 1)

 

 

 

 

 

 

 

2

=

m2

 

n1(n2 1)

 

n2m

/(n2 1)

 

 

 

 

m n (n

 

1)

 

2

 

22

1

 

 

2

 

 

 

 

 

16

4ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ

4.1Постановка задачи

Как я рассказывал на 2ой лекции, кроме точечных оценок бывают еще интервальные. К ним относятся оценки, представляющие из себя целый интервал, то есть множество значений. Точечные оценки в подавляющем большинстве случаев не совпадают с оцениваемым параметром, на практике обычно бывает интереснее найти интервал, в который оцениваемая величина попадает с заданной вероятностью. В интервальных оценках задается вероятность, называемая надежностью, на основе которого вычисляются 2 числа: начало и конец интервала. Говорят, что оцениваемый параметр попадает в полученный интервал с вероятностью, равной надежности.

x1; x2; : : : ; xn - выборка наблюдений. Тогда на основании выборки вычисляет-

ся Θ(x1; x2; : : : ; xn) и Θ(x1; x2; : : : ; xn), такие что P(Θ < Θ < Θ) = . И интервал [Θ; Θ]

будет называться интервальной оценкой параметра Θ с заданной надежностью . Его еще также называют доверительным интервалом.

4.2Методы построения доверительного интервала

Существуют разные методы построения поставленной задачи. Наиболее известны 2 подхода:

1.Метод Байеса

2.Метод доверительных интервалов Неймана

Про метод Байеса я рассказывать не буду, скажу только что в его основе лежит формула Байеса, которую мы проходили в курсе тервера.

Далее я более подробно расскажу про метод Неймана, который мы будем в дальнейшем использовать для построения доверительного интервала. Рассмотрим оцениваемый параметр Θ. Θn - его статистическая оценка. Θn можно рассматривать как случайную величину с некоторой плотностью. Задаем 0 < < 1 - надежность для доверительного интервала (обычно берется близким к 1). Далее строим график зависимости оценки от оцениваемого параметра. 1(Θ); 2(Θ) - таким образом построенные линии, что P ( 1(Θ) < Θn < 2(Θ)) = . D - область между 1 и 2.

Тогда

P ; Θ )

 

D) =

.

Предположим, что

 

обратные функции к 1 и 2. Тогда

 

 

n

 

1

1

(Θ))

1

(Θ) < Θ

1

(Θ)). Тогда

P ; Θ )

 

D) = P ( 1(Θ) < Θ < 2

или P ( 2

< 1

 

n

1

 

1

 

 

n

 

 

 

n

 

 

видно, что

( 1

(Θ); 1

(Θ)) - доверительный интервал для оцениваемого параметра

с надежностью . Тогда Θ = 11(Θ), Θ = 21(Θ).

Зам. Исходя из условия P ( 1(Θ) < Θn < 2(Θ)) = доверительный интервал строится неоднозначно. Дополнительным критерием для выбора 1 и 2 является то, чтобы интервал ( 11(Θ); 21(Θ)) был наиболее узким.

Зам. Кроме двусторонних интервалов рассматривают и односторонние, когда 1 и 2 заменяются на крайние значения (±∞; 0; : : : ).

17

4.3Построение доверительного интервала для математического ожидания при известной дисперсии 2 нормально распределенной генеральной совокупности

N(a; ) Надо построить доверительный интервал для a, если известно. Имеется выборка x1; x2; : : : ; xn. Каждое xi можно сопоставить с i N(a; ). Рассмотрим тогда выборочное среднее как случайную величину. Сумма нормально распределенных случайных величин - тоже нормально распределенная случайная величина. Следовательно x N(a1; 1). Найдем a1 и 1.

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

1 n

 

 

1

 

 

 

n

 

 

 

 

 

 

 

x

=

n

=1

xi

a1 = M[

x

] =

n

i=1

M[xi] =

n

 

 

 

 

 

a = a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

1

n

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[

x

] =

 

n2

=1

D[xi] =

n2

 

2 =

 

n

1 = [

x

] =

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Получили

 

N(a;

 

). Можно нормировать эту величину, вычтя из нее мато-

x

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

− a

 

 

N(0; 1)

 

жидание и поделив на среднеквадратическое отклонение:

 

 

x

 

 

Задаем

 

=

 

 

 

 

n

 

надежность 0 < < 1. Обычно она берется близкой к 1 (0.9, 0.95, 0.99). Тогда можно

 

 

 

 

 

 

 

 

 

P (

 

 

 

 

− a

 

 

< t ) =

 

 

 

t

 

 

 

 

 

 

 

 

 

записать формулу

 

 

 

x

 

 

, где

 

- корень уравнения, который нам надо

 

|

=

 

|

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

− a

 

 

 

 

 

 

 

 

 

 

− a

 

 

 

 

 

 

 

 

 

найти.

P (

 

 

x

 

< t

 

) = P (

 

t

 

<

x

< t

) = F (t

)

 

F (

t

) = Φ(t )

Φ( t

) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

=n

|

 

 

 

 

 

 

 

 

 

 

=n

 

 

 

 

 

 

 

− −

 

2Φ(t ) = . Φ(t ) = 2. Отсюда следует, что t - обратное значение функции Лапласа.

t = Φ1(

 

) (Удобно находить по таблицам)

(9)

2

 

 

 

Если выражать через t через функцию распределения нормального стандартного распределения, надо помнить что F (x)N(0;1) = Φ(x)+ 12 . Отсюда Φ(x) = F (x)N(0;1) 12 . Подставляя сюда вместо x t и учитывая 9, получаем

F (t )N(0;1)

1

=

 

F (t )N(0;1) =

1

+

 

t = FN(01

;1)(

+ 1

) (Удобно находить в Excel)

 

 

 

 

 

 

 

2

2

2

2

 

2

 

Следовательно t можно посчитать по таблицам квантилей функции Лапласа или стандартной нормальной функции распределения. Осталось найти сам доверитель-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

− a

 

 

 

 

−t

 

 

 

a <

t

) = P (

−t

 

 

 

ный интервал.

P (

t

 

<

 

x

< t ) = P (

<

 

 

 

 

< a <

 

 

x

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=n

 

 

n

 

 

 

n

n

 

 

t

 

 

 

 

 

t

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

− x) = P (x −

 

< a < x +

 

) = .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

x − a

Если находим односторонний интервал, то используем тот же принцип. P ( √ <= n

t ) = F (t ) = . В данном случае t = F 1( ).

18

4.4Построение доверительного интервала для математического ожидания при неизвестной дисперсии нормально распределенной генеральной совокупности

Вообще говоря, можно неизвестную дисперсию заменить ее оценкой (лучше несмещенной) и использовать метод, описанный в предыдущем пункте. Однако при небольших n данная замена может быть очень неточной, поэтому применяется другой подход, описанный далее.

Имеется выборка x1; x2; : : : ; xn. Вспомним смещенную оценку дисперсии: m2 =

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 n

 

 

 

)2

. Как доказано в Теор.2:

X − a√

 

 

 

 

 

 

 

 

(X

i

X

n

1

 

t(n

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n =1

 

 

 

 

 

 

 

 

 

 

 

 

m2

 

 

 

 

 

 

Задаем надежность 0 < < 1. Обозначим плотность распределения Стьюдента с (n-1) степенями свободы через n−1(x) (чтобы не путать с квантилем). Тогда исходя

из метода Неймана

 

t n−1(x)dx =

(10)

−t

Такая запись возможна, т.к. распределение Стьюдента симметрично. Отсюда t может быть вычислено. Нужно внимательнее обращать внимание на квантили распределения Стьюдента, где то они берутся для приведенного случая (как в Excel), где то надо приводить эту формулу к выражению через функцию распределения Стьюдента. (Нарисовать график плотности распределению Стьюдента и еще раз показать разницу между квантилем и выражением из уравнения). Как я говорил при описании общего метода построения доверительных интервалов Неймана, должен выбираться самый узкий интервал, из тех, что удовлетворяют условию. Но у распределения Стьюдента (как и у нормального распределения) наибольшая плотность содержится в середине распределения, и при движении к краям она уменьшается. Тогда можно показать, что симметричный относительно моды интервал распределения будет самым узким.

Далее будем находить интервал для a из 10. Получим

 

 

 

 

 

 

 

 

 

 

 

− a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

< a <

 

+

t

 

 

) =

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m2

m2

P (

t

 

<

 

n

 

1 < t

) = P (X

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

− √n − 1

n − 1

Если использовать несмещенную оценку s2 =

 

 

n

m2, то формула для доверитель-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n − 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

s2

 

 

 

 

 

 

 

 

t

s2

 

 

 

 

 

 

ного интервала примет вид X −

 

 

 

 

 

 

 

 

 

 

 

 

 

 

< a < X +

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

Зам. Этот метод применяется для небольших n<50, при больших n замена дисперсии ее оценкой является довольно точной, и поэтому применяется метод, описанный в предыдущем пункте пункте с заменой дисперсии на ее оценку.

19

xi рас-

4.5Построение доверительного интервала для математического ожидания в случае неизвестного закона распределения

Этот метод применяется только для большого размера выборки (n>50). При таком

n имеет место центральная предельная теорема, исходя из которой x = 1 ∑n

n i=1

пределена по нормальному распределению. Исходя из этого дальнейшие выкладки совпадают с описанными в п.1. В случае неизвестной дисперсии при большом n она может заменяться выборочной дисперсией m2. Тогда доверительный интервал примет вид

 

 

 

 

 

t

 

 

 

 

t

при известной дисперсии 2

P (x −

 

 

< a < x +

 

 

) =

n

n

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t m2

 

 

 

 

t m2

при неизвестной дисперсии

P (x −

 

 

< a < x +

 

) =

n

n

4.6Построение доверительного интервала для среднеквадратического отклонения и дисперсии в случае нормально распределенной генеральной совокупности.

Имеется случайная величина N(a; ) и наблюдение над ней x1; x2; : : : ; xn. Вы-

полняются все условия теор.1. Следовательно

nm2

имеет распределение 2

с (n-1)

2

 

 

 

 

 

 

 

с (n-1)

степенями свободы. Обозначим через kn−1(x) - плотность распределения 2

степенями свободы. kn−1(x) =

nm2

.

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

Рассмотрим 2

kn−1(x)dx = .

 

 

 

 

 

 

 

 

 

 

 

 

 

2 и 2 выбираются неоднозначно. Отличие от распределения Стьюдента еще состоит в том, что распределение хи-квадрат не является четным (хоть и симметрично), следовательно нельзя брать 2 = 2, как было в распределении Стьюдента. (нарисовать график плотности, площадь под графиком плотности должна равняться ). Однако можно показать, что самый узкий интервал будет симметричен относительно моды. Чтобы это условие выполнялось, подберем такие 2 и 2, чтобы площади

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(x)dx = k

(x)dx =

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

справа и слева от них были равны, то есть 0

 

 

n−1

 

 

2

 

 

n−1

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

2

 

Сам интервал строится аналогично:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nm

 

 

 

nm

nm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

P (

nm

 

 

 

nm

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P (

2

<

2

< 2) =

P (

2

< 2 <

 

 

) =

2

< 2 <

 

 

) =

2

 

 

 

 

2

 

 

 

 

 

2

 

 

2

2

 

 

 

 

 

 

 

 

Вывод. Как вы заметили, принцип построения доверительных интервалов довольно общий. Сначала выбираем распределение, под которое можно подогнать выражение, содержащее интересующий нас оцениваемый параметр, и потом выражаем его в этом интервале отдельно.

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]