Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
i-719273.pdf
Скачиваний:
269
Добавлен:
26.03.2016
Размер:
5.68 Mб
Скачать

2.3. Интервальные оценки. Доверительный интервал

Рассмотренные точечные оценки параметров не дают информации о степени близости оценки θ к соответствующему теоретическому параметру. Поэтому более информативный способ оценивания неизвестных параметров заключается в построении интервала, в котором с заданной степенью достоверности будет находиться оцениваемый параметр, т.е. в построении так называемой интервальной оценки параметра . Интервальной оценкой параметра называется интервал, границы которого l ,l являются функция-

ми выборочных значений x1,x2,..., x N и который с заданной вероятностью р накрывает оцениваемый параметр .

 

1 < θ < 2 = .

(2.9)

Интервал 1, 2

называется доверительным, его границы 1, 2

яв-

ляющиеся случайными величинами, соответственно нижним и верхним дове-

рительными пределами, вероятность p доверительной вероятностью, а величина q p уровнем значимости.

Сама по себе ширина доверительного интервала 1 2 еще не характеризует высокое качество оценки θ. Конечно, чем уже доверительный интервал, тем в вероятностном смысле ближе оценка θ к истинному значению параметра . Но ширину доверительного интервала всегда следует рассматривать в совокупности с доверительной вероятностью. Иными словами, при данном объеме выборки нельзя повысить p без увеличения ширины довери-

тельного интервала, и наоборот.

На практике, в технических приложениях, чаще всего используют значение p . , что соответствует уровню значимости q . .

Задача нахождения границ доверительного интервала решается с помощью выборочных функций распределения оценки θ или некоторой связанной с θ подходящей статистики. Чаще всего используют условие

θ − δ < θ

= θ + δ

 

> θ =

p

 

q

, (2.10)

2

 

 

1

 

 

 

 

 

 

 

 

 

 

обеспечивающее для симметричного выборочного распределения θ размещение оценки θ в центре доверительного интервала

66

N 100

m 5

4 - параметры выборки

x rnorm N m

- г енерирование нормально распределенной выборки

Оценка математического ожидания (выборочное с реднее)

 

1

 

N

 

 

 

 

 

 

 

 

 

 

 

 

mx

 

xi

(**)

 

 

 

mx 4.398

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

mx 4.398

 

 

 

mx m ean(x)

(*)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценка дис перс ии (выборочная дисперсия)

 

s2x var(x)

(*)

 

 

 

s2x 15.277

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

N

 

xi mx

 

 

 

 

 

 

 

s2x

 

 

 

 

 

 

 

2

s2x 15.432

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценка выборочного значения ковариации

 

 

y rnorm(N 0 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

N

yi my

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

my m ean(y)

 

 

 

 

 

s2y

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

xi mx yi my

 

 

 

 

 

 

covxy

N1

covxy 0.788

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

cvar(x y) 0.788

(*)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочное значение коэффициента корреляции

 

 

 

 

 

 

1

 

N

 

xi

mx yi my

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

rxy

 

 

 

 

 

 

i 1

 

 

 

rxy 0.203

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s2x s2y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

corr(x y) 0.203

(*)

 

 

 

 

 

 

 

 

(*) - Вычисление оценки стандартными функциями Mathcad

(**) - Переменная начала массива ORIGIN должна быть настроена равной 1. Если ORIGIN =0, то верхняя и нижняя г раницы суммирования дожны быть уменьшены на 1

Рис. 2.2. Вычисление простейших оценок

67

Пример 2.1. Найти доверительный интервал для оценки с надежностью (с доверительной вероятностью) p . неизвестного математического

ожидания mx

нормально распределенной случайной величины X , если из-

 

 

 

 

 

 

 

 

 

 

среднее x , объем

выборки

вестна дисперсия x , выборочное

N .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Доверительный интервал определен выражением

 

 

 

 

 

 

x

tq /

 

x

m

 

x

tq /

 

x

,

(2.11)

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

tq /

 

x

 

— точность оценки, t

 

 

есть такое значение аргумента функ-

 

 

 

q /

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ции Лапласа Ф(t) , при котором Ф(t)q / p / .

 

 

Из соотношения находим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф(t)

.

. .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Далее по таблице значений функции Ф(t) [1] находим, что tq / . .

Подставляя все данные, получим искомый доверительный интервал

. mx . .

В случае если неизвестно теоретическое значение x и объем выборки N используют доверительный интервал [1]

x t

N ,q /

Sx

 

m

 

x t

N ,q /

Sx

 

,

(2.12)

 

 

 

x

 

 

 

 

 

 

 

 

N

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

где tN ,q / – значения t -распределения Стьюдента, для числа степеней свободы N и вероятности q / (для односторонней критической об-

ласти), находят из таблиц [1].

Число степеней свободы есть разность между числом имеющихся статистических данных N и числом наложенных связей. В данном случае

число связей равно единице, так как x и S x выражены одно через другое.

 

Для оценки дисперсии x

при известном mx используют доверитель-

ный интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

N

 

 

S

N

 

 

,

(2.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

x

x

 

 

 

 

 

 

 

 

v,

 

 

 

 

 

v,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где S — выборочная дисперсия, рассчитанная по выборке объема

N ;

x

 

 

 

 

 

 

 

 

 

 

 

 

 

v,

 

значение

 

— хи-квадрат

распределения с

числом степеней

свободы

 

N и вероятности q / ,

 

 

 

q / (находится из таблиц [1]).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

68

 

 

Пример 2.2. По выборке объемом N из нормальной совокупности

найдено S . Найти доверительный интервал, покрывающий генеральную

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсию

с надежностью p . .

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По таблице

[1]

для

N

и . / .

находим

 

 

 

. ,

 

 

 

. . Подставляя в (2.13), получим . . .

 

 

 

 

, .

 

, .

 

 

 

 

 

 

 

 

 

x

 

 

 

В случае если mx

неизвестно, справедливо следующее соотношение

 

 

 

 

 

 

 

 

S

N

 

S

N

.

(2.14)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приведенные в данном параграфе формулы справедливы для нормального распределения случайной величины X при условии, что наблюдения в выборке независимы.

2.4. Проверка статистических гипотез о параметрах распределения

Статистическая гипотеза есть некоторое предположение относительно свойств генеральной совокупности, из которой извлекается выборка.

Критерий статистической гипотезы – это правило, позволяющее отвергнуть или принять данную гипотезу на основании выборки. При этом широко используются функции результатов наблюдений или, как говорят, статистики для проверки гипотез. Все возможные значения подобных статистик делятся на две части: области принятия гипотезы и критическую область, в которой принимается решение отвергнуть гипотезу.

Проверка гипотезы заключается в сопоставлении некоторых статистических показателей, критериев проверки, вычисляемых по данным выборки в предположении, что проверяемая гипотеза верна.

Нулевой (основной) называют выдвинутую гипотезу H .

Конкурирующей (альтернативной) называют гипотезу H , которая

противоречит нулевой.

В итоге проверки гипотез могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называется уровнем значимости критерия и обозначают буквой q .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают .

Рассмотрим методы проверки некоторых статистических гипотез. Задача 2.1. Необходимо сравнить выборочное среднее с гипотетиче-

ской генеральной средней (математическим ожиданием) нормальной сово-

69

крит.

купности. Или, другими словами, необходимо проверить гипотезу о равенстве mx заданному значению m , т.е.

H : mx m ,

(2.15)

H : mx m .

 

Допустим, что дисперсия генеральной совокупности

неизвестна. В

x

 

качестве статистики, т.е. функции результатов наблюдений, используют величину

t N x m , (2.16)

набл

Sx

 

называемую t -критерием и распределенную по закону Стьюдента с числом степеней свободы N .

Если вычисленное значение tнабл. не превышает критического t ,

найденного из таблицы теоретического распределения, то исходная нулевая гипотеза принимается, в противном случае она отвергается.

Рассмотрим некоторые часто используемые гипотезы на примерах, приведенных в [1].

 

 

Пример 2.3. Проверить гипотезу о равенстве нулю mx c 10% уровнем

значимости,

если при обработке выборки N получено

x . ;

Sx . . Найдем значение t -критерия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

( . )

 

. .

 

 

 

 

 

набл

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табличное значение t двуст

для q / . и N , равно

 

 

 

крит

 

 

 

 

 

 

 

 

t

крит

.

(из таблиц [1]). Поскольку t

набл

t двуст, то нулевая гипотеза H

 

 

 

 

 

 

 

 

 

крит

 

должна быть отвергнута, т.е. математическое ожидание генеральной совокупности не равно нулю.

Задача 2.2. Необходимо произвести сравнение выборочных дисперсий S x , S x , полученных из двух независимых выборок объемом N и N , извлеченных из нормальных генеральных совокупностей, т.е.

 

 

 

,

 

H : x

x

 

 

 

 

 

(2.17)

 

 

 

 

 

 

 

H : x

x .

 

 

 

 

 

 

Для проверки гипотезы применяется

F -критерий (дисперсионное от-

ношение)

 

 

 

 

F

Sx

 

 

 

 

,

 

(2.18)

Sx

 

 

 

 

 

 

 

 

 

 

где в числителе записано максимальное значение из S x , S x .

70

 

 

Для выбранного уровня значимости q / находят границу критической

области из таблиц F -распределения Фишера с числом степеней

N и

 

 

 

 

 

 

 

 

 

 

 

N

 

[1]. Причем

 

для дисперсии числителя. Если F F крит

, то

 

 

 

набл

v ,v ,q /

 

 

 

 

 

 

 

 

 

 

нуль-гипотеза о равенстве двух генеральных дисперсий отвергается, и наоборот.

Пример 2.4. Имеются две выборки объемом N и N , для ко-

торых рассчитаны оценки S . и S

. .

 

 

 

 

Проверим нуль-гипотезу о равенстве дисперсий при q . . Находим

F .

. .

набл

.

 

 

 

По таблице [1] находим для

,

 

, F крит . .

 

 

q /

Поскольку Fнабл F крит , то принимаем нуль-гипотезу.

Задача 2.3. Произвести сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема, т.е. проверить гипотезу

 

H

 

 

 

 

,

 

 

 

: x

x

... x

 

 

 

 

 

 

 

l

 

 

(2.19)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H : x

x

... x .

 

 

 

 

 

 

 

l

 

 

 

Для проверки вычисляют

 

 

 

 

 

 

 

Gнабл

 

Smax

 

.

(2.20)

 

S S ... S

 

 

 

 

 

 

l

 

 

Далее по таблице распределения Кохрена находят критическую точку

Gкрит (q, N ,l)

[1]. Если G

 

Gкрит

нет оснований отвергать нулевую ги-

 

набл

 

 

 

 

 

 

потезу, иначе нулевую гипотезу отвергают.

Пример 2.5. По четырем независимым выборкам одинакового объема N , извлеченным из нормальных генеральных совокупностей, найдены

S . ;

S . ;

S

. ; S . .

 

 

 

 

 

 

 

Необходимо при уровне значимости q . и l проверить гипоте-

зу (2.19), а также оценить генеральную дисперсию.

 

Вычислим согласно (2.20)

 

 

 

 

 

 

G

.

 

 

 

 

.

 

 

 

 

 

 

набл

. . . .

 

 

Из таблиц [1] находим

 

 

 

 

 

 

 

Gкрит ( . , , ) . .

 

Поскольку G Gкрит , то принимаем

H

 

, т.е. выборочные дисперсии

набл

 

 

 

 

 

 

различаются незначимо.

71

Поскольку однородность дисперсий установлена, в качестве оценки генеральной дисперсии примем среднюю арифметическую

S . . . . . .

x

 

 

Задача 2.4. Произвести сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Для этого необходимо проверить гипотезу

 

 

H

: mx

mx

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.21)

 

 

H : mx

mx

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в предположении, что неизвестные дисперсии равны x

x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки необходимо вычислить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tнабл

 

 

 

x

x

 

 

 

 

 

N N N N

(2.22)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

S

N

 

S

N N

 

 

 

 

x

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и по таблице распределения Стьюдента, по заданному уровню значимости q

и числу

степеней свободы N N найти

критическую точку

t крит (q, ).

 

 

 

 

 

 

 

 

 

 

 

Если

 

t

набл

 

t крит — нулевую гипотезу отвергают. Если

 

t

набл

 

t крит

 

 

 

 

нулевую гипотезу принимают.

 

 

 

 

 

 

Пример 2.6. По двум независимым выборкам N и

N , из-

влеченных из нормальных генеральных совокупностей

X и

X , найдены

выборочные средние и дисперсии x . x . Sx . Sx . . Требуется при уровне значимости q . проверить гипотезу (2.21).

Решение. Поскольку выборочные дисперсии различны, поэтому предварительно проверим гипотезу о равенстве дисперсий (2.17). Вычислим

Fнабл . . .

.

Для

N и

 

N

 

и q . находим

 

 

 

 

 

 

 

 

 

из таблиц Фишера [1] (в предположении

 

 

 

)

F

крит

. . Так как

 

H : x

x

 

 

 

 

 

 

 

 

 

 

 

 

Fнабл F крит — нет оснований отвергать нулевую гипотезу о равенстве гене-

ральных дисперсий. Поскольку предположение о равенстве генеральных дисперсий выполняется, сравним средние.

Вычислим

 

 

 

 

 

 

 

 

 

t

 

 

 

. .

 

 

( ) . .

набл

 

 

 

 

 

. .

 

 

 

 

 

 

 

 

 

 

 

72

 

 

 

 

Для q . и , находим из таблиц t -распределение Стьюдента t крит . .

Так как tнабл t крит нулевую гипотезу о равенстве математических ожи-

даний генеральных распределений отвергаем. Другими словами, выборочные средние различаются значимо.

Задача 2.5. Проверить гипотезу о значимости выборочного коэффици-

ента корреляции двух нормально распределенных случайных величин

X и

X , т.е. проверить гипотезу о равенстве нулю коэффициента корреляции ге-

неральной совокупности

 

 

 

 

 

 

 

 

 

 

H

 

:

 

,

 

 

 

 

 

 

 

 

 

 

 

(2.23)

H

 

:

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки гипотезы необходимо вычислить

 

 

 

 

 

 

 

 

 

 

 

tнабл

r

 

N

 

,

(2.24)

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

 

и найти по таблице критических точек распределения Стьюдента для заданного уровня значимости q и числа степеней свободы N , где N — объем выборки, t крит (q, ) .

Если tнабл t крит — нулевую гипотезу отвергают, и наоборот.

Пример 2.7. По выборке N , извлеченной из двумерной нормальной совокупности X , X найден выборочный коэффициент корреляции

r . .

Для q . проверить гипотезу (2.23) Решение. Вычислим

tнабл . . .

.

По таблице Стьюдента находим t крит ( . , ) . .

Поскольку tнабл t крит — отвергаем нулевую гипотезу, т.е. выборочный коэффициент корреляции r значимо отличается от нуля и следовательно случайные величины X и X коррелированны.

Задача 2.6. Рассчитать необходимый объем выборки для получения оценки математического ожидания с заданной точностью и доверительной

вероятностью p , если известны оценки дисперсии S и S , вычисленные по

двум выборкам малого объема из одной генеральной совокупности. Решение. Вычисляем

73

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]