Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2_Matematicheskaya_statistika_lektsii.doc
Скачиваний:
239
Добавлен:
09.03.2016
Размер:
504.32 Кб
Скачать

1.7. Доверительные интервалы и доверительные вероятности

Теоремы 1 и 2 хотя и являются общими, т. е. сформулированы при достаточно широких предположениях, они не дают возможности установить, насколько близки оценки к оцениваемым параметрам. Из факта, что —оценки являются состоятельными, следует только то, что при увеличении объема выборки значение P(|θ* – θ| < δ), δ < 0, приближается к 1.

Возникают следующие вопросы.

  1. Каким должен быть объем выборки п, чтобы заданная точность |θ* – θ| = δ была гарантирована с заранее принятой вероятностью?

  2. Какова точность оценки, если объем выборки известен и вероятность безошибочности вывода задана?

  3. Какова вероятность того, что при заданном объеме выборки будет обеспечена заданная точность оценки?

Введем несколько новых определений.

Определение. Вероятность γ выполнения неравенства, |θ*– θ| < δ называется доверительной вероятностью или надежностью оценки θ.

(1)

Перейдем от неравенства |θ*–θ| < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

(2)

Так как θ (оцениваемый параметр) – число постоянное, а θ* – величина случайная, понятие доверительной вероятности сформулировать так: доверительной вероятностью γ называется вероятность того, что интервал (θ*– δ, θ*+ δ) накрывает оцениваемый параметр.

Определение. Случайный интервал (θ*–δ, θ*+δ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр, называется доверительным интервалом İ, соответствующим коэффициенту доверия γ,

İ=(θ*– δ, θ*+ δ). (3)

Надежность оценки γ может задаваться заранее, тогда, зная закон распределения изучаемой случайной величины, можно найти доверительный интервал İ. Решается и обратная задача, когда по заданному İ находится соответствующая надежность оценки.

Пусть, например, γ = 0,95; тогда число р = 1 – у = 0,05 показывает, с какой вероятностью заключение о надежности оценки ошибочно. Число р=1–γ называется уровнем значимости. Уровень значимости задается заранее в зависимости от конкретного случая. Обычно р принимают равным 0,05; 0,01; 0,001.

Выясним, как построить доверительный интервал для математического ожидания нормально распределенного признака. Было показано, что

Оценим математическое ожидание с помощью выборочной средней учитывая, что также имеет нормальное распределение. Имеем

(4)

а по формуле (12.9.2) получаем

Принимая во внимание (13.5.12), получим

(5)

Пусть известна вероятность γ. Тогда

Для удобства пользования таблицей функции Лапласа положим тогдаа

(6)

Интервал

(7)

накрывает параметр а = М(Х) с вероятностью γ.

В большинстве случаев среднее квадратическое отклонение σ(Х) исследуемого признака неизвестно. Поэтому вместо σ(Х) при большой выборке (n > 30) применяют исправленное выборочное среднее квадратическое отклонение s, являющееся, в свою очередь оценкой σ(X), доверительный интервал будет иметь вид

İ =

Пример. С вероятностью γ = 0,95 найти доверительный интервал для М(Х) – длины колоса ячменя сорта «Московский 121». Распределение задается таблицей, в которой' вместо интервалов изменения (хi, хi + 1) взяты числа , см. Считать, что случайная величинаX подчинена нормальному распределению.

7,5

8,5

9,5

10,5

11,5

12,5

13,5

ni

4

10

14

12

5

4

1

Решение. Выборка большая (n = 50). Имеем

Найдем точность оценки

Определим доверительные границы:

Таким образом, с надежностью γ = 0,95 математическое ожидание заключено в доверительном интервале I = (9,5; 10,3).

Итак, в случае большой выборки (n > 30), когда исправленное среднее квадратическое отклонение незначительно отклоняется от среднего квадратического отклонения значения признака в генеральной совокупности, можно найти доверительный интервал. Но делать большую выборку удается не всегда и это не всегда целесообразно. Из (7) видно, что чем меньше п, тем шире доверительный интервал, т. е. I зависит от объема выборки п.

Английский статистик Госсет (псевдоним Стьюдент) доказал, что в случае нормального распределения признака X в генеральной совокупности нормирования случайная величина

(8)

зависит только от объема выборки. Была найдена функция распределения случайной величины Т и вероятность P(T < tγ), tγ – точность оценки. Функция, определяемая равенством

s (n, tγ) = P(|T| < tγ) = γ (9)

названа t-распределением Стьюдента с п – 1 степенями свободы. Формула (9) связывает случайную величину Т, доверительный интервал İ и доверительную вероятность γ. Зная две из них, можно найти третью. Учитывая (8), имеем

(10)

Неравенство в левой части (13.7.10) заменим равносильным ему неравенством . В результате получим

или

(11)

где tγ=t(γ,n). Для функции tγ составлены таблицы (см. Приложение 5). При n>30 числа tγ и t, найденные по таблице функции Лапласа, практически совпадают.

Доверительный интервал для оценки среднего квадратического отклонения σx в случае нормального распределения.

Теорема. Пусть известно, что случайная величина имеет нормальное распределение. Тогда для оценки параметра σх этого закона имеет место равенство

(12)

где γ – доверительная вероятность, зависящая от объема выборки п и точности оценки β.

Функция γ = Ψ (n, β) хорошо изучена. С ее помощью определяют β = β(γ,п). Для β = β(γ,п) составлены таблицы, по которым по известным п (объему выборки) и γ (доверительной вероятности) определяется β.

Пример. Для оценки параметра нормально распределенной случайной величины была сделана выборка (дневной удой 50 коров) и вычислено s = 1,5. Найти доверительный интервал, накрывающий с вероятностью γ = 0,95.

Решение. По таблице β(γ, п) для n = 50 и γ = 0,95 находим β = 0,21 (см. Приложение 6).

В соответствии с неравенством (13) найдем границы доверительного интервала. Имеем

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21·1,5 = 1,185;

1,185 < σ < 1,185.

Нахождение объема выборочной совокупности.

Формула

связывает δ (точность оценки), доверительную вероятность и объем выборки. Зная две из этих величин, можно найти третью. Важной является задача определения объема выборочной совокупностиn при заданной доверительной вероятности γ и заданном доверительном интервале, определенном точностью δ. Как найти такой минимальный объем выборки n, чтобы оцениваемый параметр накрывался доверительным интервалом с заданной вероятностью γ? Обозначим тогда

Здесь σ(Х) – среднее квадратическое отклонение, t – значение независимой переменной в функции Лапласа, для которой

Пример. Высота стебля кукурузы X – случайная величина, имеющая нормальное распределение. Сколько необходимо отобрать растений, чтобы отличалось от М(Х) меньше чем на 2 см, если известно, что по результатам предыдущих измерений σ(Х) = 6см. Результат найти с надежностью γ – 0,95.

Решение. Имеем γ = 0,95, Ф(t) = 0,475, t = 1,96

Таким образом, n ≥ 35