Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
27.03.2016
Размер:
199.68 Кб
Скачать

3.2.3.2.2 Распределение Стьюдента*).

Распределение Стьюдента, или t-распределение, является законом распределения дроби [18]

tn = x / (/ n)1/2,

где xN(0; 1), а =(227). Плотность вероятности этой дроби является функцией единственного параметра n:

___________

*) Стьюдент – псевдоним английского статистика У. Госсета.

, . (235)

ФР закона Стьюдента определяется правилом (50)

FСтьюд = S(tn,P) = P(T < tn,P) =. (236)

Она позволяет строить двухсторонние ДИ для МО аналогично решению этой задачи при нормальном распределении (3.2.3.1). Таблицы квантилей ФР (236) помещены в Приложении 4. Указанный выше ДИ определяется [18] из соотношения

(237)

и имеет такие границы:

xH = - * tn-1, P

, (238)

xB = + * tn-1, P

где = m / – выборочный стандарт СА.

Задача 3.5. По данным предыдущей Задачи 3.4. построить двухсторонние ДИ для МО и стандарта ГС, учитывая малый объем выборки.

Решение.

Построение двухстороннего ДИ для МО.

1. Из таблицы квантилей ФР Стьюдента (Приложение 4) находим для функции S = P(T < tn-1, P) = границу t11;0,05 = arg(S(t11) = 0,05) = 2,20.

2. По значению СКО m вычисляем оценку стандарта СА:

= m /= 0,9"/= 0,26".

3. По формулам (238) находим Стьдентовские границы ДИ для МО:

xH = 36o 52' 47,8" – 2,2 * 0,26" = 36o 52' 47,2";

xB = 36o 52' 47,8" + 2,2 * 0,26" = 36o 52' 48,4".

Итак, на том же уровне значимости = 0,05, для малой по объему выборки (число степеней свободы равно 11), получен более широкий (на 20% по сравнению с нормальным) двухсторонний ДИ.

Построение двухстороннего ди для стандарта.

1.Множители , входящие в формулу (234) и взятые из таблицы (Приложение 5) на уровне значимости = 0,05 для малой выборки (число степеней свободы равно 11), равны 0,71 и 1,70, соответственно.

2. По формулам (234) находим границы ДИ для стандарта:

sH = * m = 0,71 * 0,9" = 0,64";

sB = * m = 1,70 * 0,9" = 1,53".

Здесь так же двухсторонний ДИ увеличился на 11% и, кроме того, стал асимметричным относительно точечной оценки, равной 0,9".

3.3 Статистические гипотезы.

Статистические гипотезы это высказывания о свойствах ГС (законе распределения, параметрах закона, числовых характеристиках и т.п.), осуществляемые и проверяемые по выборке из этой ГС. Обычно гипотеза обозначается буквой H0, а в фигурных скобках помещается текст высказывания, записанный либо на обычном языке, либо на языке вероятностной алгебры. Например: H0 = {ГС распределена нормально с параметрами a = 4; b = 2} = {XN(4; 2)}.

Гипотеза является случайным событием и, следовательно, может быть охарактеризована некоторой вероятностью P(H0).

Для проверки высказываемой гипотезы составляется некоторая оценивающая функция (ОФ), аргументами которой являются n элементов xi выборки из гипотетической ГС X и m параметров aj этой же ГС. Наличие последних не обязательно. Такую функцию называют статистикой, критерием или тестом. Естественно, что всякая ОФ будет СВ, закон распределения которой можно заранее установить.

Итак, пусть ОФ некоторой статистики имеет вид:

u = U(x1, x2, … xn; a1, a2, … am), (239)

где x1, x2, … xn – элементы выборки, а a1,a2,…,am – параметры закона, которому подчиняется ГС. При этом, естественно, что m < n. Закон распределения ОФ полагается установленным, например, в форме ФР:

F (u) = P (U < u). (240)

В такой ситуации с вероятностью , называемой уровнем значимости, можно вычислить 100 % - ную (сто альфа-процентную) квантиль

u = arg (F=. (241)

Иными словами, попадание статистики uЭ в критическую область uK, расположенную правее точкиu, возможно лишь с малой вероятностью и признается практически редким событием, в силу чего, высказанная гипотеза H0отвергается. Если же окажется, что uЭ будет находиться левее u, то можно сказать, что гипотеза H0 не противоречит экспериментальным данным выборки и, следовательно, не отвергается. Вышеизложенное предполагает, что область, в которой гипотеза не отвергается, представляет собой односторонний доверительный интервал.

Аналогичными рассуждениями можно описать и двухсторонний интервал ]uH; uB[, выход за пределы которого числа uЭ, позволяет отвергнуть гипотезу H0. Нижняя (uH) и верхняя (uB) границы такого ДИ так же определяются как соответствующие квантили. Обычно, это 100(1α / 2)%-ная и 100(α / 2)%-ная квантили, соответственно:

uH = arg(F = 1 – /2;

uB = arg(F = /2.

Говорить, что гипотеза H0 «принимается» не корректно, так как принять можно бесчисленное множество близких гипотез, а отвергнуть – единственную, проверяемую. В связи со сказанным, при проверке гипотез важную роль играет правильная формулировка текста проверяемой гипотезы. По сути, она должна быть таким высказыванием, отказ от которого нас практически и устраивает.

Когда гипотеза H0 верна, а по результатам тестирования мы вынуждены её отвергнуть, то говорят, что произошла ошибка первого рода, вероятность совершения которой как раз и равна уровню значимости . Ошибку первого рода иногда называют риском изготовителя.

Основной гипотезе H0 противопоставляется альтернативная гипотеза H a. В ситуации, когда верна альтернативная гипотеза H a, и мы её не отвергли, то говорят, что произошла ошибка второго рода, вероятность совершения которой так же должна быть небольшой. Обычно, эту вероятность обозначают буквой . Ошибка второго рода имеет и другое название: риск потребителя.

Описанную в двух последних абзацах ситуацию можно представить в виде таблицы вероятностей проверки гипотез (Табл.3.2), предварительно введя следующие события: A = {гипотеза не отвергается} и B = {гипотеза отвергается}. Тогда ошибка первого рода или риск изготовителя – это условное событие {B | H0}, а ошибка второго рода или риск потребителя – это {A | H a}.

Таблица вероятностей проверки гипотез

Табл.3.2

Решение

Ист.

гипотеза

Не отвергается

A

Отвергается

B

Основная

H0

P(A | H0)

не определена

P(B | H0) =

вероятн. ош-ки I рода

Альтернативная

H a

P(A | H a) =

вероятн. ош-ки II рода

P(B | H a)

не определена

Неопределенность вероятности не отвергнуть основную гипотезу P(A | H0) и вероятности отвергнуть альтернативную гипотезу P(B | H a) объясняется тем, что количество как основных, так и альтернативных гипотез, не определённо, потому что на любом конечном интервале можно выбрать бесконечное множество количественно близких и практически неразличимых параметров гипотетических законов.

Проиллюстрируем на примере гипотезы о нормальности распределения геометрический смысл вероятностей ошибок I и II рода (Рис. 3.3).

Изготовитель и потребитель независимо определяют как параметры положения своих гипотез а0 и аA, так и вероятности своих рисков и . Изготовитель, стараясь уменьшить вероятность P(B | H0) = ошибки первого рода, раздвигает границы доверительного интервала, чем автоматически воздействует на вероятность P(A | H a) = ошибки второго рода, увеличивая её. Этому, естественно, противодействует потребитель, изменяя параметр положения аA своей гипотезы H a таким образом, чтобы вероятность вновь стала приемлемой для него. Установление паритета рисков, т.е. выбор параметров положения ао и аA под условием = - один из способов решения этой проблемы.

0 ао u аа U

Рис. 3.3 Основная и альтернативная гипотезы:

Соседние файлы в папке Стат_Примитивы