- •Сводный курс. Часть 4. Теория вероятностей и математическая статистика
- •19.2.Вероятность случайного события
- •19.3.Основные вероятностные схемы (теоремы)
- •19.3.3. Полная вероятность и формула Бейеса
- •19.3.4.Схема повторных независимых испытаний
- •19.3.4.1.Формулы Бернулли и Пуассона
- •19.3.4.2.Локальная и интегральная теоремы Лапласа
- •20.2. Законы распределения случайных величин.
- •20.3.Числовые характеристики случайных величин.
- •20.4.Типовые распределения.
- •20.4.3.Многомерные случайные величины.
- •20..5.Законы больших чисел.
- •21.2. Обработка статистических данных
- •21.3. Статистические распределения
- •21.7. Точечные оценки числовых характеристик генеральной
- •21.9. Проверка статистических гипотез
- •21.10. Типовые примеры оценки гипотез.
- •21.10.2. Проверка гипотезы о равенстве двух математических ожиданий двух нормально распределенных СВ, дисперсии которых известны для больших независимых выборок .(стр213).
- •21.10.3.Проверка гипотезы о равенстве двух математических ожиданий двух нормально распределенных СВ, дисперсии которых НЕизвестны и равны. (стр215).
- •21.10.4. Проверка гипотезы о равенстве среднего выборочного и гипотетического генерального среднего для нормально распределенной СВ.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Г( |
n |
|
|
|
|
|
|
|
|
|
|
|
|
t 2 |
|
|
) |
|
|
||
|
|
|
|
|
|
|
|
|
|
2 |
|
|
||||
распределения Стьюдента имеет вид s(t,n) = Bn(1+ |
|
), где Bn= |
|
|
|
|
n −1 |
|
||||||||
n −1 |
|
π (n −1)Г( |
) |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
2 |
||||
и, следовательно, не зависит от а и б. При этом s(t,n) четная по t. Поэтому |
|
|
||||||||||||||
Р( |
|
|
хв −а |
|
|
<t γ )=2 ∫γ |
s(t,n)dt = γ . Отсюда получаем интервал |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|||||||||
|
|
|
s |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
||||
(хв- |
t γ |
s |
; хв+ t γ |
s |
|
. Значения t γ |
||||||||||
n |
n ), который накрывает а с надежностью |
γ |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
находим по таблице t( γ ,n) по заданным n и надежности γ .
Примечание. Т.к. lim Bn= |
1 |
, а lim |
1+t |
2 |
=e− |
t 2 |
|
|
|
, то при n →∞ |
|||||
|
2 |
||||||
2π |
|
−n |
|||||
n→∞ |
n→∞ |
(n −1) 2 |
|
|
|
s(t,n) →a нормального распределения. Однако при n<30 (малые выборки) s(t,n) не используют , т.к. такие выборки мало информативны.
D.Оценка истинного значения измеряемой величины.
Пусть имеется n равноточных измерений величины, истинное значение которой неизвестно. Рассмотрим Xi, i=1,2,…,n как случайные независимые нормально распределенные величины(подтверждено экспериментом), имеющие одно и то же математическое ожидание а (истинное значение измеряемой величины) и одинаковые дисперсии б2(равноточные измерения). Для построения оценок можно использовать результаты задач А,В,С. И ,т.к. обычно б известно (приборы перед экспериментом настраивают), то получим
интервальную оценку с надежностью γ в виде (хв−t σn ; хв+t σn ).
Е.Оценка точности измерения.
Т.к. погрешность (иногда говорят точность) определяется средним квадратическим отклонением б, то сначала строят его точечную оценку – исправленное среднее выборочное s. Затем по задаче С строят доверительный
интервал (интервальную оценку) |
1 |
< |
1 |
1 |
с надежностью |
|
. |
|
s(1+q) |
σ |
< s(1−q) |
γ |
|||||
|
|
|
|
|
|
|
|
Пример 21.10. По 16 равноточным измерениям найдено s=0,12 . Найти погрешность измерения с надежностью 0,99.
Решение. По таблице Приложения 4 (q( γ ,n)) по γ =0,99 и n=16 находим q=0,73. После этого интервал для погрешности принимает вид (0,12(1-0,73)<
б<(0,12(1+0,73) или 0,03< б<0,21 с надежностью 99%.
21.9.Проверка статистических гипотез
Пусть сделана выборка (статистика), выборка обработана, построены (указаны, вычислены) оценки. После этого об исследуемом признаке Х (генеральной ) можно высказывать предположения (выдвигать статистические гипотезы).
Статистические гипотезы принято классифицировать на : параметрические – когда делают предположения о параметрах закона
распределения, которому подчиняется исследуемый признак Х;
42
43
непараметрические – когда делают предположения о самом признаке Х или о каких-то аспектах выборочных данных.
В момент выдвижения гипотез их всегда делаю две : основная Но(нулевая) и альтернативная Н1(конкурирующая).
При этом гипотезы могут содержать одно (простая гипотеза) предположение и несколько (сложная гипотеза).
Затем устанавливают правило, по которому дают оценку высказываемой гипотезе – выбирают критерий согласия . Критерий согласия в разных задачах разный.
Выбирают уровень значимости – вероятность отвергнуть основную гипотезу.
Естественно, при принятии тех или иных гипотез не исключены ошибки. Их разделяют на две группы : ошибка 1-го рода – когда отвергается правильная основная гипотеза. Вероятность такой ошибки называют уровнем значимости α . Ошибка 2-го рода, когда принята ложная нулевая гипотеза. Вероятность такой ошибки обозначают β .
При выборе уровня значимости руководствуются последствиями потерь от ошибочно принятых решений. Если ошибка 1-го рода приводит к б`ольшим потерям, чем от ошибки 2-го рода , то уровень значимости следует уменьшить. Однако брать его равным нулю бессмысленно, т.к. в этом случае наверняка будут приняты все основные гипотезы.
Статистическим критерием Z называют СВ, которая служит для проверки гипотезы. Этот критерий может принимать значение, вычисленное по выборочным данным. Это значение Zвыбр.
Критическая область – множество значений критерия, для которых основную гипотезу отвергают. Ее границу находят по таблицам.
Сразу же становится известной область принятия решения – множество значений критерия, для которых нулевую гипотезу принимают.
Если значение Zвыбр попадает в область принятия решений, то говорят : данные не противоречат основной гипотезе. И нет оснований основную гипотезу отклонять.
Если значение Zвыбр не попадает в область принятия решений, то говорят : нет оснований принимать основную гипотезу. И ее отвергают.(стр.206, Гмурман 2001 пособие).
Типовые задачи охватывают ситуации, когда уровни значимости фиксированы (0,01 ; 0,1 ; 0,05 ; 0,999 ; 0,99 ; 0,95); статистические критерии односторонни ( с заранее фиксированым риском принимается только одно решение – отклонить Но. В противном случае говорят – данные не дают оснований отклонить Но). Это означает, что критерии не позволяют делать вывод ”Но - правильная”, т.к. вероятность ошибки 2-го рода остается неизвестной. Этого часто вполне достаточно для практики.
Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Или иначе – мощность – это вероятность отвергнуть нулевую гипотезу при правильности конкурирующей.
43
44
Если идет проверка непараметрической гипотезы, то сначала полагают класс выбранным и проводят оценку параметров предполагаемого распределения внутри этого класса; затем выдвигают гипотезу о самом классе на предмет того, насколько правильно подобрана вероятностная модель.
Для проверки конкретных гипотез (параметрических и непараметрических) можно использовать пакет программ в среде AOCMATEM
в блоке Специальные задачи , раздел Типовые прикладные задачи.
21.10. Типовые примеры оценки гипотез.
21.10.1.(стр.207). Пусть исследуются две (a priori) нормально распределенные генеральные (исследуемые признаки) Х и У. Из них извлечены две выборки(статистики), раЗных объемов n1 и n2.Найдены исправленные
выборочные дисперсии sX2 иsY2 .
Требуется проверить нулевую гипотезу Но: дисперсии равны D(X)=D(Y) при альтернативной гипотезе Н1 – дисперсии связаны соотношением D(X)>D(Y).
Сначала из величин sX2 иsY2 выбирают большую и меньшую s Б2 > sM2 .
Далее работают по правилам. Правило 1.
Требуется проверить нулевую гипотезу Но: дисперсии равны D(X)=D(Y) при альтернативной гипотезе Н1 – дисперсии связаны соотношением
D(X)>D(Y).
Проверка .Вычисляют наблюдаемое(эмпирическое) значение критерия F-
sБ2
- отношения . По таблице критических точек распределения Фишера-
sМ2
Снедекора по заданному (нужному для нас, указанному для работы) критерию значимости α и числам степеней свободы k1= n1-1 (для большей исправленной
дисперсии sБ2 ) и k2= n2-1 находим критическое значение Fкрит (α ,k1 , k2).
Если Fнабл < Fкрит – нет оснований отвергать основную гипотезу; если Fкрит > Fкрит– основную гипотезу отвергают.
Правило 2.
Требуется проверить нулевую гипотезу Но: дисперсии равны D(X)=D(Y) при альтернативной гипотезе Н1 – дисперсии связаны соотношением
D(X) ≠D(Y).
Проверка . Вычисляют наблюдаемое(эмпирическое) значение критерия F-
sБ2
- отношения . По таблице критических точек распределения Фишера-
sМ2
Снедекора по заданному (нужному для нас, указанному для работы) критерию значимости 0,5α и числам степеней свободы k1= n1-1 (для большей
исправленной дисперсии sБ2 ) и k2= n2-1 находим критическое значение
Fкрит (0,5α ,k1 , k2).
Если Fнабл < Fкрит – нет оснований отвергать основную гипотезу; если
44
45
Fкрит > Fкрит– основную гипотезу отвергают.
Пример.(стр.207). По двум независимым выборкам, с объемами n1 =11 и n2=14 извлеченными из нормальных генеральных, найдены исправленные
выборочные дисперсии sX2 =0,76 и sY2 =0,38. При уровне значимости α =0,05
проверить нулевую гипотезу Но о том, что D(X)=D(Y) при альтернативной гипотезе Н1 – дисперсии связаны соотношением D(X)>D(Y).
sX2
Решение. Найдем отношение =2. По таблице Приложения находим
sY2
Fкрит (0,05,10, 13)=2,67. Т.к. 2=Fнабл <2,67= Fкрит , то нет оснований отвергать гипотезу о равенстве дисперсий. Иначе – выборочные дисперсии различаются
незначимо.
21.10.2. Проверка гипотезы о равенстве двух математических ожиданий двух нормально распределенных СВ, дисперсии которых известны для больших независимых выборок .(стр213).
Исследуются две нормально распределенные генеральные (признаки). Извлечены независимые большие выборки объемами n и m (n>30 , m>30).
Вычислены средние выборочные x и y . Известны генеральные дисперсии D(X)
и D(Y).
Требуется по заданному уровню значимости α проверить основную гипотезу Но о равенстве математических ожиданий М(Х)=М(У) (о равенстве генеральных средних).
Правило 1. Требуется проверить нулевую гипотезу Но: о равенстве математических ожиданий М(Х)=М(У) при альтернативной гипотезе Н1 – генеральные средние связаны М(Х) ≠М(Y) (не равны).
Вычисляем наблюдаемое значение критерия Zвыбр по формуле
x − y
Zвыбр = D( X ) D(Y )
n + m
. Затем по таблице функции Лапласа Ф(х) найти Zкрит
из равенства Ф(Zкрит)=0,5(1-α ).
Если Zвыбр < Zкрит , то нет оснований отвергать основную гипотезу; если Zвыбр > Zкрит , то основную гипотезу отвергают (данные эксперимента не позволяют сделать вывод о ее справедливости).
Правило 2. Требуется проверить нулевую гипотезу Но: о равенстве математических ожиданий М(Х)=М(У) при альтернативной гипотезе Н1 – генеральные средние связаны М(Х)> М(Y) .
Вычисляем наблюдаемое значение критерия Zвыбр по формуле
45