- •§ 2. Закон распределения вероятностей дискретной двумерной случайной величины
- •§ 3. Функция распределения двумерной случайной величины.
- •§ 4. Свойства функции распределения двумерной случайной величины
- •§ 5. Вероятность попадания случайной точки в полуполосу
- •§ 6. Вероятность попадания случайной точки в прямоугольник
- •§ 7. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •§ 8. Нахождение функции распределения системы по известной плотности распределения
- •§ 9. Вероятностный смысл двумерной плотности вероятности.
- •§ 10. Вероятность попадания случайной точки в произвольную область
- •§11. Свойства двумерной плотности вероятности
- •§ 12. Отыскание плотностей вероятности составляющих двумерной случайной величины
- •§ 13. Условные законы распределения составляющих системы дискретных случайных величин
- •§ 14. Условные законы распределения составляющих системы непрерывных случайных величин
- •§ 15. Условное математическое ожидание
- •§ 16. Зависимые и независимые случайные величины
- •§ 17. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •§ 18. Коррелированность и зависимость случайных величин
- •§ 19. Нормальный закон распределения на плоскости
- •§ 20. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •§ 21. Линейная корреляция. Нормальная корреляция
- •§ 1. Задачи математической статистики
- •§ 2. Краткая историческая справка
- •§ 3. Генеральная и выборочная совокупности
- •§ 4 Повторная и бесповторная выборки. Репрезентативная выборка
- •§ 5. Способы отбора
- •§ 6. Статистическое распределение выборки
- •§ 7. Эмпирическая функция распределения
- •§ 8. Полигон и гистограмма
- •§ 1. Статистические оценки параметров распределения
- •§ 2. Несмещенные, эффективные и состоятельные оценки
- •§ 3. Генеральная средняя
- •§ 4. Выборочная средняя
- •§ 5. Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •§ 6. Групповая и общая средние
- •§ 7. Отклонение от общей средней и его свойство
- •§ 8. Генеральная дисперсия
- •§ 9. Выборочная дисперсия
- •§ 10. Формула для вычисления дисперсии
- •§11. Групповая, внутригрупповая, межгрупповая и общая дисперсии
- •§ 12. Сложение дисперсий
- •§ 13. Оценка генеральной дисперсий по исправленной выборочной
- •§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
- •§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •§ 16. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
- •§ 17. Оценка истинного значения измеряемой величины
- •§ 18. Доверительные интервалы для оценки среднего квадратического отклонения σ нормального распределения
- •§ 19. Оценка точности измерений
- •§ 20. Оценка вероятности (биномиального распределения) по относительной частоте
- •§ 21. Метод моментов для точечной оценки параметров распределения
- •§ 22. Метод наибольшего правдоподобия
- •§ 23. Другие характеристики вариационного ряда
- •§ 1. Условные варианты
- •§ 2. Обычные, начальные и центральные эмпирические моменты
- •§ 3. Условные эмпирические моменты. Отыскание центральных моментов по условным
- •§ 4. Метод произведений для вычисления выборочных средней и дисперсии
- •§ 5. Сведение первоначальных вариант к равноотстоящим
- •§ 6. Эмпирические и выравнивающие (теоретические) частоты
- •§ 7. Построение нормальной кривой по опытным данным
- •§ 8. Оценка отклонения эмпирического распределения от нормального. Асимметрия и эксцесс
- •§ 1. Функциональная, статистическая и корреляционная зависимости
- •§ 2. Условные средние
- •§ 3. Выборочные уравнения регрессии
- •§ 4. Отыскание параметров выборочного уравнения прямой линии среднеквадратичной регрессии по не сгруппированным данным
- •§ 5. Корреляционная таблица
- •§ 6. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным
- •§ 7. Выборочный коэффициент корреляции
- •§ 8. Методика вычисления выборочного коэффициента корреляции
- •§ 9. Пример на отыскание выборочного уравнения прямой линии регрессии
- •§ 10. Предварительные соображения к введению меры любой корреляционной связи
- •§ 11. Выборочное корреляционное отношение
- •§ 12. Свойства выборочного корреляционного отношения
- •§ 13. Корреляционное отношение как мера корреляционной связи. Достоинства и недостатки этой меры
- •§ 14. Простейшие случаи криволинейной корреляции
- •§ 15. Понятие о множественной корреляции
- •§ 1. Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы
- •§ 2. Ошибки первого и второго рода
- •§ 3. Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия
- •§ 4. Критическая область. Область принятия гипотезы. Критические точки
- •§ 5. Отыскание правосторонней критической области
- •§ 6. Отыскание левосторонней и двусторонней критических областей
- •§ 7. Дополнительные сведения о выборе критической области. Мощность критерия
- •§ 8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •§ 9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •§ 10. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- •§ 11( Сравнение двух средних произвольно распределенных генеральных совокупностей (большие независимые выборки)
- •§ 12. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- •§ 13. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности а. Дисперсия генеральной совокупности известна.
- •§ 14. Связь между двусторонней критической областью и доверительным интервалом
- •§ 15. Определение минимального объема выборки при сравнении выборочной и гипотетической генеральной средних
- •§ 16. Пример на отыскание мощности критерия
- •§ 17. Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки)
- •§ 18. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
§ 10. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
Пусть генеральные совокупности Х и У распределены нормально, причем их дисперсии известны (например, из предшествующего опыта или найдены теоретически). По независимым выборкам, объемы которых соответственно равны n и m, извлеченным из этих совокупностей, найдены выборочные средние и .
Требуется по выборочным средним при заданном уровне значимости α проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой, т. е.
Н0:М(Х)==М(У).
Учитывая, что выборочные средние являются несмещенными оценками генеральных средних (см. гл. XV, § 5), т. е. М () = М (X) и М () = М (Y), нулевую гипотезу можно записать так:
Н0:М()=М().
Таким образом, требуется проверить, что математические ожидания выборочных средних равны между собой. Такая задача ставится потому, что, как правило, выборочные средние оказываются различными. Возникает вопрос: значимо или незначимо различаются выборочные средние?
Если окажется, что нулевая гипотеза справедлива, т. е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки.
Например, если физические величины А и В имеют одинаковые истинные размеры, а средние арифметические и результатов измерений этих величин различны, то это различие незначимое.
Если нулевая гипотеза отвергнута, т. е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны. Например, если среднее арифметическое результатов измерений физической величины А значимо отличается от среднего арифметического результатов измерений физической величины В, то это означает, что истинные размеры (математические ожидания) этих величин различны.
В качестве критерия проверки нулевой гипотезы примем случайную величину
,
Эта величина случайная, потому что в различных опытах и принимают различные, наперед неизвестные значения.
Пояснение. По определению среднего квадратического отклонения, .
На основании свойства 4 (см. гл. VIII, § 5), D(-)=D()+D().
По формуле (*) (см. гл. VIII, § 9), D()=D(X)/n, D()=D(Y)/m.
Следовательно,
.
Критерий Z—нормированная нормальная случайная величина. Действительно, величина Z распределена нормально, так как является линейной комбинацией нормально распределенных величин и ; сами эти величины распределены нормально как выборочные средние, найденные по выборкам, извлеченным из нормальных генеральных совокупностей; Z — нормированная величина потому, что М (Z) = 0; при справедливости нулевой гипотезы σ(Z)==1, поскольку выборки независимы.
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза Н0: М (X) = М (Y). Конкурирующая гипотеза Н1: М(Х)≠М(У).
В этом случае строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α.
Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда «левая» и «правая» критические точки выбраны так, что вероятность попадания критерия в каждый из двух интервалов критической области равна α/2:
Р (Z < zлев. кр) = α/2, Р (Z > zправ. кр) = α/2.
Поскольку Z—нормированная нормальная величина, а распределение такой величины симметрично относительно нуля, критические точки симметричны относительно нуля.
Таким образом, если обозначить правую границу двусторонней критической области через zкр, то левая граница равна— zкр (рис. 25).
Итак, достаточно найти правую границу, чтобы найти саму двустороннюю критическую область Z < — zкр, Z > zкр и область принятия нулевой гипотезы (—zкр, zкр).
Покажем, как найти zкр —правую границу двусторонней критической области, пользуясь функцией Лапласа Ф(z). Известно, что функция Лапласа определяет вероятность попадания нормированной нормальной случайной величины, например Z, в интервал (0, z):
Р(0<Z<z) = Ф(z). (**)
Так как распределение Z симметрично относительно нуля, то вероятность попадания Z в интервал (0, ∞) равна 1/2. Следовательно, если разбить этот интервал точкой zкр на интервалы (0, zкр) и (zкр, ∞), то, по теореме сложения,
Р (0 < Z < zкр) + Р (Z > zкр) = 1/2. (***)
В силу (*) и (**) получим
Ф(zкр)+α/2=1/2.
Следовательно,
Ф(zкр)=(1-α)/2.
Отсюда заключаем: для того чтобы найти правую границу двусторонней критической области (zкр), достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное (1—α)/2. Тогда двусторонняя критическая область определяется неравенствами
Z < — zкр, Z > zкр.
или равносильным неравенством |Z| > zкр, а область принятия нулевой гипотезы—неравенством — zкр < Z < zкр, или равносильным неравенством |Z|< zкр.
Обозначим значение критерия, вычисленное по данным наблюдений, через Zнабл и сформулируем правило проверки нулевой гипотезы.
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: М (X) = М (Y) о равенстве математических ожиданий двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе Н1: М (Х) ≠ М (Y), надо вычислить наблюденное значение критерия и по таблице функции Лапласа найти критическую точку по равенству.
Если |Zнабл| < zкр — нет оснований отвергнуть нулевую гипотезу.
Если |Zнабл| > zкр —нулевую гипотезу отвергают.
Пример 1. По двум независимым выборкам, объемы которых соответственно равны n==60 и m =50, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =1250 и =1275. Генеральные дисперсии известны: D(X)=120, D(У)==100. При уровне значимости 0,01 проверить нулевую гипотезу Н0: М(Х) = М(Y), при конкурирующей гипотезе Н1: М (Х) ≠ М (Y).
Решение. Найдем наблюдаемое значение критерия:
.
По условию, конкурирующая гипотеза имеет вид М (Х) ≠ М (Y), поэтому критическая область—двусторонняя. Найдем правую критическую точку:
Ф(zкр)=(1—α)/2=(1—0,01)/2=0,495.
По таблице функции Лапласа (см. приложение 2) находим zкр = 2,58. Так как | Zнабл | > zкр —нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.
Второй случай. Нулевая гипотеза Н0: М (X) = М (Y). Конкурирующая гипотеза Н1: М (X) > М (Y).
На практике такой случай имеет место, если профессиональные соображения позволяют предположить, что генеральная средняя одной совокупности больше генеральной средней другой. Например, если введено усовершенствование технологического процесса, то естественно допустить, что оно приведет к увеличению выпуска продукции. В этом случае строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости (рис. 26):
Р(Z> zкр) = α. (****)
Покажем, как найти критическую точку с помощью функции Лапласа. Воспользуемся соотношением (***):
Р (0 < Z < zкр) + Р (Z > zкр) = 1/2.
В силу (**) и (****) имеем
Ф(zкр)+α=1/2.
Следовательно,
Ф(zкр) = (1-2α)/2.
Отсюда заключаем: для того чтобы найти границу правосторонней критической области (zкр), достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное (1—2α)/2. Тогда правосторонняя критическая область определяется неравенством Z > zкр, а область принятия нулевой гипотезы — неравенством Z < zкр.
Правило 2. Для того чтобы при заданном уровне значимости а проверить нулевую гипотезу Н0: М (X) = М (Y) о равенстве математических ожиданий двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе Н1: М (X) > М (Y), надо вычислить наблюдавшееся значение критерия и по таблице функции Лапласа найти критическую точку из равенства Ф(zкр) = (1-2α)/2.
Если Zнабл < zкр —нет оснований отвергнуть нулевую гипотезу.
Если Zнабл > zкр —нулевую гипотезу отвергают.
Пример 2. По двум независимым выборкам, объемы которых соответственно равны n =10 и m ==10, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =14,3 и = 12,2. Генеральные дисперсии известны: D(Х)==22, D(Y)=18. При уровне значимости 0,05 проверить нулевую гипотезу Н0: М (X) = М (Y), при конкурирующей гипотезе Н1: М (X) > М (Y).
Решение. Найдем наблюдаемое значение критерия:
.
По условию, конкурирующая гипотеза имеет вид М (X) > М (Y), поэтому критическая область—правосторонняя.
По таблице функции Лапласа находим zкр = 1,64. Так как Zнабл < zкр — нет оснований отвергнуть нулевую гипотезу. Другими словами, выборочные средние различаются незначимо.
Третий случай. Нулевая гипотеза Н0: М (X) = М (Y). Конкурирующая гипотеза Н1: М (X) > М (Y).
В этом случае строят левостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости (рис. 27):
Р(Z< z’кр)= α.
Приняв во внимание, что критерий Z распределен симметрично относительно нуля, заключаем, что искомая критическая точка z’кр симметрична такой точке zкр > 0, для которой Р (Z > zкр) = α,' т. е. z’кр = - zкр. Таким образом, для того чтобы найти точку z’кр, достаточно сначала найти «вспомогательную точку» zкр так, как описано во втором случае, а затем взять найденное значение со знаком минус. Тогда левосторонняя критическая область определяется неравенством Z <— zкр, а область принятия нулевой гипотезы—неравенством Z>— zкр.
Правило 3. При конкурирующей гипотезе Н1: М (X) > М (Y) надо вычислить Zнабл и сначала по таблице функции Лапласа найти «вспомогательную точку» zкр по равенству Ф(zкр = (1—2α)/2, а затем положить z’кр = - zкр
Если Zнабл < -zкр —нет оснований отвергнуть нулевую гипотезу.
Если Zнабл > -zкр —нулевую гипотезу отвергают.
Пример 3. По двум независимым выборкам, объемы которых соответственно равны n==50 и m ==50, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние ==142 и =150. Генеральные дисперсии известны: D(Х)=28,2, D(Y)==22,8. При уровне значимости 0,01 проверить нулевую гипотезу Н0: М (X) = М (Y), при конкурирующей гипотезе Н1: М (X) > М (Y).
Решение. Подставив данные задачи в формулу для вычисления наблюдаемого значения критерия, получим Zнабл = - 8.
По условию, конкурирующая гипотеза имеет вид М (X) < М (Y), поэтому критическая область—левосторонняя.
Найдем «вспомогательную точку» zкр:
Ф (zкр) = ( 1-2α)/2 =(1-2·0,01 )/2 = 0,49.
По таблице функции Лапласа находим zкр =2,33. Следовательно, z’кр = — zкр = —2,33.
Так как Zнабл <— zкр —нулевую гипотезу отвергаем. Другими словами, выборочная средняя значимо меньше выборочной средней .