- •Содержание
- •Раздел 2. Математическая статистика. 100
- •Предисловие
- •Раздел 1. Теория вероятностей
- •Случайные события. Вероятность
- •2. Геометрический способ задания вероятности.
- •3. Дискретный способ задания вероятности.
- •4. Статистический способ задания вероятности.
- •Свойства вероятностей. Условная вероятность. Независимость событий. Теоремы сложения и умножения вероятностей
- •Формула полной вероятности. Формулы Байеса (теорема гипотез)
- •Случайные величины
- •Дискретные случайные величины
- •Законы распределения дискретных случайных величин
- •Непрерывные случайны величины.
- •Законы распределения непрерывной случайной величины
- •Предельные теоремы и закон больших чисел
- •Двумерные случайные величины
- •Случайные функции. Цепи Маркова
- •Раздел 2. Математическая статистика.
- •2.1. Выборочные статистики
- •2.2. Статистическое оценивание.
- •Для дискретной случайной величины
- •Если и при , то - состоятельная оценка параметра .
- •2.3 Статистические решения
- •2.3.1. Статистическая гипотеза. Проверка гипотезы о среднем значении при известной и неизвестной дисперсиях.
- •2.3.2. Проверка гипотез о дисперсии.
- •2.3.3. Проверка гипотезы о равенстве значений двух средних из нормально распределенных генеральных совокупностей
- •2.4. Критерии согласия.
- •Литература
- •Ответы, указания и решения
- •Теория вероятностей
- •Случайные события. Вероятность
- •Свойства вероятностей. Условная вероятность. Независимость событий. Теоремы сложения и умножения вероятностей
- •Формула полной вероятности. Формулы Байеса (теорема гипотез)
- •Случайные величины Дискретные случайные величины
- •Закон распределения дискретных случайных величин
- •Непрерывные случайные величины
- •Законы распределения непрерывной случайной величины
- •Предельные теоремы и законы больших чисел
2.3.3. Проверка гипотезы о равенстве значений двух средних из нормально распределенных генеральных совокупностей
Рассмотрим нормально распределенные случайные величины X и Y. Пусть в результате наблюдения получены две независимые выборки объемами n1 и n2. Проверим гипотезу H0 о равенстве математических ожиданий случайных величин X и Y: М(Х) = M(Y) при альтернативной гипотезе H1: М(Х) М(Y).
Если σ(Х) и σ(Y) известны, то в качестве статистической характеристики принимаем величину
,
(3.3)
имеющую
нормальный закон распределения с
параметрами 0 и 1:
.
Критическая
область (–∞; –
]
[
;
+∞) определяется таким образом, чтобы
|Z|
,
где
находят из условия P(|Z|
)
=
,
т.е. Ф*(
)=
1–
,
для уровня значимости α0.
При альтернативной гипотезе H1 : М(Х) > М(Y), находят из условия P(Z – )=α0, т. е. Ф*( )= , для уровня значимости α0. Тогда, если Zpacч – то, нулевую гипотезу отвергают; в противном случае (Zpaсч >– ) нет оснований отвергать нулевую гипотезу.
При альтернативной гипотезе H1 : М(Х) < М(Y), находят из условия P(Z ) = α0, т. е. Ф*( ) =1–α0 для уровня значимости α0 (по таблице значений функции Ф*(z)). Если Zрасч , то нулевую гипотезу отвергают; в противном случае (Zрасч < zα) нет оснований отвергать нулевую гипотезу.
Пусть для нормально распределенных случайных величин X и Y дисперсии σ2(X) и σ2(Y) неизвестны. Тогда в качестве статистической характеристики принимаем величину
,
(3.4)
имеющую
распределение Стьюдента с
степенями свободы.
При
альтернативной гипотезе H1
: М(Х)
М(Y)
критическую область (
∞;
–;
]
[
;
v;
+∞) определяют таким образом, чтобы |T|
;
v,где
находят
из условия Р(|Т|
;
v)
= α0/2
для уровня значимости
по
таблице значений распределения Стьюдента
с
степенями свободы (приложение 3).
Тогда, если |Tрасч| , нулевую гипотезу отвергают; в противном случае (|Tрасч| < ) нет оснований отвергать нулевую гипотезу.
При альтернативной гипотезе H1: М(Х)>М(Y) (или М(Х)<M(Y)) находят из условия P(T ) = α0 (или P(T – ) = α0) для уровня значимости α0 по таблице значений распределения Стьюдента с степенями свободы.
Если Tрасч> (или Tрасч<– ), то нулевую гипотезу отвергают; в противном случае (Tрасч< или Tрасч>– ) нет оснований отвергать нулевую гипотезу.
Если объемы выборок n1 и n2 достаточно велики, то в качестве статистической характеристики для проверки нулевой гипотезы используется величина
(3.5)
Величина
(3.5) имеет нормальный закон распределения
с параметрами 0 и 1:
.
Задачи
3.31. В двух фирмах, выпускающих детское питание, производилась оценка качества продукции. В фирме А, где проверялось 30 единиц продукции, средняя сумма баллов оказалась равной 52. Во второй фирме В проверялось 36 единиц продукции, и их средняя сумма баллов оказалась равной 47. Среднее квадратичное отклонение суммы баллов, вычисленное для нескольких тысяч единиц продукции, σ = 12. Определить, лучшее ли питание выпускается фирмой А, чем фирмой В.
Решение. Из условия следует, что проверенная продукция фирмы А лучше, чем продукция фирмы В. Можно ли утверждать, что фирма А выпускает лучшую продукцию, чем фирма B?
Сформулируем
гипотезы. Основная гипотеза H0
:
=
,
где
и
– средние совокупностей балльных оценок
детского питания, производимого фирмами
А и В соответственно. Альтернативная
гипотеза H1:
>
.
Поскольку нас интересует, лучшее ли детское питание выпускается фирмой А , чем фирмой В, воспользуемся односторонней альтернативной гипотезой. Возьмем уровень значимости α0= 0,05. Из условия задачи известно, что nA = 30, nB = 36.
В данной задаче нет другой информации, кроме двух выборочных средних. Поэтому разность средних – представляет собой меру сравнения качества детского питания фирм А и В. Эта величина распределена приближенно нормально со средним – и стандартным отклонением
(3.6)
В качестве статистики возьмем стандартную нормальную величину
(3.7)
Критическое
значение
при
5%-м уровне значимости для односторонней
проверки гипотез равно 1,65 (см таблицу
3.1). Поэтому областью принятия нулевой
гипотезы
будет множество значений
,
не превосходящих 1,65, т.е. интервал
.
Если
выборочное значение
1,65, то делаем вывод, что фирмой А
выпускается детское питание лучшего
качества, чем фирмой В.
Если < 1,65, то заключаем, что в общем фирмы А и В выпускают детское питание одинакового качества.
Так как по формуле (3.6) имеем
,
то выборочное значения статистики (3.7) равно:
.
Значение
статистики
=
1,6515 >
1,65. Поэтому при 5%-м уровне значимости
можно утверждать, что фирма А выпускает
лучшее детское питание, чем фирма В.
Ответ: фирма А выпускает детское питание лучшего качества, чем фирма В.
3.32. Покрышки автомобиля были исследованы на износ после 10 000 км пути. Каждая покрышка сделана наполовину из резины сорта А, наполовину – из резины сорта В. Все колеса вращаются с одинаковой скоростью, поэтому можно считать, что они находятся в одинаковых условиях. Результаты исследования (в баллах) приведены в табл. 3.4.
Таблица 3.4
Номер покрышки |
1 |
2 |
3 |
4 |
Износ резины сорта А |
32 |
40 |
36 |
35 |
Износ резины сорта В |
25 |
28 |
27 |
26 |
Сделать проверку односторонней гипотезы о том, что резина сорта В больше изнашивается, чем резина сорта А, при уровне значимости критерия α0 = 0,05.
3.33. В магазине отобрали случайным образом по 40 банок «Солянки» производства двух заводов. Каждая из банок была оценена в баллах с помощью органолептических показателей. Результаты оценки приведены в табл. 3.5.
Таблица 3.5
|
Завод № 1 |
Завод № 2 |
Средний балл |
71 |
76 |
Стандартное отклонение |
5 |
6 |
Проверить при уровне значимости 0,05 гипотезу о том, что консервы завода № 2 лучшего качества, чем завода № 1.
3.34. На некотором поле выбрали 100 участков земли; 50 участков засеяли одним сортом ячменя, 50 – другим сортом. На первых 50 участках получили урожай в среднем 60 ц/га со стандартным отклонением 3 ц/га. Средний урожай на участках, засеянных ячменем другого сорта, оказался равным 65 ц/га со стандартным отклонением 3,5 ц/га. Будет ли средний урожай этого сорта ячменя значимо превосходить средний урожай ячменя первого сорта? Принять α0 = 0,05.
3.35. Для проверки эффективности нового лекарства были отобраны две случайные группы по 50 человек, страдающих гриппом. Одной группе давали таблетки, не содержащие никакого лекарства, другой группе давали такие же по внешнему виду таблетки, но содержащие новый вид лекарства от гриппа. В первой группе люди выздоровели в среднем через 7 дней, а во второй – через 6 дней. Стандартное отклонение продолжительности лечения одного человека от гриппа независимо от того, принимал или не принимал он лекарства, можно положить равным двум дням. Можно ли на основании полученных результатов сказать, что новое лекарство существенно ускоряет выздоровление?
3.36. Было произведено 12 измерений диаметра вала. При этом оказалось, что среднее = 10,20 мм, а стандартное отклонение 0,05 мм. Затем вал поместили в условия с высокой температурой и произвели еще 8 измерений диаметра его оси. Среднее на этот раз оказалось равным 10,25 мм, а стандартное отклонение – 0,05. Можно ли сделать вывод, что диаметр вала существенно увеличивается при 5%-м уровне значимости в пространстве с высокой температурой?
3.37. Студенты экономического и гуманитарного университетов сдавали экзамен по математике. В экономическом университете, где экзаменовались 30 студентов, средняя оценка оказалась 4,52. В гуманитарном университете сдавали экзамен 36 студентов, их средняя оценка оказалась равной 4,47. Среднее квадратичное отклонение оценок по математике, вычисленное для нескольких студентов, σ = 0,12. Лучше ли подготовлены по математике студенты экономического университета, чем студенты гуманитарного университета? Принять α0 = 0,05.
3.38. С целью ускорения производства интегральных схем производственная линия была модифицирована. Для исследования эффекта от этой модификации было зафиксировано время изготовления каждой из 50 интегральных схем при старом и новом процессах. Для немодифицированного процесса среднее время изготовления одной интегральной схемы оказалось равным 35с, а для процесса, подвергшегося модификации –33с. Стандартные отклонения времени изготовления интегральной схемы для первого и второго процессов можно считать приблизительно одинаковыми. Вычисленное значение объединенной оценки среднего квадратичного отклонения равно 1,5с. Можно ли сделать вывод, что скорость изготовления интегральной схемы при модифицированном процессе больше?
3.39. Месячная заработная плата для выборки из 50 рабочих определенной фирмы составляет 910 тыс. р. при среднем квадратичном отклонении 1,44 тыс. р., а заработная плата для выборки из 40 рабочих другой фирмы равна 905 тыс. р. при среднем квадратичном отклонении 1,50 тыс. р. Выше ли заработная плата в первой фирме, чем во второй? Уровень значимости принять равным 0,01.
3.40. Средний диаметр для случайной выборки из 65 подшипников, обработанных на каком-либо станке, равен 0,24 см при среднем квадратичном отклонении σ =0,02 см. На следующий день из числа обработанных на этом станке подшипников вновь отбирают 65 штук и устанавливают, что их средний диаметр равен 0,25 см при среднем квадратичном отклонении 0,04 см. Требуется ли переналадки станок? Уровень значимости α0 принять равным 0,05.
