
- •Образовательное учреждение
- •Высшего Профессионального образования
- •«Башкирский Государственный Университет»
- •«Математическая статистика»
- •Для студентов экономического факультета
- •Содержание
- •Раздел 1.
- •Раздел 2.
- •Раздел 3. Введение
- •Тема 1.1. Первичная обработка данных.
- •Самостоятельная работа.
- •1.2. Эмпирическая функция распределения
- •Самостоятельная работа.
- •1.3. Полигон и гистограмма
- •Тема 2.1. Оценки параметров распределений.
- •Самостоятельная работа.
- •2.2. Метод моментов
- •Самостоятельная работа.
- •2.3. Метод наибольшего правдоподобия
- •Самостоятельная работа.
- •2.4. Интервальные оценки
- •Самостоятельная работа.
- •Тема 2.?. Проверка статистических гипотез.
- •2.Схема проверки нулевой гипотезы:
- •3.Сравнение выборочной средней с математическим ожиданием
- •Самостоятельная работа.
- •4. Сравнение двух дисперсий
- •Самостоятельная работа.
- •5.Сравнение двух математических ожиданий
- •Самостоятельная работа.
- •6. Проверка гипотезы о распределении. Критерий Пирсона
- •Самостоятельная работа.
- •Тема ?. Простая и множественная регрессии. ?. Линейная регрессия с несгруппированными данными
- •Самостоятельная работа.
- •5.1. Линейная регрессия со сгруппированными данными
- •Самостоятельная работа
- •6. Дисперсионный анализ.
- •Контрольная работа по математической статистике Задания
5.Сравнение двух математических ожиданий
Пусть
имеются две выборки
,
,…,
и
,
,…,
,
полученные в результате независимых
испытаний. По этим данным рассчитаны
оценки
и y,
а также
и
.
В предположении, что случайные величины
X
и Y
распределены по нормальному закону Х
= N
(
,
)
и Y
= N
(
,
),
требуется проверить на основании
выборочных данных гипотезу
:
=
при условии, что гипотеза о равенстве
дисперсий не отвергается.
Задача 1. Средний ежедневный объем продаж за 1 квартал текущего года для 17 торговцев района А составляет 15 тыс. руб., а для 10 торговцев района В – 13 тыс. руб. при «исправленном» среднем квадратичном отклонении 3 тыс. руб. Каждую группу можно считать случайной независимой выборки из большой совокупности. Существенно ли различие объемов продаж в районах А и В при 5%-м уровни значимости?
Решение: Предположим, что ежедневный объем продаж подчинен нормальному закону распределения. Математическое ожидание и среднее квадратичное отклонение законов распределения районов А и В неизвестны. Предположим, что дисперсии объемов продаж одинаковы. В этих условиях возникает задача оценки статистической гипотезы : = при альтернативной : , если принять за математическое ожидание объема продаж для района А, за - для района В. Выборочные средние и y являются независимыми нормально распределенными случайными величинами. В этом случае в качестве критерия используют функцию
Т=
,
где S
=
Функция Т починена t- распределению для l = m + n – 2 степеней свободы.
По
таблице t-
распределения (см. Приложение 6) для l
= 17 + 10 – 2 = 25 и 5%-го уровня значимости
(для двусторонней критической области)
находим
= 2,06. Это значит, что критическая область
есть интервал(-
;
-2,06) и (2,06;
.
Вычислим
:
=
=
= 2,69, tr
=
= 1,86. Полученное
значение критерия
не принадлежит критической области,
следовательно, разность несущественна
и гипотеза
:
=
принимается. В качестве общей средней
выборочной принимают величину
=
= 14
Задача . В условиях задачи (1) выяснить, существенно ли при 5%-м уровне значимости превышение объема продаж в районе А по сравнению с объемом в районе В.
Решение:
Вопрос в данной задаче отличается от
вопроса в задаче 25.15 тем, что альтернативной
к гипотезе
:
=
становится не гипотеза
:
,
а гипотеза
:
>
. В этом случае критическая область
односторонняя (в частности, правосторонняя),
для
=
25 и
= 0,05 имеем критическую область (1,708;
).
Так как
= 1,86> 1.708 , то величина
входит в критическую область, поэтому
превышение объема продаж в районе А по
сравнению с объемом в районе В существенно
и гипотеза
:
=
отвергается.
Самостоятельная работа.
1. Акционерное общество (АО) выпускает печенье «Русские узоры» в пачках, на которых написано: масса нетто 200 г. Осуществлена выборка для оценки средней массы печенья в пачках, выпущенных московской и Санкт - Петербургской фабриками АО. Результаты выборок таковы (указана масса пачек печенья «Русские узоры»):
Московская фабрика
201, 195, 197, 199, 202, 198, 199, 203, 195, 196, 198, 199, 194, 203, 195, 202, 197
Санкт-петербургская фабрика
203, 207, 191, 193, 197, 201, 196, 192, 194, 195, 198, 196
Предполагая, что случайная величина массы пачки печенья распределена по нормальному закону с одинаковыми дисперсиями, и считая выборки независимыми, определить:
а) средние выборочные и «исправленные» средние квадратичные отклонения массы для каждой фабрики;
б) для = 0,05 значимо или различие между средними выборочными ( если это различие имеется);
в) является ли величина 200 г математическим ожиданием массы при 5%-м уровне значимости?
2. Расход сырья на единицу продукции составил:
По старой технологии
Расход сырья |
|
305 |
307 |
308 |
Число изделий |
|
1 |
4 |
4 |
По новой технологии
расход сырь |
|
303 |
304 |
305 |
308 |
Число изд. |
|
2 |
6 |
4 |
1 |
Предположив,
что существующие случайные величины Х
и У имеют нормальные распределения с
математическими ожиданиями
и
и одинаковыми дисперсиями, проверить:
А) при уровне значимости 0,1 гипотезу : при альтернативной : ;
Б)
при уровне значимости 0,05 гипотезу
:
при альтернативной
:
.
3. Производительность каждого из агрегатов А и В составила (в кг вещества за час работы):
Номер замера |
1 |
2 |
3 |
4 |
5 |
Агрегат А |
14,1 |
13,1 |
14,7 |
13,7 |
14,0 |
Агрегат В |
14,0 |
14,5 |
13,7 |
12,7 |
14,1 |
Можно ли считать производительность агрегатов А и В одинаковой в предположении, что обе выборки получены из нормально распределенных генеральных совокупностей, при уровне значимости = 0,1?
Задача.
Фирма предлагает автоматы по розливу
напитков. При выборке n=16
найдены средняя величина
= 182 г дозы, наливаемой в стакан автоматом
№ 1. По выборке m
= 9 найдена средняя величина y
= 185 г дозы, наливаемой в стакан автоматом
№2. По утверждению изготовителя, случайная
величина наливаемой дозы имеет нормальный
закон распределения с дисперсией, равной
=
25
.
Можно ли считать отличия выборочных
средних случайной ошибкой при уровне
значимости
= 0,01?
Решение. Пусть и - математическое ожидание доз, наливаемых автоматом №1 и автоматом №2. Нулевая гипотеза в данном случае
:
при альтернативных
:
и
:
.
Дисперсия известна
= 25. В качестве критерия справедливости
статистической гипотезы выбирается
функция
Z
=
Распределенная по нормальному закону с параметрами (0,1).
Рассмотрим вначале гипотезу : для альтернативной : . В этом случае критическая область имеет вид (- ; ), где определяется из условия P(Z < ) = .
Так как функция Лапласа – нечетная функция, т.е. Ф(-z) = - Ф(z), а таблица этой функции содержит только положительные значения, то найдем вначале .Для этого вычислим значение функции Лапласа в критической точке: Ф( )= 0,5 – = 0,49. Откуда = 2,33. Значит, левосторонняя критическая область будет (- ; -2,33).
Рассчитаем
:
zr
=
=
= -1,44
Полученное значение = -1,44 не входит в критическую область (- ; -2,33), поэтому нулевая гипотеза принимается.
Рассмотрим значение : при альтернативной : . В этом случае критическая область двусторонняя и имеет вид (- ; )
( ; . Величины и рассчитываются из условий
P(Z < ) = /2 и P(Z > ) = /2.
Воспользовавшись таблицей значений функции Лапласа (см.Приложение 2), имеем
Ф(
)
= 0,5 -
/2
= 0,495, и
=
2,57. Критическая область имеет вид
(-
;-2,57)
(
;
.
Значение
= -1.44 не попадает в критическую область,
поэтому нулевая гипотеза принимается.
4. В таблице приведены результаты измерения процентного содержания крахмала в картофеле
( исследовали 16 клубней различных сортов картофеля) двумя различными способами:
-
№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
11
9
13
8
6
7
6
12
10
11
14
12
7
5
15
11
2
13
9
13
9
8
9
9
9
11
13
11
12
6
6
13
12
При уровне значимости 0,1 можно ли считать, что крахмалистость картофеля одна и та же для обоих способов?
5. Используются два вида удобрений: 1 и 2 . Для сравнения их эффективности были попарно выбраны 20 участков равной площади так, что пару составили участники, однородные по плодородию. Десять участков были отобраны удобрением 1,
А десять, парных им, - удобрений 2.На соответствующих парах участков получили следующий урожай:
-
№
1
2
3
4
5
6
7
8
9
10
1
8,0
8,4
8,0
6,4
8,6
7,7
7,7
5,6
5,6
6,2
2
5,6
7,4
7,3
6,4
7,5
6,1
6,6
6,0
5,5
5,0
При уровне значимости 5% проверить гипотезу о различном влиянии использования удобрения 1 и 2.