
- •Образовательное учреждение
- •Высшего Профессионального образования
- •«Башкирский Государственный Университет»
- •«Математическая статистика»
- •Для студентов экономического факультета
- •Содержание
- •Раздел 1.
- •Раздел 2.
- •Раздел 3. Введение
- •Тема 1.1. Первичная обработка данных.
- •Самостоятельная работа.
- •1.2. Эмпирическая функция распределения
- •Самостоятельная работа.
- •1.3. Полигон и гистограмма
- •Тема 2.1. Оценки параметров распределений.
- •Самостоятельная работа.
- •2.2. Метод моментов
- •Самостоятельная работа.
- •2.3. Метод наибольшего правдоподобия
- •Самостоятельная работа.
- •2.4. Интервальные оценки
- •Самостоятельная работа.
- •Тема 2.?. Проверка статистических гипотез.
- •2.Схема проверки нулевой гипотезы:
- •3.Сравнение выборочной средней с математическим ожиданием
- •Самостоятельная работа.
- •4. Сравнение двух дисперсий
- •Самостоятельная работа.
- •5.Сравнение двух математических ожиданий
- •Самостоятельная работа.
- •6. Проверка гипотезы о распределении. Критерий Пирсона
- •Самостоятельная работа.
- •Тема ?. Простая и множественная регрессии. ?. Линейная регрессия с несгруппированными данными
- •Самостоятельная работа.
- •5.1. Линейная регрессия со сгруппированными данными
- •Самостоятельная работа
- •6. Дисперсионный анализ.
- •Контрольная работа по математической статистике Задания
Самостоятельная работа
1. Найти уравнение регрессии X на Y по данным:
|
10 |
15 |
20 |
25 |
30 |
35 |
15 |
6 |
4 |
— |
— |
— |
— |
25 |
— |
6 |
8 |
— |
— |
— |
35 |
— |
— |
— |
21 |
2 |
5 |
45 |
— |
— |
— |
4 |
12 |
6 |
55 |
— |
— |
— |
— |
1 |
5 |
1. Найти уравнение регрессии X на Y по данным:
|
5 |
10 |
15 |
20 |
25 |
30 |
14 |
4 |
6 |
— |
8 |
— |
4 |
24 |
— |
8 |
10 |
— |
6 |
— |
34 |
— |
— |
32 |
— |
— |
— |
44 |
— |
— |
4 |
12 |
6 |
— |
1. Найти уравнение регрессии X на Y по данным:
|
10 |
15 |
20 |
25 |
30 |
35 |
40 |
100 |
2 |
4 |
— |
8 |
4 |
— |
10 |
110 |
3 |
— |
5 |
— |
2 |
10 |
— |
120 |
— |
3 |
— |
4 |
5 |
6 |
— |
130 |
2 |
— |
2 |
6 |
— |
— |
5 |
140 |
— |
4 |
7 |
— |
— |
1 |
5 |
6. Дисперсионный анализ.
Дисперсионным анализом называется статистический метод анализа результатов испытаний, цель которого – оценить влияние одного или нескольких качественных факторов на рассматриваемую величину Х.
Схема однофакторного дисперсионного анализа рассмотрена ниже на примере исследования влияния различных видов рекламы на прибыль предприятия.
Если разделить виды рекламы на несколько групп (уровней фактора) и через одинаковые интервалы времени измерять прибыль, то результаты можно представить в виде таблицы:
-
Номер измерения
Уровни фактора
…
1
…
2
…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
q
…
Групповая
средняя
…
Число измерений на каждом уровне считается одинаковым и равным q.
В последней строке помещены групповые средние для каждого уровня фактора.
Общую среднюю можно получить как среднее арифметическое групповых средних:
=
.
На
разброс прибыли относительно общей
средней влияют как измерения уровня
рассматриваемого фактора, так и случайные
факторы. Для того чтобы учесть влияние
данного фактора, общая выборочная
дисперсия разбивается на две части,
первая из которых называется факторной
(
), а вторая − остаточной
(
).
С целю учета этих составляющих вначале рассчитывается общая сумма квадратов отклонений вариант от общей средней
=
−
(6.1)
и факторная сумма квадратов отклонений групповых средних от общей средней, которая и характеризует влияние данного фактора,
=
q
(6.2)
Последнее
выражение получено путем замены каждой
варианты в выражение
групповой средней для данного фактора.
Остаточная сумма квадратов отклонений
получается как разность
=
Для определения общей выборочной
дисперсии необходимо
разделить на число измерений pq
:
=
,
а для получения несмещенной общей
выборочной дисперсии это выражение
нужно умножить на
=
,
где
— число степеней свободы несмещенной
общей выборочной дисперсии.
Соответственно,
для несмещенной факторной выборочной
дисперсии
,
где
— число степеней свободы несмещенной
факторной выборочной дисперсии.
Для
несмещенной остаточной выборочной
дисперсии число степеней свободы будет
равно разности
−
=
и выражение дисперсии примет вид
=
. С целью оценки влияние фактора на
изменения рассматриваемого параметра
рассчитывается величина
=
. Так как отношение двух выборочных
дисперсий
Фишера
Снедекора,
то полученное значение
сравнивают со значением функции
распределения F
=
в критической точке fкр
,
соответствующей выбранному уровню
значимости α (см. Приложение 5).
Если
>
,то фактор оказывает существенное
воздействие и его следует учитывать, в
противном случае он оказывает
незначительное влияние, которым можно
пренебречь. Для расчета
и
могут
быть использованы такие формулы
=
–
(
(6.3)
= q (5.2) (6.4)
Задача 1. Для проверки влияния внутрицехового оформления на качество продукции рассмотрены три участка по производству однотипной продукции и проведена выборочная проверка процента брака за пять месяцев. Результаты помещены в табл. 1.
Методом дисперсионного анализа при уровне значимости α = 0,05 проверить нулевую гипотезу о существенном влиянии оформления участка на качество продукции.
Т а б л и ц а 1.
-
Номер измерения
Уровни фактора
1
2
3
1
2
4
5
4
3
3
4
5
4
2
3
10
5
1
6
3
Групповая
средняя
2,4
4,2
4,6
Решение.
Находим общую среднюю:
=
=
3,73.
Для расчета по формуле (27.3) составляем таблицу квадратов вариант:
-
Номер измерения
Уровни фактора
1
4
9
1
2
16
25
16
3
9
16
25
4
4
9
100
5
1
36
9
Групповая
средняя
34
95
151
Вычисляем :
= 34 + 95 + 151 – 3 · 5 · 3,732 = 71,3.
Находим по формуле (27.4):
= 5(2,42 + 4,22 + 4,62 – 3 · 3,732) = 14,1.
Получаем :
= − = 71,3 – 14,1 = 57,2.
Определяем факторную и остаточную дисперсии:
=
Находим
Для уровня значимости α = 0,05, чисел степеней свободы 2 и 12 находим из таблицы Фишера Снедекора (см. Приложение 5):
В связи с тем, что > , нулевую гипотезу о существенном влиянии внутрицехового оформления на процент брака отвергаем.
2. В условиях задачи 1, но с другими выборочными значениями процента брака (табл. 27.2) оценить влияние внутрицехового оформления на качество продукции.
Т а б л и ц а 2.
-
Номер измерения
Уровни фактора
1
2
5
7
2
3
4
8
3
4
4
8
4
2
5
7
5
3
5
8
3. Проведено по пять испытаний на каждом из четырех уровней фактора Ф. Результаты испытаний приведены в
табл. 3.
Методом дисперсионного анализа при уровне значимости α = 0,05 проверить нулевую гипотезу о равенстве групповых средних.
Т а б л и ц а 3.
-
Номер измерения
Уровни фактора
1
36
56
52
39
2
47
61
57
57
3
50
64
59
63
4
58
66
58
61
5
67
66
79
65
4. В трех филиалах одного из банков были организованы три уровня различных услуг для клиентов. После этого в течение шести месяцев измерялись объемы вкладов Х (тыс. руб.). Данные приведены в табл..4. Проверить нулевую гипотезу о влиянии организации услуг на объемы вкладов при уровне значимости 0,05.
Т а б л и ц а 4.
-
Номер измерения
Уровни фактора
Ф3
1
10
17
14
2
15
15
18
3
14
25
30
4
18
22
27
5
20
30
34
6
16
28
40