
- •Образовательное учреждение
- •Высшего Профессионального образования
- •«Башкирский Государственный Университет»
- •«Математическая статистика»
- •Для студентов экономического факультета
- •Содержание
- •Раздел 1.
- •Раздел 2.
- •Раздел 3. Введение
- •Тема 1.1. Первичная обработка данных.
- •Самостоятельная работа.
- •1.2. Эмпирическая функция распределения
- •Самостоятельная работа.
- •1.3. Полигон и гистограмма
- •Тема 2.1. Оценки параметров распределений.
- •Самостоятельная работа.
- •2.2. Метод моментов
- •Самостоятельная работа.
- •2.3. Метод наибольшего правдоподобия
- •Самостоятельная работа.
- •2.4. Интервальные оценки
- •Самостоятельная работа.
- •Тема 2.?. Проверка статистических гипотез.
- •2.Схема проверки нулевой гипотезы:
- •3.Сравнение выборочной средней с математическим ожиданием
- •Самостоятельная работа.
- •4. Сравнение двух дисперсий
- •Самостоятельная работа.
- •5.Сравнение двух математических ожиданий
- •Самостоятельная работа.
- •6. Проверка гипотезы о распределении. Критерий Пирсона
- •Самостоятельная работа.
- •Тема ?. Простая и множественная регрессии. ?. Линейная регрессия с несгруппированными данными
- •Самостоятельная работа.
- •5.1. Линейная регрессия со сгруппированными данными
- •Самостоятельная работа
- •6. Дисперсионный анализ.
- •Контрольная работа по математической статистике Задания
Самостоятельная работа.
На основании полученных измерений величин X и Y
-
X
4
6
8
10
12
Y
5
8
7
9
14
найти линейную регрессию Y на X и выборочный коэффициент корреляции.
На основании полученных по результатам измерений значений величин X и Y
-
X
3
5
7
9
10
12
Y
14
10
9
9
6
5
найти линейную регрессию X на Y и выборочный коэффициент корреляции.
В магазине постельных принадлежностей были проведены в течение пяти дней подсчеты числа покупок простыней X и подушек Y:
-
X
10
20
25
28
30
Y
5
8
7
12
14
(В данной таблице значения Х расставлены в возрастающем порядке.) Найти выборочное уравнение линейной регрессии Y на Х и выборочной коэффициент корреляции.
5.1. Линейная регрессия со сгруппированными данными
В
том случае, когда варианты парной выборки
встречаются по несколько раз, причем с
одним значением варианты
может встретиться несколько вариант
,
их обычно представляют в виде корреляционной
таблицы. На пересечении строк и столбцов
этой таблицы отмечается частота
выбора соответствующей пары (
,
),
а частота вариант
(i
= 1, 2,...,
),
(i
= 1, 2,...,
)
находятся как суммы значений
по соответствующей строке или столбцу.
Например, в корреляционной таблице
-
10
20
30
5
3
-
2
5
10
5
4
2
11
8
4
4
n = 16
Пара
(10;5) встречается 3 раза, т.е.
=
3, а частота появления величины
=
5 находится как сумма
=
3 + 2 = 5.
Очевидно,
что
Для коэффициента корреляции случайных величин X и Y в случае сгруппированных данных используется выражение
r
=
где
Ũ
=
Ṽ =
.
После
расчета
,
,
,
и
получают выборочное уравнение линейной
регрессии Y
на X
в виде
или выборочное уравнение линейной
регрессии Х на Y
в виде
.
Для упрощения расчетов часто используются
условные
варианты,
которые подсчитываются по формулам
,
,
где С
,
С
-
ложные нули (выбираемые значения);
,
- разности между соседними значениями
Х и Y.Соответственно,
для обратного перехода применяются
выражения
где
- средние значения условных вариант;
-
средние квадратичные отклонения условных
вариант.
Для подсчета выборочного коэффициента корреляции в этом случае используется формула
,
,
Подсчитав выборочный коэффициент корреляции через условные варианты и осуществив переход к условным переменным, получают соответствующие уравнения регрессии.
Задача. Найти выборочное уравнение линейной регрессии Х на Y на основании корреляционной таблицы
-
15
20
25
30
35
40
100
2
1
-
7
-
-
120
4
-
2
-
-
3
140
-
5
-
10
5
2
160
-
-
3
1
2
3
Решение: Для упрощения расчетов введем условные варианты
,
И
составим преобразованную корреляционную
таблицы с условными вариантами, в которую
внесем значения
и
:
|
-3 |
-2 |
-1 |
0 |
1 |
2 |
|
-1 |
2 |
1 |
- |
7 |
- |
- |
10 |
0 |
4 |
- |
2 |
- |
- |
3 |
9 |
1 |
- |
5 |
- |
10 |
5 |
2 |
22 |
2 |
- |
- |
3 |
1 |
2 |
3 |
9 |
|
6 |
6 |
5 |
18 |
7 |
8 |
n=50 |
Затем
составим новую таблицу, в которую внесем
посчитанные значения
в правый верхний угол заполненной клетки
и
в левый нижний угол, после чего суммируем
верхние значения по строкам для получения
значений
и нижние значения по столбцам для
и подсчитаем величины
и
(табл. 5.1).
Таблица 5.1
|
-3 |
-2 |
-1 |
0 |
1 |
2 |
|
|
-1 |
-6 2 -2 |
-2 1 -1 |
— |
0 7 -7 |
— |
— |
-8 |
8 |
0 |
-12 4 0 |
— |
-2 2 0
|
— |
— |
6 3 0 |
-8 |
0 |
1 |
— |
-10 5 5 |
— |
0 10 10 |
5 5 5 |
4 2 2 |
-1 |
-1 |
2 |
— |
— |
-3 3 6 |
0 1 2 |
2 2 4 |
6 3 6 |
5 |
10 |
|
-2 |
4 |
6 |
5 |
9 |
8 |
— |
Σ = 17 |
|
6 |
-8 |
-6 |
0 |
9 |
16 |
Σ =17 |
— |
Подсчитываем
суммы
и
. Параллельный подсчет этих сумм
осуществляется для контроля правильности
расчета. В данном случае
.
Находим
,
:
= (−3 ·
6 − 2 · 6 – 1 · 5 + 1 · 7 + 2 · 8) / 50=
0,24;
(−1
·
10 + 1 ·
22 + 4 ·
9) / 50 = 0,6.
Находим
,
:
= (9 ·
6 + 4 ·
6 + 1 ·
5 + 1·
7 + 4 ·
8)/ 50 = 2,44;
= (1 · 10 + 1· 22 + 4 · 9)/ 50 = 1,36 .
Определяем
,
:
=
=
=
1,54;
=
= 1. Вычисляем выборочный коэффициент
корреляции
:
Осуществим переход к исходным вариантам :
=
+
= 5·
(-0,24) +30 = 28,8 ,
=
= 20 ·
0,6 +120 = 132 ,
=
=
Находим уравнение регрессии X на Y :
–
28,8
=
(y
− 132) или