
- •Введение в эконометрику
- •Типы данных и переменных
- •Классы моделей
- •Этапы построения моделей
- •Оценивание моделей
- •Типы зависимостей
- •Элементы математической статистики Генеральная и выборочная совокупности
- •Числовые характеристики вариационных рядов
- •Точечные оценки
- •Проверка статистических гипотез
- •Испытание гипотез на основе выборочной средней
- •Испытание гипотез о двух генеральных дисперсиях
- •Ковариация и корреляция
- •Самостоятельная работа № 1
- •Модель линейной парной регрессии
- •Анализ вариации зависимой переменной
- •Предсказания и прогнозы на основе линейной модели регрессии
- •Испытание гипотезы для оценки линейности связи
- •Самостоятельная работа № 2
- •Множественная линейная регрессия
- •Расчет коэффициентов множественной линейной регрессии методом мнк
- •Стандартные ошибки коэффициентов
- •Интервальные оценки теоретического уравнения линейной регрессии
- •Проверка статистической значимости коэффициентов уравнения линейной регрессии
- •Проверка статистической значимости коэффициентов уравнения линейной регрессии
- •Регрессия и excel
- •Самостоятельная работа № 3
Испытание гипотез о двух генеральных дисперсиях
Очень часто про
две независимые выборки объема
и
соответственно нужно узнать, взяты ли
они из нормальных генеральных совокупностей
с одинаковой дисперсией. Для каждой
выборки нужно определить выборочную
дисперсию
и
.
Оценка генеральной дисперсии по первой
выборке осуществляется по формуле
.
Оценка генеральной дисперсии по второй
выборке осуществляется по формуле
.
Статистика вычисляется по формуле
F = (большая оценка генеральной дисперсии)/(меньшая оценка генеральной дисперсии)
Обозначим через
объем выборки, у которой больше оценка
генеральной дисперсии, через
обозначим объем другой выборки. Так как
дисперсия неотрицательна, то нам
понадобится одна граничная точка
,
которую находят из таблиц F-распределения
(распределения Фишера). Можно воспользоваться
функцией пакета Excel
FРАСПОБР(
;
;
).
Пример 6.
Инвестиция
1 рассчитана на
лет, дисперсия ежегодных прибылей
.
Инвестиция 2 рассчитана на
лет, дисперсия ежегодных прибылей
.
Предполагается, что распределение
ежегодных прибылей на инвестиции
подчиняется нормальному закону
распределения. Равны ли риски инвестиций
1 и 2? Доверительная вероятность p
= 95%.
Выдвигаем гипотезы:
H0
:
(риски инвестиций равны);
H1
:
(риски инвестиций не равны).
Оценка
генеральной дисперсии по первой выборке
.
Оценка
генеральной дисперсии по второй выборке
.
Статистика F = (большая оценка генеральной дисперсии)/(меньшая оценка генеральной дисперсии) = 33,333/21,818 = 1,528.
Так как 33,333 >
21,818, то
,
.
Проведем двустороннюю проверку.
;
вычисляем
с помощью функции FРАСПОБР(0,025;9;11),
получаем значение 3,588. Следовательно,
граничные точки
.
О
тметим
значения на числовой оси
Принимаем гипотезу H0 на уровне значимости 5%. Риски инвестиций равны.
Ковариация и корреляция
Выборочной ковариацией двух переменных х, у называется средняя величина произведения отклонений этих переменных от своих средних, т. е.
или
где
,
—
выборочные
средние переменных х,
у.
Ковариацию можно вычислить с помощью функции Excel КОВАР(массив1; массив2), где Массив 1 и 2 это значения x и y.
Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Пусть данные наблюдений переменных х, у представлены в виде точечного графика – диаграммы рассеяния наблюдений
Точка
на
диаграмме является центром рассеяния
переменных х,
у.
Вертикальная и горизонтальная прямые, проведенные через точку , разделяют диаграмму рассеяния на четыре области.
Наблюдения в областях I, III дают положительный вклад в ковариацию, а в областях II, IV — отрицательный.
Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной. Положительной ковариации отвечает положительная связь, а отрицательной — отрицательная.
При положительной (прямой) связи с увеличением одной переменной другая переменная в среднем также увеличивается, и наоборот при отрицательной (обратной) связи.
Заметим,
что
Свойства ковариации:
;
, где а – константа;
, где а – константа;
Пусть выборка извлечена из нормальной генеральной совокупности и отражает ее свойства.
Если случайные величины X, У независимы, то ковариация равна нулю и выборочные точки на диаграмме рассеяния наблюдений можно заключить в окружность с центром в точке .
Если X, У зависимы, то ковариация отлична от нуля и выборочные точки можно заключить в эллипс с центром в точке , при этом положение большей полуоси эллипса будет указывать направление связи (положительная или отрицательная).
Более точной мерой зависимости между величинами является коэффициент корреляции.
Выборочный коэффициент корреляции определяется выражением
,
он является безразмерной величиной и показывает степень линейной связи двух переменных.
Коэффициент корреляции можно вычислить с помощью функции Excel КОРРЕЛ(массив1; массив2), где Массив 1 и 2 это значения x и y.
Свойства коэффициента корреляции:
;
;
если
, то X и Y точно связаны линейной функциональной зависимостью;
если
, то между X и Y нет линейной корреляционной зависимости, но это не исключает существования другого вида зависимости;
если
, то имеет место прямая корреляционная зависимость;
если
, то имеет место обратная корреляционная зависимость.
На рисунках отражен геометрический смысл коэффициента корреляции. На рисунках а и б случайные величины X, У коррелированы (r > 0 или r < 0), на рисунках в и г — некоррелированы (r = 0). Если r = 0, случайные величины могут быть как зависимыми (см. рис. в), так и независимыми(см. рис. г).
Выборочный коэффициент корреляции является случайной величиной.
Проверка гипотезы о корреляции случайных величин. Пусть по данным выборки объема п получен выборочный коэффициент корреляции r 0. Требуется проверить гипотезу о равенстве нулю истинного значения коэффициента корреляции , т.е,
Статистика определяется по формуле
.
Граничная
точка
определяется с помощью функции пакета
Exel:
СТЬЮДРАСПОБР(1
p;
n
2).
Пример 7.
Вычислить коэффициент корреляции между расходами на питание у и личным доходом х по данным экономики (усл. ед.) некоторой страны за пять лет. Доверительная вероятность .
Решение.
Представим исходные данные и расчетные показатели в виде следующей расчетной таблицы:
Год |
х |
у |
х 2 |
ху |
у2 |
2000 |
2 |
9 |
4 |
18 |
81 |
2001 |
6 |
10 |
36 |
60 |
100 |
2002 |
10 |
12 |
100 |
120 |
144 |
2003 |
14 |
19 |
196 |
266 |
361 |
2004 |
18 |
20 |
324 |
360 |
400 |
Итого |
50 |
70 |
660 |
824 |
1086 |
Вычислим среднее
значение по формуле
,
где n
= 5 (объем выборки в данном случае равен
количеству рассматриваемых лет).
Аналогичным образом вычисляем все
остальные средние значения. Результаты
запишем в виде таблицы
|
|
|
|
|
|
Среднее |
10 |
14 |
132 |
164,8 |
217,2 |
Далее вычисляем выборочные дисперсии по формулам:
Вычисляем ковариацию по формуле
.
Проверяем полученное
значение с помощью функции Excel
КОВАР(массив1; массив2):
Теперь вычислим коэффициент корреляции по формуле
.
Проверяем полученное
значение с помощью функции Excel
КОРРЕЛ(массив1; массив2):
Оценим значимость выборочного коэффициента корреляции.
Выдвигаем гипотезы:
:
,
нет линейной взаимосвязи между
переменными;
:
,
есть линейная взаимосвязь между
переменными.
Статистика
.
Г
раничная
точка
определяется с помощью функции пакета
Exel:
СТЬЮДРАСПОБР(1
p;
n
2). Получаем,
= СТЬЮДРАСПОБР(0,05;
3) = 3,18.
Получили, что гипотеза отвергается на уровне значимости 5%, то есть имеется линейная зависимость между переменными.