Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московская финансово-юридическая академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ЛР_тренд_Эксел

.doc

Скачиваний:

Добавлен:

10.05.2015

Размер:

2.47 Mб

Скачать

☆

Лабораторная работа 1.
Построение уравнения регрессии на ПЭВМ

В экономике обычно используются данные двух видов: временные динамические ряды или регрессионные данные.

Типичный временной ряд приведен в табл. 2. В первом столбце находятся какие-либо временные значения (в данном случае, годы), в другом -- какие-либо экономические характеристики (в данном случае – доходы)

Т а б л и ц а 2

Годы	Потребление мяса, кг.
1990	75
1991	69
1992	60
1993	59
1994	57
1995	55
1996	51
1997	50
1998	48
1999	45

Опишем наиболее простой и быстрый способ построения уравнений регрессии для временных рядов. Для временных рядов линия регрессии обычно называется линией тренда, т.е. линией тенденции. Для построения линии тренда необходимо проделать следующие действия:

Построить гистограмму (рис. 4).

Рис. 4. Среднедушевое потребление мяса

С помощью правой кнопки мыши вызвать дополнительное меню и выбрать « Добавить линию тренда» (рис. 5).

Рис. 5. Регрессия «мясо-картофель»

В новом меню последовательно выбрать опции: Линейная, Логарифмическая, Полиномиальная, Степенная, Экспоненциальная (рис. 6).

Рис. 6. Линия тренда (Тип)

4. Для каждой опции через дополнительное меню «Параметры» выбрать две команды: показать уравнение на диаграмме и поместить на диаграмме величину достоверности аппроксимации (рис. 7)

Рис. 7. Линия тренда (Параметры)

В результате получим гистограмму, изображенную на рис. 8.

Рис. 8 Гистограмма с линиями тренда

5. Далее по коэффициенту R^2 выбрать наилучшее уравнение. Напоминаем, что считается лучшим то уравнение, у которого R^2 больше. В данном случае наилучшим с этой точки зрения будет логарифмическое уравнение.

6. Используя это уравнение легко сделать прогноз на следующий, 11-й год. Для этого в уравнение y = -- 12,681ln (x) + 76,054 вместо x следует подставить число 11. В результате получаем прогноз на 11-й год, равный 46, 425.

Теперь рассмотрим регрессионную таблицу, в которой приведены данные по потреблению мяса и хлебопродуктов в Красноярском крае за

1990-2000 годы

Т а б л и ц а 3

мясо и мясопродукты, включая 2 кат	хлебопродукты
73	109
66	109
63	113
64	117
64	117
64	118
60	114
58	119
56	124
51	124
49	118

Построим уравнение регрессии, взяв за переменную x – хлебопродукты, а за переменную y – мясо и мясопродукты.

Входим в меню «Сервис»,  «Анализ данных»,  «Регрессия». Замечание. Если в «Сервисе» нет пакета «Анализ данных», то входим в «Надстройки», подгружаем «Пакет анализа данных» и снова входим в «Сервис». Меню показано на рис. 9.

В результате получаем 4 таблицы и три графика. Все они будут объяснены ниже.

Рис. 9 Окно регрессии

В первой строке табл. 4 находится коэффициент корреляции между переменными Y и X. Величина его указывает на тесноту связи между этими переменными. Если он меньше 0,3, то связь между переменными слабая, если он больше 0,75, то связь сильная, в остальных случаях можно говорить о средней связи между переменными.

Во второй строке записывается R^2, с помощью которого оценивается качество аппроксимации. Чем он больше, тем лучше подобрано уравнение. В нашем случае он равен 0,56.... В этом случае говорят, что выбранное уравнение объясняет 56 % опытных данных.

В третьей строке записывается стандартная ошибка, вычисленная по формуле (2.1).

В последней строке записывается количество опытных данных.

Т а б л и ц а 4

Регрессионная статистика
Множественный R	0,751743
R-квадрат	0,565118
Нормированный R-квадрат	0,516797
Стандартная ошибка	4,806857
Наблюдения	11

Т а б л и ц а 5

Дисперсионный анализ
	df	SS	MS	F
Регрессия	1	270,228	270,228	11,69525
Остаток	9	207,952	23,1058
Итого	10	478,181

Объясним по столбцам табл.5. В столбце df записано число степеней свободы. В первой строке пишется число переменных в уравнении регрессии k (в нашем случае k = 1). Ниже число, которое вычисляется по формуле n-k-1. Здесь n равно числу опытов. В строке «Итого» записана сумма предыдущих двух строк.

В столбце с заголовком SS записаны ошибки. В первой строке «объясняемая» часть ошибки, которая равна 270,228

Во второй – «необъясняемая» часть равная 207,952

В строке «Итого» эти ошибки суммируются и записывается общая ошибка аппроксимации. Заметим, что R² = SS_регрес/ SS_итого= 270,228/478,181 = 0,565118

В столбце MS записаны следующие числа: MS₁= 270,228, MS₂= =23,1058, которые понадобятся нам для вычисления F.

В последнем столбце вычисляется F по формуле F= MS₁/ MS₂=34,5623, обозначается F_выч и сравнивается с F_таб.= F(k, n-k-1).

Если F_выч> F_таб, то уравнение адекватно опытным данным с вероятностью 95 %, в противном случае можно говорить о неверно выбранном виде уравнения. В нашем случае F_таб.= F(1, 10)= 4,96 < 11,7. Поэтому можно говорить, что уравнение адекватно опытным данным.

Рассмотрим следующую таблицу (табл.6).

Т а б л и ц а 6

	Коэффициенты	Стандартная ошибка	t-статистика	Нижние 95%	Верхние 95%
Y-пересечение	180,767	35,131	5,146	101,295	260,238
Переменная X 1	-1,03	0,301	-3,42	-1,711	-0,349

Во втором столбце находятся коэффициенты уравнения регрессии, имеющего вид y =.-1,03*x + 180,767. В третьем - числа, равные стандартным ошибкам полученных коэффициентов. Чем больше ошибка, тем менее точно найден соответствующий коэффициент. В четвертом столбце вычислена

t-статистика, полученная делением соответствующего коэффициента на стандартную ошибку.

Вычисленную t-статистику сравнивают с табличными значениями t_таб= =t(n-1). Если t_таб> abs(t_выч)_., то коэффициент с вероятностью 95 % равен нулю, в противном случае он значимо от нуля отличается. В нашем случае t_таб= t(n-1) = t(10) = 2,228. Поэтому свободный член нашего уравнения регрессии и коэффициент при ln t значимо от нуля отличаются.

Последние два столбца определяют нижнюю и верхнюю границы интервала, куда с вероятностью 95 % попадает наш коэффициент. Первый коэффициент принадлежит интервалу [101,295; 260,238], а второй – [- 1,711;

- 0,349].

Рассмотрим табл. 7

Т а б л и ц а 7

Наблюдение	Предсказанное Y	Остатки
1	68,49892934	4,501070664
2	68,49892934	-2,498929336
3	64,37901499	-1,379014989
4	60,25910064	3,740899358
5	60,25910064	3,740899358
6	59,22912206	4,770877944
7	63,3490364	-3,349036403
8	58,19914347	-0,199143469
9	53,04925054	2,950749465
10	53,04925054	-2,049250535
11	59,22912206	-10,22912206

В первом столбце табл. 7 приведены номера опытов, во второй - значения Y вычисленные по уравнению регрессии, в третьем - разность между теоретическими значениями и начальными данными Y.

Далее построим три графика: график остатков, график нормального распределения и график подбора (рис. 10; 11; 12 соответственно). На графике подбора (рис. 12) изображены данные исходные и предсказанные по уравнению регрессии. Остальные графики также необходимы для анализа уравнения регрессии, но их смысл будет пояснен после изложения теоремы Гаусса-Маркова.

Рис. 10

Рис. 11

Рис. 12

Соседние файлы в папке Эконометрика

#
10.05.2015663.55 Кб14временные ряды_мет.doc
#
10.05.201521.5 Кб8Лабораторная №3.xls
#
10.05.201529.7 Кб8Лабораторная №4.xls
#
10.05.20152.47 Mб9ЛР_тренд_Эксел.doc
#
10.05.2015499.71 Кб15МетконтрЗО.doc