Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика _лабор. раб

._.pdf
Скачиваний:
920
Добавлен:
23.03.2015
Размер:
1.44 Mб
Скачать
N ( m ,σ 2 )

команду genr x = a + (b – a) × rnd . Например, для создания равномерно распределенного ряда X на (10, 30) необходимо в строке ввода формул ввести команду genr x = 10 + 20 × rnd .

Для создания ряда чисел X, распределенных по закону

(нормальное распределение с математическим ожиданием m и дисперсией σ2), используют команду genr x = m + σ × nrnd. Например, для создания распределенного по стандартному

нормальному закону ряда X ~ N(0,1) необходимо задать коман-

ду genr x = nrnd.

6. Изменение размерности выборки

Иногда требуется создавать выборки меньшего размера, чем минимально возможный. Например, минимальный размер выборки 1000, требуется создать выборку размерности 10. В этом случае необходимо изменить размер значимой области файла.

Способы изменения размерности выборки:

1. В меню пакета надо выбрать Quick / Sample… , появится окно Sample, в котором в поле Sample range pairs … через пробел надо ввести требуемые первый и конечный номера выборки (рис. 1.8).

Рис. 1.8. Окно Sample для изменения размера выборки

Вокне рис. 1.7, согласно примеру, в поле Sample range pairs

необходимо ввести 1 и через пробел 10 и нажать OK. После этого в окне Workfile в поле Sample 1000 изменится на 10.

Примечания: 1) изменять поле Sample за рамки поля Range нельзя, 2) поле IF condition (рис. 1.7) используется для фильтра-

11

ции данных и будет рассмотрено во 2-й лабораторной работе.

2.В любом открытом окне ряда или группы нажать кнопку Sample, появится окно Sample, в котором необходимо изменить размерность выборки (см. предыдущий пункт).

3.С помощью команды smpl a b, где а — нижняя граница выборки, b — верхняя граница. Для изменения размерности на 10 вводится команда smpl 1 10.

Другие полезные команды:

smpl @all — установить размерность выборки с 1-го наблюдения по последнее;

smpl @first 185 — установить размерность выборки с 1-го наблюдения по 185-е;

smpl 5 @last — установить размерность выборки с 5-го наблюдения по последнее.

7. Сортировка данных

Чтобы упорядочить в рабочем файле все данные по возрастанию по какому-либо из рядов, например X, необходимо ввести команду sort x. В результате этого данные ряда X упорядочатся по возрастанию, а данные в других рядах упорядочатся относительно ряда X.

8. Создание и сохранение графиков

Для создания графика одного ряда необходимо открыть этот ряд двойным щелчком мыши, затем в окне ряда в меню View / Graph выбрать тип графика Line (линейный) или Bar (гистограмма). Чтобы вернуться к отображению числовых данных в окне, необходимо в окне ряда в меню выбрать View / SpreadSheet.

Графики можно также создавать как отдельный элемент рабочего файла. Для этого используются соответственно команды line x (рис. 1.9) или bar x.

12

Рис. 1.9. Создание графика ряда данных

Для сохранения графика нажмите кнопку Name в окне графика или при его закрытии выберите пункт Name и введите название сохраняемого графика латинскими буквами. В окне рабочего файла появится элемент ряда со значком (рис. 1.9).

Чтобы создать график зависимости ряда Y от X, использу-

ется команда scat x y (рис. 1.10).

Рис. 1.10. Создание графика зависимости рядов

13

Задания

1.Создайте рабочий файл с максимально возможным размером выборки пространственных данных, равным 250.

2.Создайте группу рядов и сохраните ее под именем First.

3.Создайте в группе First ряды X1 и X2 размерностью (длиной) 250 и 100 соответственно, представляющие собой равномерно распределенные на интервале [0, 1] случайные числа.

4.Создайте в этой же группе распределенные по стандартному нормальному закону ряды случайных чисел Y1 и Y2 размерностью 250 и 100 соответственно.

5.Создайте новую группу Second, в которую включите ряды X1

и Y1.

6.Создайте ряд Z, равный сумме рядов X1 и Y1.

7.Создайте ряд T равномерно распределенных на интервале [50, 100] случайных чисел.

8.Создайте ряд случайных чисел H, распределенных по закону

N(1,9) .

9.Отсортируйте данные по ряду X1 и постройте графики рядов X1 и Y1. Постройте график зависимости Y1 от X1.

10.Сохраните рабочий файл в вашем разделе под именем фами-

лия студента_1.WF1.

Команды, используемые в лабораторной работе:

series x (либо genr x) — создание дискретного ряда с именем x;

group gr1 x y — создание группы с именем gr1 и включение в нее рядов x и y;

genr x = a + (b – a) × rnd — генерирование ряда x, представляющего собой равномерно распределенные на интервале (a, b) случайные числа;

genr x = m + σ × nrnd — генерирование ряда чисел X, рас-

пределенных по закону N(m,σ 2 );

smpl 1 100 — изменение размера текущей выборки до 100;

line x — создание графика с рядом x;

scat x y — создание графика зависимости (облака рассеяния) значений ряда y от значений ряда x.

14

Вопросы для самоконтроля

1.Дайте определение эконометрики.

2.Какие типы данных рассматриваются в эконометрике?

3.Каковы основные цели эконометрического исследования?

4.Что означают числа 50 и 100 при создании ряда T (задание

7)?

5.Что означают числа 1 и 9 при создании ряда H (задание 8)?

6.Напишите команду создания графика ряда X2.

7.Откройте группу First о объясните, почему после сортировки в ряду X2 числовые данные стали чередоваться с пустыми ячейками.

Лабораторная работа № 2.

АНАЛИЗ ДАННЫХ И ИХ ПОДГОТОВКА К ЭКОНОМЕТРИЧЕСКОМУ ИССЛЕДОВАНИЮ

Целью эконометрического исследования обычно является определение вида модели (уравнения), характеризующей взаимосвязь двух и более переменных, или проверка гипотез относительно коэффициентов модели. Для получения качественных результатов исследования этапу построения модели должен предшествовать этап подготовки и анализа данных.

Очень часто возникает ситуация, когда анализ данных, проводимый между этапом сбора данных и собственно эконометрическим моделированием, позволяет сократить количество «лишней» работы, связанной с фактическим выбором модели и анализом «технической» информации во время моделирования.

Предварительный анализ данных можно условно разделить на три этапа:

1)графический анализ данных;

2)фильтрация (очистка) рядов данных;

3)анализ выборочных характеристик рассматриваемых рядов. На практике эта последовательность не всегда соблюдается.

При работе с реальными данными этапы постоянно повторяются, меняются местами, в силу того что каждое исследование требует своей степени обработки информации. Эконометрическое иссле-

15

дование проводится как минимум для двух рядов данных, поэтому при подготовке и анализе данных они рассматриваются как по отдельности, так и совместно.

Указанные выше этапы подготовки и анализа можно провести средствами любого пакета, позволяющего работать со статистическими данными, но пакет EViews обладает рядом преимуществ, о которых будет сказано ниже.

В качестве примера в этой лабораторной работе мы рассмотрим данные по уровню ВВП на душу населения по паритету покупательной способности (ППС), уровень инфляции и безработицы в 2007 г. для развитых и развивающихся стран. Исследование предполагает проверку гипотезы об обратной связи инфляции и уровня безработицы и их возможное влияние на уровень ВВП.

Файл с исходными данными — lab2.xls.

1. Создание рабочего файла и создание рядов данных

Перед началом анализа необходимо собранные данные перенести в EViews. Для этого воспользуйтесь информацией из п. 1, 2, 3 лабораторной работы № 1. Обратите внимание, что EViews в качестве разделителя разрядов использует точку, поэтому при копировании данных из файлов других форматов нужно предварительно внести соответствующие изменения. При этом с учетом того, что каждая тройка значений (ВВП — инфляция — безработица) относится к конкретной стране, желательно зафиксировать данную привязку, чтобы любые выводы подразумевали конкретную страну. Для этого мы можем скопировать при создании группы в EViews в один из столбцов названия стран. Для хранения этой информации будет создан ряд данных типа Alpha (текстовый ряд данных), обозначаемый в рабочем файле значком .

Для создания текстового ряда необходимо в строке ввода формул ввести команду alpha имя_ряда. Например, alpha names.

Группа, содержащая все ряды данных, будет выглядеть следующим образом (рис. 2.1).

16

Рис. 2.1. Группа DATA с текстовыми и числовыми рядами

2. Графический анализ данных

Исходные данные зачастую содержат множество наблюдений, способных существенно ухудшить качество модели. Это может быть вызвано многими причинами.

Во-первых, выборка может оказаться неоднородной, вследствие того что при подготовке данных был проведен недостаточно глубокий их качественный анализ с точки зрения целей исследования. Так, например, при проведении эконометрического анализа факторов, влияющих на экономический рост, нежелательно объединять в одну выборку высокоразвитые страны и страны с низким уровнем развития. Если это сделать необходимо (например, нужно выявить общие для всех стран факторы экономического роста), то надо использовать специальные приемы, учитывающие неоднородность выборки. Кроме того, в выборке могут оказаться «аномальные» наблюдения, которые очень сильно отличаются от других по ряду параметров. Например, при исследовании развития регионов Российской Федерации часто приходится отдельно (не включая в общую выборку) рассматривать Москву и Московскую область.

Во-вторых, во многих странах (компаниях, агентствах и т. п.)

17

статистическая информация собирается и анализируется при помощи совершенно разных инструментов и методов, что в ряде случаев делает данные несовместимыми.

В-третьих, при сборе и обработке информации могут возникать ошибки, вызванные человеческим фактором (опечатки и т. п.), которые также необходимо исключить для получения достоверных выводов.

Первичный анализ данных обязательно должен содержать

проверку данных на однородность, анализ «аномальных» наблюдений с точки зрения исследования и их исключение из выборки в

случае необходимости. Важно помнить, что каждое наблюдение очень дорого для исследования и исключение его из рассмотрения должно быть обосновано.

Первичный анализ данных можно провести визуально, путем анализа графиков и диаграмм. В п. 8 лабораторной работы № 1 приведен пример построения графика одного ряда данных. Аналогичные инструменты работают и в объекте Group, при этом предоставляется возможность получить либо одновременные графики, либо набор графиков для всех рядов группы (Multiple Graphs). Пример одновременных графиков представлен на рис. 2.2, где переменная UNEMP — безработица, INFL — инфляция.

Рис. 2.2. Одновременное представление двух рядов данных

18

Графическое представление данных позволяет увидеть наблюдения, «выпадающие» из общей картины. Так, значение уровня безработицы для 40-го наблюдения существенно выше основной массы (рис. 2.2). Это значение принадлежит Сербии. Причем соответствующих положительных/отрицательных колебаний в показателях инфляции нет. Следовательно, факт высокой безработицы имеет какие-то особые причины, не объяснимые выбранными нами данными. Такие наблюдения из выборки, которая будет использоваться при моделировании, лучше удалить. Средства пакета EViews позволяют не удалять из рабочего файла «лишние» наблюдения, а сократить используемую для моделирования выборку (см. п. 4.).

3. Анализ графика зависимости рядов

Анализ графиков рядов позволяет легко увидеть наблюдения, значения которых существенно больше или меньше средних уровней ряда. Поскольку конечной целью эконометрического моделирования является построение уравнения, отражающего зависимость результативного признака от влияющих факторов, то на данном этапе необходимо определить, объясняются ли отклонения рассматриваемыми в исследовании факторами.

График зависимости рядов, или диаграмма рассеяния, является удобным инструментом для проведения такого анализа. Создание графика зависимости рядов при помощи специальных команд описано в п. 8 лабораторной работы № 1. Чтобы получить диаграмму рассеяния при помощи меню, необходимо в группе в меню View/Graph или View/Multiple Graphs в пункте Scatter

выбрать необходимую форму диаграммы рассеяния.

Замечание. Если в группе с данными первым столбцом является текстовая информация, как в нашем примере (см. рис. 2.1), EViews не сможет корректно отобразить график зависимости рядов, так как при построении пакет обычно отталкивается от первого столбца группы.

Важно, чтобы ряды, которые будут отражены по оси ординат, имели сопоставимый порядок значений. При расхождении значений в 10 и более раз масштаб построенного графика не будет удобным для полноценного анализа.

При исследовании в первую очередь рассматривают диа-

19

граммы рассеяния, отражающие зависимость результативного ряда и рядов факторов. Именно из их анализа можно сделать предположения о функциональной форме зависимости рядов. Кроме того, можно увидеть «выпадающие» из общей массы значения. Так, на рис. 2.3. видно, что есть наблюдение с чрезмерно большим уровнем ВВП при средних значениях инфляции и уровня безработицы, а также наблюдения с высоким уровнем безработицы.

Рис. 2.3. График зависимости рядов

Идеальным вариантом является максимальное соответствие диаграммы рассеяния выбранной форме зависимости (линейной, квадратичной и т. д.). В противном случае качество полученного уравнения может оказаться невысоким.

Подтвердить или опровергнуть предположения о наличии связи можно при помощи коэффициента корреляции. Способы его расчета будут описаны ниже. Важно помнить, что коэффициент корреляции характеризует тесноту и направление линейной связи исследуемых рядов.

4. Фильтрация данных

Если в результате предварительного анализа принято решение сократить используемую для моделирования выборку, это

20