Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПРИКЛАДНАЯ ЭКОНОМЕТРИКА В ПРЕДПРИНИМАТЕЛЬСТВЕ.docx
Скачиваний:
17
Добавлен:
30.04.2019
Размер:
1.94 Mб
Скачать
  1. Сбор данных

Принятие решения о соответствующих наборах данных.

Для начала вам надо решить, какой тип данных вам нужен, для ответа на поставленные вопросы. Наиболее общими видами являются перекрестные данные, временные ряды, объединенные перекрестные данные, и панели наборов данных. Многие вопросы можно решить с помощью любой, из перечисленных, форм данных. Например, чтобы рассчитать, как количество правоохранительных органов влияет на количество преступлений, мы можем взять перекрестные данные нескольких городов, временные ряды для определенного города, или панель данных, содержащая информацию по тем же городам на протяжении двух или более лет.

Ввод и хранение данных.

После того, как вы выбрали тип используемых данных и определили их источник, вам необходимо привести их в удобную для использования форму. Для последующего анализа данных в статистическом пакете Stata, базу данных можно ввести напрямую непосредственно в Stata, либо импортировать из Microsoft Excel. Второй вариант более предпочтителен. В общем виде, изначальный набор данных должен выглядеть примерно так :

Необходимым условием, для корректного отображения данных в Stata, является остутствие кириллических символов в наборах данных, отсутствие разделителя групп разрядов(это можно сделать в вкладке «Формат ячеек»), разделителем целой и дробной части должна быть точка. Это настраивается в параметрах Excel следующим образом:

Сохранять же отформатированные таблицы следует в формате «Текстовые файлы (с разделителями табуляции) (*.txt)».

Непосредственно импортирование базы данных в статистический пакет Stata осуществляется следующим образом:

После этого ваши данные готовы к работе.

  1. Построение модели и выводы.

Используемые в работе данные были собраны на сайте Национального Кадастрового агентства, и состоят из 841 наблюдения. В наборе данных присутствуют следующие переменные:

price: реальная цена сделки, указана в белорусских рублях, в ценах 2010 года;

square: общая площадь квартиры, указана в кв.м.;

rooms: количество комнат в квартире. Данные содержат информацию по одно-, двух-, трех- и четырехкомнатным квартирам. Пяти- и более комнатные квартиры составляют менее 1% выборки и, по мнению большинства риелтеров, — цена каждой квартиры индивидуальна и не следует каким-то общим закономерностям. Поскольку целью статьи является моделирование цены стандартных квартир, составляющих большую часть рынка, подобные квартиры были исключены из выборки, после чего в ней осталось 837 наблюдений.

stage: этаж, на котором находится квартира.

hight: общая этажность дома.

center: переменная характеризующая расстояние от квартиры до центра Минска, в метрах. Минск имеет радиально-кольцевую структуру с центром в районе Площади Независимости. Расстояние измеряется от дома до центра города;

metronear: бинарная переменная, показывающая близость к станции метро. Равна 1 если дом находиться близко, и 0 если нет. Под «близко» понимается расстояние 270 метров и менее, что примерно соответствует 3-5 минутам ходьбы.

materials: 1 – если квартира в доме построенном из кирпича или железобетона; 0 – если иначе ( панельные или блочные дома). Эта переменная отражает качество дома.

age: показывает возраст здания на момент сделки.

bad0: 1 – если квартира не на первом и не на последнем этаже; 0 - иначе. Квартиры на первом и последнем этажах менее популярны, поскольку, как правило, в них нет балкона. Кроме того, в квартире на последнем этаже может быть шумно из-за механики лифтов, могут быть протечки при нарушении гидроизоляции крыши, а летом может быть слишком жарко при плохой теплоизоляции. Квартира на первом этаже считается менее безопасной, может страдать от шума лифта или входной двери, плохого запаха при нарушении изоляции подвала, в ней может быть холодный пол, а также ей свойственна недостаточная приватность - в квартиру легко заглянуть с улицы.

year1: 1 – если сделка произошла в 2006 году; 1 - в 2010. Отражает изменение цен связанное с изменяющейся ситуацией на рынке и с такими факторами, как:

- доступность кредитов, которая подстегивает цены на недвижимость,

-увеличение предложения квартир для очередников, а значит уменьшение количества квартир в свободной продаже, что при растущем спросе подстегнуло цены на вторичном рынке;

- рост цен на энергоносители, который негативно сказывается на себестоимости жилья;

- свернуто долевое строительство жилья, куда прежде активно шли частные инвестиции.

Проведем предварительное тестирование данных, чтобы выяснить значимость отдельных переменных. Сделать это можно с помощью регрессионного анализа.Для этого в командной строке программы Stataвводим команду regres(или reg) затем последовательно вводим имена всех переменных, которые мы хотим вовлечь в регрессионный анализ, сначала объясняемую(зависимую) переменную, затем все объясняющие(независимые) переменные.

Если мы хотим задать дополнительные условия для переменных, которые будут участвовать в анализе, то это оформляется следующим образом: if(название переменной) >, <, =, >= или <= (значение). Т.е. если мы хотим исключить из выборки все данные по квартирам, где более 4 комнат, то мы добавляем к команде регрессии следующее: ifrooms< 5.

Здесь нужно обратить внимание на строки переменных hightи materials. t-статистикадля этих переменных значительно превышает 0.05 (пятипроцентный уровень значимости, принятый за стандарт в большинстве работ), т.е. в данной выборке эти переменные не значимы, но их присутствие ухудшает качество значений остающихся переменных, поэтому их следует исключить. Незначимые факторы из модели удаляются постепенно, т.к. исключив все их одновременно, мы рискуем потерять на самом деле значимые регрессоры, освобожденные от влияния незначимых.

Таким образом следующей нашей командой будет:

В данном случае переменная materials все еще остается незначимой, поэтому ее также исключаем:

Учебное издание