Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие стат.pdf
Скачиваний:
18
Добавлен:
20.02.2016
Размер:
377.76 Кб
Скачать

появилось больше магазинов? И так далее, и тому подобное. Примеры

— самые банальные, но важно искать идеи везде, где только можно.

Как только вы нашли идею, область, нужно посмотреть, что уже в ней сделано. Все исследования, как известно, делятся на две области

— теорию и практику. Важно найти и посмотреть и то, и другое: кто какую модель придумал, кто какие данные собрал и проанализировал, как они друг с другом соотносятся. Затем — найти пустоты:

никто вообще не предложил модели этого феномена — отлично, вперед за уравнения,

кто-то предложил модель, но никак ее не проверил — собираем данные,

кто-то предложил модель, кто-то собрал данные, но ничего не работает — смотрим, как можно что-то изменить,

кто-то предложил модель, кто-то предложил идею — модицифируем модель,

кто-то собрал данные, но никак их не описал моделью — пишем модель,

и так далее.

Самый лучший вариант — придумать свою собственную модель (или модифицировать чью-то) и собрать под нее данные. Это идеальная учебная работа.

Важный совет: не нужно никому слепо верить, даже если это признанный ученый. На все смотрите критически, разбирайтесь во всех аспектах, ищите проблемы. Старайтесь ссылаться на кого-то только в том случае, если вы не согласны или если там собраны хорошие данные. Не думайте, что что-то точно существует, если это придумал Нобелевский лауреат: почти все нынешние теории едва ли не вилами на воде написаны. Впрочем, это вовсе не означает противоположного — в мире гораздо больше полезных и уже придуманных моделей, чем вам кажется.

2Сбор и анализ данных

2.1 Техническая подготовка

Существует множество программ для сбора данных и их анализа. Не будем устраивать обзор и сразу порекомендуем наиболее популярную — Stata. Разумеется, она стоит приличных денег, но всегда можно разжиться вариантом для бедных студентов — см. соответствующие ресурсы. На текущий момент самая новая версия

— 11-ая, к ней прилагается множество туториалов и руководств.

5

Хороший вариант на русском языке — “Прикладной эконометрический анализ в статистическом пакете Stata“ (Станислав Колеников, econometrics.narod.ru/em2/Stata6Ec.pdf). Кое-что самое простое рассмотрим чуть позже.

Для изучения непараметрической статистики (статистики для малых групп испытуемых и небольших выборок) есть симпатичная книжка “Книга для тех, кто не любит статистику, но вынужден ей пользоваться” Александра Резника. Все объяснено очень просто, примеры — в программе SPSS, которая теперь называется PASW.

Если хочется чего-нибудь бесплатного и не пугает программирование, можно попробовать R (www.r-project.org) — этоим статпакетом пользуется многие провинутые эконометристы и статистики. Если разбираться страшно, можно попробовать расширение для него под названием Deducer (www.deducer.org) — там все основные статистические процедуры и графики сделаны с помощью понятных меню.

2.2 Современные эмпирические исследования

Мотивация

Эконометрика может помочь нам ответить на три вопроса:

Описание: Как Х связан с Y? Есть ли вообще корреляция?

Предсказание: Как мы можем использовать X, чтобы предсказать Y?

Причинность: Как изменение Х отражается на Y?

Последнее — самый частый вопрос, занимающий исследователейэкономистов.

Вопросы

Итак, мы хотим определить, как нечто влияет на что-то. Допустим, мы нашли такое нечто:

Хотим понять, как наличие в детстве компьютера отразилось на текущей зарплате людей.

Теперь нужно представить самый идеальный случай подобного исследования:

Берем случайную выборку — несколько тысяч похожих детей, половине выдаем компьютеры, у половины отбираем и через 20 лет смотрим на эффект.

Одна беда — вряд ли можем осуществить подобный полевой эксперимент: слишком дорого и издеваться на детьми нам никто не позволит. Зато мы можем опросить, к примеру, четыре тысячи человек, узнать, был ли у них в детстве компьютер и сравнить доходы двух групп. В чем загвоздка?

В том, что нам нужно сравнить два возможных исхода, один из которых никогда не случался: мы не можем знать, как сложилась бы судьба человека с компьютером, если бы его все-таки отобрали в детстве. В идеале мы бы знали:

6

зарплату человека, если бы у него был в детстве компьютер,

зарплату, если бы его не было.

разницу между этими величинами — эффект воздействия наличия компьютера.

Иногда можно попробовать изменить что-то во времени — например, перевести человека из одной группы в другую и посмотреть, что из этого выйдет. В нашем примере это вообще невозможно, в других

— часто изменяются и другие параметры, что делает такой финт бессмысленным.

Итак, для отдельного человека посчитать эффект мы не можем. Но можем, к примеру, посчитать средний эффект в двух группах и сравнить его — если группы достаточно однородны по составу. Проблема в том, что эти группы почти никогда не однородны. И если мы начнем считать разницу в зарплатах, то получим:

разница = оценка зарплаты (с компьютером) - оценка зарплаты (без компьютера) = оценка разницы (от наличия комьпютера) + смещение выборки

Смещение возникает из-за того, что зарплата может определяться не только наличием компьютера в детстве, но и множеством других факторов (что вполне очевидно). Поэтому если в одной группе вдруг окажутся студенты, а во второй — люди за 40, то опять же очевидно, что в второй группы зарплата будет в среднем больше. Что нужно сделать? Учесть все остальные факторы и зафиксировать их. Как это можно сделать?

Рандомизированный эксперимент Случайным образом выбираем две группы — экспериментальную и контрольную, одной назначаем эффект и смотрим на результат. Многие считают, что это единственный достоверный метод выявления причинно-следственной связи. Недостаток: дорого и долго.

Контроль переменных Собираем данные по всем факторам (переменным), которые могут влиять на наш Y — то есть на зарплату: уровень образования, социальную группу, место проживания, возраст и многое-многое другое. Собираем все факторы в одно уравнение регрессии и фиксируем все, кроме наличия компьютера (эта переменная будет бинарной, то есть 0 или 1). Вуаля — смотрим на эффект. Самый популярный способ.

«Оценка разностей» (difference-in-difference) Предыдущий метод не очень хорош, если есть какие-то скрытые факторы, которые мы не учли или которые учесть вообще невозможно. Но! Если эти факторы не меняются с течением времени, то можно посмотреть на уровень Y до и после воздействия эффекта. В нашем примере, увы, этот метод никак не применить.

7

Инструментальная переменная Это такая переменная, которая влияет на наш Х, но не влияет на Y. Найти ее сложно, но можно — тогда мы можем избавиться от части смещения за счет перехода на эту переменную и доказать, что наш Х действительно влияет. В нашем примере такой инструментальной переменной может быть уровень образования родителей или их доход.

Определившись с задачами и методами, можно приступать к поиску данных.

Чужие данные

Самый полезный список ссылок на различные базы экономических данных в Интернете — обзор Станислава Анатольева и Александра Цыплакова “Где найти данные в сети?” (quantile.ru/06/06-AT.pdf): чуть ли не сотня различных сайтов, ссылок и тому подобного. С большим недоверием стоит относиться к российской официальной статистике.

Собственные данные

Опрос Неплохой способ потренироваться в сборе данных — собрать опросные листы. Конечно, выборка у вас будет так себе по своей репрезентативности, поэтому стоит ориентироваться на объемы — то есть стремиться к хотя бы 400 опрошенным. Сотня — самый крайний случай. Недостаток: все придется ручками вбивать в компьютер.

Лабораторный эксперимент Самый интересный способ — провести эксперимент: в аудитории посмотреть, как люди реагируют на те или иные экономические стимулы. Подходит, если вы занимаетесь теорией игр, поведенческой экономикой и схожими вещами. Эксперимент можно провести pen-and-paper, то есть в аудитории, но данные придется записывать очень быстро и тяжело. Еще один вариант — запрограммировать эксперимент в программе zTree (www.iew.uzh.ch/ztree/index.php), однако для этого придется в ней покопаться. Если освоитесь (при наличии программистких навыков уйдет дня три) — сможете писать эксперименты за один день. Огромный плюс в том, что данные собираются автоматически. Общий недостаток: в эксперименте придется платить деньги испытуемым.

Полевой эксперимент То же, что лабораторный, но в реальной экономике — в деревне или магазине. Недостаток: сложно придумать.

Ручками Данные можно собрать и руками — например, в интернете. Довольно долго, но можно набрать разной интересной информации, которую никто никогда не собирал.

8