- •Эконометрика Практическое занятие 1. Оценивание вероятностных характеристик. Проверка статистических гипотез. Знакомство с Gretl.
- •8) Для X и y рассчитать ранговый коэффициент корреляции Спирмена и проверить его значимость.
- •I. Оценивание вероятностных характеристик
- •6. Ранговый коэффициент корреляции Спирмена.
- •II. Проверка статистических гипотез
- •1. Проверка равенства математического ожидания нормально распределенной случайной величины некоторому значению µ:
- •3. Проверка равенства вероятности некоторому значению δ:
- •4. Проверка значимости коэффициента корреляции Пирсона.
- •5. Проверка значимости рангового коэффициента корреляции Спирмена.
- •III. Знакомство с Gretl
- •1. Гистограмма.
- •2. Описательная статистика.
- •3. Проверка гипотезы о нормальном распределении.
- •5. Проверка равенства математического ожидания нормально распределенной случайной величины некоторому значению µ.
- •6. Проверка равенства вероятности некоторому значению δ
- •7. Проверка значимости коэффициента корреляции Пирсона.
- •7. Проверка значимости рангового коэффициента корреляции Спирмена.
5. Проверка значимости рангового коэффициента корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена определяется формулой:
и представляет собой коэффициент корреляции Пирсона для рангов наблюдений.
Проверка значимости:
1) Выбирается уровень значимости α.
2) Нулевая гипотеза Альтернативная гипотеза
3) Рассчитывается значение t-статистики:
Если верна нулевая гипотеза, то t имеет распределение Стьюдента T(n-2) (аргумент в скобках называется "числом степеней свободы").
4.1) Наблюдаемое значение tнабл сравнивается с критическим значением tα,n-2 (критическая область двусторонняя). Если |tнабл| > tα,n-2, то нулевая гипотеза H0 отвергается в пользу альтернативной H1. В этом случае делается вывод о значимости коэффициента корреляции Спирмена, следовательно, существует зависимость между X и Y (возможно, нелинейная).
4.2) Для наблюдаемого значения tнабл определяется p-value (критическая область двусторонняя). Если p-value<α, нулевая гипотеза H0 отвергается в пользу альтернативной H1. Делается вывод о значимости коэффициента корреляции Спирмена.
Критическое значение tα,n-2 (для двусторонней критической области) в Excel можно найти с помощью формулы:
= СТЬЮДЕНТ.ОБР.2Х(уровень значимости; размер выборки - 2)
Значение p-value можно определить с помощью формулы:
=СТЬЮДЕНТ.РАСП.2Х(|tнабл| ; размер выборки - 2)
III. Знакомство с Gretl
При проведении эконометрических исследований требуется строить большое количество моделей и проводить специальные тесты. Выполнять статистические исследования с помощью MS Excel не слишком удобно, поэтому вместо него лучше использовать профессиональные статистические/эконометрические пакеты (EViews, SPSS, Stata, STATISTICA и т.д.). В рамках нашего курса мы будем использовать Gretl - Gnu Regression, Econometrics and Time-series Library (в т.ч. и потому, что этот программный продукт является некоммерческим).
Скачать с официального сайта: http://gretl.sourceforge.net
После установки и запуска нужно импортировать данные из файла Практика 1.xls
ВАЖНО: используется исходный файл безо всяких расчетов. Желательно предварительно удалить лишние листы, оставив только свой вариант.
Выбирается расположение файла и формат (Файлы Excel *.xls)
Поскольку в нашем примере обычные перекрестные данные, интерпретировать как временной ряд или панельные данные не нужно.
1. Гистограмма.
Для построения гистограммы следует выбрать переменную, после чего: Переменная – Распределение частот.
Получаем:
2. Описательная статистика.
Для расчета точечных оценок следует выбрать переменную, а затем: Переменная – Описательная статистика:
3. Проверка гипотезы о нормальном распределении.
В Gretl можно провести несколько тестов на нормальное распределение, в том числе тест Харке-Бера. Для этого следует выбрать переменную, а затем: Переменная – Тест на нормальное распределение:
Каждый тест проводится по схеме:
1) Выбирается уровень значимости α.
2) Нулевая гипотеза H0: распределение нормальное.
Альтернативная гипотеза H1: распределение отличается от нормального.
3) Рассчитывается наблюдаемое значение тестовой статистики: для каждого теста свое.
4) Для наблюдаемого значения тестовой статистики определяется p-value. Если p-значение < α, нулевая гипотеза отвергается. Наблюдения противоречат тому, что распределение является нормальным.
В нашем примере для любого теста:
Нулевая гипотеза не отвергается во всех случаях.
4. Доверительные интервалы для математического ожидания и дисперсии.
Доверительный интервал (с надежностью 1- ) для математического ожидания нормально распределенной случайной величины:
,
где - критическая точка распределения Стьюдента T(n-1) для уровня значимости (предполагается двусторонняя критическая область). Чтобы найти эту точку: Инструменты - Критические значения – Стьюдента.
Правосторонняя вероятность = α/2, тогда двухсторонняя равна α
Получив критическое значение, используем его для расчета (можно воспользоваться встроенным калькулятором или провести вычисления в Excel):
Доверительный интервал (надежность 1- ) для дисперсии нормально распределенной случайной величины:
.
где - критическая точка распределения хи-квадрат χ2(n-1) для уровня значимости (критическая область правосторонняя), которая находится аналогично:
