- •Эконометрика Практическое занятие 1. Оценивание вероятностных характеристик. Проверка статистических гипотез. Знакомство с Gretl.
- •8) Для X и y рассчитать ранговый коэффициент корреляции Спирмена и проверить его значимость.
- •I. Оценивание вероятностных характеристик
- •6. Ранговый коэффициент корреляции Спирмена.
- •II. Проверка статистических гипотез
- •1. Проверка равенства математического ожидания нормально распределенной случайной величины некоторому значению µ:
- •3. Проверка равенства вероятности некоторому значению δ:
- •4. Проверка значимости коэффициента корреляции Пирсона.
- •5. Проверка значимости рангового коэффициента корреляции Спирмена.
- •III. Знакомство с Gretl
- •1. Гистограмма.
- •2. Описательная статистика.
- •3. Проверка гипотезы о нормальном распределении.
- •5. Проверка равенства математического ожидания нормально распределенной случайной величины некоторому значению µ.
- •6. Проверка равенства вероятности некоторому значению δ
- •7. Проверка значимости коэффициента корреляции Пирсона.
- •7. Проверка значимости рангового коэффициента корреляции Спирмена.
I. Оценивание вероятностных характеристик
1. Гистограмма – это способ представления статистических данных в виде столбчатой диаграммы. Количество столбцов равно число выделенных диапазонов. Высота каждого столбца соответствует частоте появления значений параметров в соответствующем диапазоне.
Для построения гистограммы потребуется сначала сгруппировать данные.
Для определения числа интервалов рекомендуется использовать формулу Стёрджеса:
где n – объем выборки, для нахождения которого можно использовать функцию =СЧЁТ(). Для нахождения десятичного логарифма используется функция =LOG10(). Разумеется, число интервалов должно быть целым, чтобы округлить число до целого можно использовать функцию =ОКРУГЛ(), где в качестве числа разрядов указать 0.
Впрочем, количество число N может быть выбрано и произвольно.
Для нахождения минимального и максимального значений можно использовать функции =МИН() и =МАКС(). Тогда ширину одного интервала можно определить по формуле:
L=(max-min)/N,
где N - рассчитанное или заданное число интервалов.
После этого границы интервалов можно найти как:
min, min+L, min+2·L, ..., min+(N-1)·L, min+N·L=max.
Затем следует рассчитать частоты попадания показателя X в каждый из интервалов. Для этого можно использовать функцию
=ЧАСТОТА(массив данных; массив интервалов)
В качестве массива интервалов выделяются границы интервалов: min+L, min+2·L, ..., min+(N-1)·L (минимальное и максимальное значения не выделяются)
Чтобы растянуть выражение, необходимо выделить диапазон ячеек, установить курсор в строку формул и нажать комбинацию Ctrl+Shift+Enter.
Для построения гистограммы: Вставка – Диаграммы – Гистограмма.
2. Выборочное среднее рассчитывается по формуле:
Чтобы не складывать вручную, можно использовать функцию =СУММ(). Впрочем, есть функция и для расчета выборочного среднего: =СРЗНАЧ().
Выборочная дисперсия рассчитывается по формуле:
Эта оценка является несмещенной.
Редко (например, в пакете Анализ данных MS Excel инструмент Ковариация) в качестве оценки используется смещенная оценка:
Выборочное среднее квадратическое отклонение находят как корень из выборочной дисперсии:
Вычисления можно оформить в виде таблицы:
№ |
|
|
Размер выборки |
n |
1 |
|
|
Сумма |
|
… |
… |
… |
Выборочная дисперсия |
|
n |
|
|
Выборочное с.к.о. |
|
Для расчета можно использовать функции: =ДИСП.В() и =СТАНДОТКЛОН.В()
Полученные
значения являются точечными оценками
математического ожидания и дисперсии.
Доверительный
интервал (с надежностью 1-
)
для математического ожидания нормально
распределенной случайной величины:
,
где
- критическая точка распределения
Стьюдента T(n-1)
для уровня значимости
(предполагается двусторонняя критическая
область). Чтобы найти эту критическую
точку, можно воспользоваться функцией
=СТЬЮДЕНТ.ОБР.2Х(α;
n-1)
Доверительный интервал (надежность 1- ) для дисперсии нормально распределенной случайной величины:
.
где
-
квантиль порядка α
распределения хи-квадрат χ2(n-1).
Чтобы найти квантиль порядка α/2, можно воспользоваться функцией:
=ХИ2.ОБР (α/2; n-1)
Чтобы найти квантиль порядка 1-α/2, можно воспользоваться функцией:
=ХИ2.ОБР.ПХ(α/2; n-1)
3. Выборочный коэффициент асимметрии рассчитывается по формуле:
Вычисления можно оформить в виде таблицы:
№ |
|
|
|
Размер выборки |
n |
1 |
|
|
|
Сумма 2 |
|
… |
… |
… |
… |
Сумма 3 |
|
n |
|
|
|
Выборочный коэффициент асимметрии |
|
Для расчета можно использовать стандартную функцию =СКОС()
Примечание: в Excel используется формула с поправкой:
Выборочный коэффициент эксцесса рассчитывается по формуле:
Вычисления можно оформить в виде таблицы:
№ |
|
|
|
Размер выборки |
n |
1 |
|
|
|
Сумма 2 |
|
… |
… |
… |
… |
Сумма 4 |
|
n |
|
|
|
Выборочный коэффициент эксцесса |
|
Для расчета можно использовать стандартную функцию =ЭКСЦЕСС()
Примечание: в Excel используется формула с поправкой:
4. Диаграмма рассеяния предназначена для выявления зависимости между двумя показателями. С помощью этой диаграммы можно визуально выявить корреляцию между двумя показателями.
Для построения гистограммы: Вставка – Диаграммы – Точечная.
Более детальный анализ предполагает получение оценки коэффициента корреляции.
Истинный* коэффициент корреляции R |
Интерпретация |
R=0 |
Линейная связь между с.в. X и Yотсутствует |
R>0 |
Связь прямая: большим значениям Xсоответствуют большие значения Y |
R<0 |
Связь обратная: меньшим значениям Xсоответствуют большие значения Y |
* Следует иметь в виду, что по выборке может быть получен только выборочный коэффициент корреляции r, который является точечной оценкой и может отличаться от истинного значения R.
5. Выборочный коэффициент корреляции Пирсона рассчитывается по формуле:
Вычисления можно оформить в виде таблицы:
№ |
|
|
|
|
|
1 |
|
|
|
|
|
… |
… |
… |
… |
… |
|
n |
|
|
|
|
|
Сумма X2 |
|
Сумма Y2 |
|
Сумма XY |
|
Выборочный коэффициент корреляции Пирсона |
|
Для расчета в Excel используется функция:
=КОРРЕЛ(массив значений X; массив значений Y)
