Добавил:

kruchA Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Северо-Западный институт управления РАНХиГС (СЗАГС)

Предмет:

Эконометрика

Файл:

Эконометрика Практика 1 (2024).docx

Скачиваний:

Добавлен:

23.05.2026

Размер:

1.09 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 73 4 5 6 7 > Следующая >>>

6. Ранговый коэффициент корреляции Спирмена.

Рассмотренный ранее коэффициент корреляции Пирсона неустойчив к выбросам (одна-единственная ошибка в данных может изменить вывод о характере связи). Также он не позволяет выявить связь в том случае, если зависимость между X и Y является монотонной, но нелинейной. Наконец, коэффициент корреляции Пирсона нельзя применять, если хотя бы один из признаков измерен в ранговой шкале (т.е. является неколичественным). От этих недостатков свободен коэффициент корреляции Спирмена.

Расположим n пар наблюдений (x_i, y_i) по убыванию x_i. Тогда первой будет пара с наибольшим значением фактора х, а n-й – с наименьшим. Припишем паре, стоящей на j-м месте число R(x_j) = j, называемое рангом по X. В том случае, когда для j-го, j+1-го, …, j+k-го мест значение x одинаково, ранг соответствующих пар полагается равным:

Аналогичным образом определяется R(y_j) - ранг по Y.

Коэффициент ранговой корреляции Спирмена определяется формулой:

По сути это обычный коэффициент корреляции Пирсона, но рассчитанный не по значениям x_jи y_j, а по их рангам R(x_j) и R(y_j).

№	x	y	R(x)	R(y)	R(x)-R(y)	(R(x)-R(y))²
1	x₁	y₁	R(x₁)	R(y₁)	R(x₁)-R(y₁)	(R(x₁)-R(y₁))²
…	…	…	…	…	…	…
n	x_n	y_n	R(x_n)	R(y_n)	R(x_n)-R(y_n)	(R(x_n)-R(y_n))²

Размер выборки	n
Сумма
Ранговый коэффициент корреляции Спирмена

Для нахождения рангов в MS Excel используется функция

=РАНГ(значение X; массив значений X)

После нахождения рангов по X и по Y можно рассчитать коэффициент корреляции Спирмена с помощью функции:

=КОРРЕЛ(массив рангов по X; массив рангов по Y)

Описательную статистику можно выполнить автоматически, используя пакет анализа MS Excel. Предварительно потребуется установить надстройку "Анализ данных".

Инструкция установке:

https://support.office.com/ru-ru/article/Загрузка-пакета-анализа-в-excel-6a63e598-cd6d-42e3-9317-6b40ba1a66b4

После установки следует перейти на вкладку Данные и выбрать пункт Анализ данных. В открывшемся окне выбрать инструмент Описательная статистика:

В открывшемся окне устанавливается флажок «Метки в первой строке», затем выделяется столбец со выборкой значений X вместе с заголовком. Затем следует установить флажок «Описательная статистика» и нажать OK.

II. Проверка статистических гипотез

Статистическая гипотеза – это утверждение относительно значений параметров распределения случайной величины, случайная выборка реализаций которой нам доступна.

Проверка статистических гипотез включает 4 этапа.

1. Выбирается уровень значимости α.

Уровень значимости – это вероятность ошибки первого рода (вероятность отвергнуть нулевую гипотезу тогда, когда она является истинной). В качестве α стараются выбрать какое-либо небольшое число (т.к. это вероятность ошибки, она не должна быть высокой; вместе с тем она не должна быть и слишком низкой, т.к. иначе нулевую гипотезу будет почти невозможно отвергнуть). Обычно в качестве α выбирают 0,1, 0,05 или 0,01, но можно выбрать и любое другое число.

2. Формулируются нулевая H₀ и альтернативная H₁ гипотезы.

Гипотеза, которую мы первоначально считаем истинной и проверяем, называется нулевой и обозначается H₀. Гипотеза, в пользу которой мы можем отвергнуть нулевую, называется альтернативной и обозначается H₁.

3. Рассчитывается наблюдаемое значение t_набл тестовой статистики T.

Тестовая статистика T – это случайная величина, представляющая собой функцию случайной выборки. Тестовая статистика строится таким образом, чтобы ее распределение в том случае, когда верна нулевая гипотеза H₀, было известным. При подстановке в функцию известных выборочных значений мы получим реализацию данной с.в. T – ее наблюдаемое значение t_набл.

4. Строится критическая область значений с.в. T и проверяется принадлежность наблюдаемого значения критической области.

Если наблюдаемое значение T принадлежит критической области, то нулевая гипотеза H₀ отвергается в пользу альтернативной H₁. Если же не принадлежит, то у исследователя нет оснований отвергнуть нулевую гипотезу.

4.1. Проверка с помощью границы критической области – критического значения t_α.

Критические области обычно односторонние (правосторонние или левосторонние) или двусторонние (обычно симметричные относительно 0).

В случае правосторонней критической области:

Наблюдаемое значение t_набл принадлежит критической области, если выполняется неравенство:

По аналогии, для левосторонней критической области:

наблюдаемое значение t_набл принадлежит ей, если выполняется неравенство:

Для симметричной относительно нуля двусторонней критической области:

наблюдаемое значение t_набл принадлежит ей, если выполняется неравенство:

4.2. Проверка с помощью наблюдаемого уровня значимости (p-value).

Наблюдаемый уровень значимости (p-value) – это такой уровень значимости, при котором T_набл оказывается на границе критической области и области принятия H₀. Например, для правосторонней критической области:

Независимо от вида критической области наблюдаемое значение t_набл принадлежит ей, если выполняется неравенство:

<<< < Предыдущая 1 23 / 73 4 5 6 7 > Следующая >>>

Соседние файлы в предмете Эконометрика

#
23.05.20262.67 Mб0Крючкова практика 6 отчет.docx
#
23.05.20261.22 Mб0Крючкова практика 7.docx
#
23.05.202635.99 Кб0Крючкова практика 7.xlsx
#
23.05.20261.97 Mб0отчет 2 практика Крючкова.docx
#
23.05.20262.73 Mб0Отчет Крючкова А.А..docx
#
23.05.20261.09 Mб0Эконометрика Практика 1 (2024).docx
#
23.05.2026162.82 Кб0Эконометрика Практика 1 (2024).xls
#
23.05.2026579.7 Кб0Эконометрика Практика 2 (2024) (1).docx
#
23.05.2026103.94 Кб0Эконометрика Практика 2 (2024).xls
#
23.05.202684.82 Кб0Эконометрика Практика 2 пример (готовый).xlsx
#
23.05.202626.11 Кб0Эконометрика Практика 2 пример (данные для Gretl).xls