- •Тема 7. Статистическое изучение взаимосвязей
- •1. Понятие и виды статистических связей
- •Шкала Чеддока оценки тесноты связи
- •2. Методы оценки статистических связей между качественными признаками
- •Матрица взаимного распределения частот определения коэффициентов ассоциации и контингенции
- •Матрица взаимного распределения частот
- •3. Методы оценки статистических связей между количественными признаками
- •4. Понятие и методика регрессионного анализа
Матрица взаимного распределения частот определения коэффициентов ассоциации и контингенции
1 признак 2 признак |
Да |
Нет |
Да |
a |
b |
Нет |
c |
d |
Коэффициент ассоциации определяется по формуле:
.
Коэффициент ассоциации непригоден для расчета, если одна из частот равна 0. В этом случае применяется коэффициент контингенции, который рассчитывается по формуле:
,
где a, b, c, d – частоты взаимного распределения признаков.
Связь
между признаками считается подтвержденной,
если
≥0,5,
а
≥0,3.
Коэффициент контингенции всегда меньше
коэффициента ассоциации.
Если значения изучаемого атрибутивного признака имеют более двух вариантов ответов, то для определения тесноты связи применяют коэффициенты Пирсона и Чупрова.
Коэффициент взаимной сопряженности признаков Пирсона определяется по формуле:
.
Более точным показателем тесноты связи является коэффициент взаимной сопряженности признаков Чупрова:
,
где
и
- соответственно число групп, выделенных
по каждому признаку,
-
показатель взаимной сопряженности
признаков, который рассчитывается на
основе матрицы взаимного распределения
частот (
,
).
Матрица взаимного распределения частот
|
1 гр. |
2 гр. |
3 гр. |
Итого |
1 гр. |
s11 |
s12 |
s13 |
n1 |
2 гр. |
s21 |
s22 |
s23 |
n2 |
3 гр. |
s31 |
s32 |
s33 |
n3 |
Итого |
m1 |
m2 |
m3 |
|
3. Методы оценки статистических связей между количественными признаками
Для измерения взаимосвязи количественных признаков применяются коэффициент Фехнера и коэффициент корреляции рангов Спирмена.
Для определения коэффициента Фехнера строят вспомогательную таблицу, а затем рассчитывают по формуле:
,
где
– число случаев совпадения знаков при
отклонении значений признака от значения
средней,
- число случаев несовпадения знаков.
Расчет коэффициента Фехнера
|
|
|
|
с/н |
Коэффициент корреляции рангов Спирмена является наиболее простым показателем измерения тесноты корреляционной зависимости. Для его определения также строят вспомогательную таблицу, после чего коэффициент рассчитывают по формуле:
,
где
- разница между рангами значений
признаков,
- количество значений признаков.
Расчет коэффициента корреляции рангов Спирмена
|
|
|
|
|
|
Коэффициент
корреляции рангов Спирмена изменяется
от -1 до +1, связь между признаками можно
считать статистически значимой, если
.
Для измерения тесноты связи линейной зависимости применяется парный коэффициент корреляции Пирсона. Наиболее удобной для его расчета является следующая формула:
.
Кроме того, коэффициента корреляции можно рассчитать и по другим формулам:
и
.
Если
определена форма корреляционной связи
и коэффициент регрессии
,
то коэффициент корреляции можно
рассчитать по формуле:
.
Коэффициент корреляции изменяется в пределах от -1 до +1. Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента.
,
где n
–
число наблюдений
Расчетное значение t-статистики сравнивается с табличным значением. Если tp > tтабл, то нулевая гипотеза отвергается с вероятностью ошибки α (в социально-экономических исследованиях чаще всего α = 0,05 (1-0,95) или α = 0,01(1-0,99)). Другими словами, признается, что величина r статистически значима.
В условиях малой выборки, при справедливости H0, t-статистика имеет распределение Стьюдента. В данном случае рассчитывается по формуле:
(1.14)
Входными параметрами для отыскания табличного значения являются: α (0.05; 0.01) и число степеней свободы d.f. = n – 2.
Квадрат
коэффициента корреляции (
)
называется коэффициентом детерминации.
Его значение изменяется в пределах от
0 до 1, и означает долю вариации
результативного признака, обусловленную
вариацией признака-фактора.
При многофакторной (множественной) регрессии, рассчитывается множественный коэффициент корреляции, характеризующий интенсивность влияния на результативный признак нескольких факторов:
Так, при двухфакторной модели связи формула множественного коэффициента корреляции выглядит следующим образом:
.
(1.29)
Значения R изменяются в пределах от 0 до 1. Величина совокупного коэффициента корреляции всегда больше любого из парных коэффициентов и включение в анализ новых факторов не может привести к уменьшению значения R.
Квадрат множественного коэффициента корреляции R2 является множественным коэффициентом детерминации и характеризует долю дисперсии результативного признака, объясненную вариацией всех факторов, включенных в анализ, в общей дисперсии результата.
Для измерения тесноты криволинейных зависимостей применяются универсальный показатель тесноты связи теоретическое корреляционное отношение или индексы корреляции.
Теоретическое корреляционное отношение представляет собой квадратный корень из отношения дисперсии, обусловленной факторным признаком, к общей дисперсии результативного признака:
;
Таким образом, теоретическое корреляционное отношение показывает влияние факторного признака, включенного в уравнение регрессии, на результативный признак и изменяется в пределах от 0 до 1.
При использовании теоретического корреляционного отношения в линейных зависимостях, как однофакторной, так и многофакторной зависимостях, его уровень совпадает с абсолютной величиной, как коэффициента парной корреляции, так и коэффициента множественной корреляции. Поэтому теоретическое корреляционное отношение является универсальным показателем тесноты связи и может использоваться при любом количестве факторных признаков, при любой форме связи.
Квадрат
корреляционного отношения
является коэффициентом детерминации
и определяет долю вариации
признака-результата, которая корреляционно
связана с вариацией признака-фактора
(факторов), т.е. характеризует долю
объясненной дисперсии в общей дисперсии
зависимой переменной. Корреляционное
отношение и коэффициент детерминации
являются универсальными измерителями
степени тесноты связи.
