- •Вопрос 36. Понятие связи, типы связей, понятие корреляции и регрессии.
- •Вопрос 37. Метод приведения параллельных данных. Парная регрессия.
- •Вопрос 38. Множественная регрессия.
- •Вопрос 39. Оценка адекватности модели.
- •Вопрос 40. Оценка существенности корреляции.
- •Вопрос 41. Методы изучения связи социальных явлений.
- •Вспомогательная таблица для расчета коэффициента взаимной сопряженности
- •Вопрос 42. Понятие рангов. Ранговые коэффициенты Спирмена.
- •Таб.8.8. Расчетная таблица для определения коэффициента корреляции рангов
- •Вопрос 43. Ранговые коэффициенты Кендалла. Коэффициент конкордации.
Вопрос 41. Методы изучения связи социальных явлений.
Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки. Количественная оценка связей социальных явлений осуществляется на основе расчета и анализа целого ряда коэффициентов.
Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой).
Таб.8.6. Таблица для вычисления коэффициентов
ассоциации и контингенции
-
a
b
a + b
c
d
c + d
a + c
b + d
a + b + c + d
Коэффициенты вычисляются по формулам:
ассоциации:
;
контингенции:
.
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0.5 или Кk > 0.3.
Пример. Исследовалась социально-демографическая характеристика случайных потребителей наркотиков в зависимости от их семейного положения в одном из регионов РФ (тыс. чел.). Результаты обследования характеризуются следующими данными:
Группы потребителей наркотиков |
Семейное положение |
Всего |
|
замужем (женат) |
не замужем (не женат) |
||
Потреблял |
10,0 |
14,5 |
24,5 |
Не потреблял |
2,5 |
4,5 |
7,0 |
итого |
12,5 |
19,0 |
31,5 |
Рассчитать коэффициенты ассоциации и контингенции.
Решение.
;
Вывод. Так как Ка < 0.5 и Кk < 0.3, то потребление наркотиков случайными потребителями не зависит от их семейного положения.
Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова, которые вычисляются по следующим формулам:
,
где 2 – показатель взаимной сопряженности;
2 – определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки минус 1:
,
где К1
– число значений (групп) первого признака;
К2
– число значений (групп) второго признака.
Чем ближе величины КП
и КЧ
к 1, тем связь теснее.
Рассмотрим вспомогательную таблицу для расчета коэффициента взаимной сопряженности:
Вспомогательная таблица для расчета коэффициента взаимной сопряженности
у х |
I |
II |
III |
Итого |
I |
… |
… |
|
|
II |
… |
… |
|
|
III |
… |
… |
|
|
Итого |
|
|
|
n |
.
Пример. Исследовать зависимость между оценкой уровня жизни респондентов Москвы и типом предприятия, на котором они работают. Данные, характеризующие опрос, приведены в таблице 8.7. (тыс. чел.):
Таблица 8.7.
Тип предприятия |
Оценка уровня жизни респондентов |
Итого |
|||
Вполне удовлетворен |
Скорее удовлетворен |
Скорее не удовлетворен |
Совсем не удовлетворен |
||
Государственное |
31 |
35 |
35 |
35 |
136 |
Акционерное общество |
17 |
13 |
14 |
9 |
53 |
Арендованное |
4 |
2 |
1 |
1 |
8 |
Частное |
8 |
5 |
4 |
3 |
20 |
Итого |
60 |
55 |
54 |
48 |
217 |
Необходимо определить коэффициенты взаимной сопряженности Пирсона и Чупрова.
Решение.
;
;
;
.
Вывод. Оценка уровня жизни респондентов не зависит от типа предприятия, на котором они работают.
В
статистике существуют модификации
коэффициента Присона, например через
расчет
-критерия.
Коэффициент взаимной сопряженности
(КП)
вычисляется по формуле
,
где
- наиболее распространенный критерий
согласия, используемый для проверки
статистической гипотезы о виде
распределения. Коэффициент Чупрова
изменяется в пределах 0 < KЧ
< 1.
Пример. По данным табл. 8.7 определить зависимость между признаками.
Решение.
.
Другой
модификацией коэффициента сопряженности
Чупрова является
,
где К1 – число строк в таблице; К2 – число граф в таблице; n – число наблюдений.
Вычислим величину К для приведенного примера.
По данным табл. 8.7 получим:
.
Особое значение для оценки связи имеет биссериальный коэффициент корреляции, который дает возможность оценить связь между качественным альтернативным и количественным варьирующим признаками. Данный коэффициент вычисляется по формуле
,
где
- средние в группах;
-
среднее квадратическое отклонение
фактических значений признака от
среднего уровня ; p
– доля первой группы; q
– доля второй группы; z
– табулированные (табличные) значения
Z
– распределения в зависимости от p.
Пример. С помощью биссериального коэффициента корреляции исследовалась связь между возрастом и социальным положением основных категорий потенциальных эмигрантов. Данные, характеризующие эту связь, приведены в таблице:
Основные категории потенциальных эмигрантов |
Возраст, лет |
Всего, чел. |
||||
До 30 |
30 - 40 |
40 - 50 |
50 и более |
|||
25 |
35 |
45 |
55 |
|||
Руководители |
5 |
30 |
39 |
26 |
100 |
|
Рабочие |
21 |
38 |
28 |
13 |
100 |
|
Итого |
26 |
68 |
67 |
39 |
200 |
|
Решение.
;
;
;
;
;
.
Связь умеренная.
