- •9 Статистическое изучение взаимосвязей
- •9.1 Понятие и виды связей между социально-экономическими явлениями
- •9.2 Статистические методы моделирования связи
- •9.2.1 Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)
- •9.2.3 Многофакторный корреляционный и регрессионный анализ
- •9.3 Показатели корреляционной связи (зависимости)
- •9.3.1 Линейные коэффициенты
- •9.3.2 Ранговые коэффициенты корреляции
- •9.3.3 Коэффициент Фехнера (коэффициент корреляции знаков)
- •9.3.4 Коэффициент конкордации
- •9.4 Непараметрические методы
9.3.4 Коэффициент конкордации
Корреляция
рангов (
)
может
определяться не только для двух, но и
для большего числа показателей (факторов).
Исчисляемый в этом случае показатель
именуется коэффициентом
конкордации (
)
и
рассчитывается по формуле:
,
(9.13)
где
-
количество коррелируемых факторов;
- число наблюдений;
-
сумма
квадратов отклонений суммы рангов по
факторам
от их средней арифметической, т.е.
а)
или,
что по значению тоже самое, (9.14)
б)
где
-
ранг
-го
показателя. (9.15)
Коэффициент конкордации часто используется в экспертных оценках для определения согласованности мнений экспертов в распределение мест (рангов) между исследуемыми факторами или объектами по их приоритетности.
Пример 9.4. Пусть имеются следующие данные по пяти фирмам (графы 1-4 таблицы 9.4).
Таблица 9.4 – Исходные данные и промежуточные расчеты коэффициентов конкордации
Фирма |
Прибыль, тыс. руб.
|
Стоимость оборотных средств, млн. руб.
|
Затраты на 100 руб. продукции, руб.
|
Ранги факторов |
Сумма рангов
|
Квадрат суммы рангов
|
||
|
|
|
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 2 3 4 5 |
490 600 550 520 670 |
2,0 2,5 1,8 2,2 2,4 |
80 75 74 77 68 |
1 4 3 2 5 |
2 5 1 3 4 |
5 3 2 4 1 |
8 12 6 9 10 |
64 144 36 81 100 |
Σ |
45 |
425 |
||||||
Определить
тесноту зависимости между
с помощью коэффициента конкордации.
Решение:
1. Ранжираем каждый и трех показателей (графы 5-7).
2.
Находим сумму рангов по каждой строке
(графа 8) и общую сумму пяти строк
3. Возводим в квадрат сумму рангов в каждой строке и находим сумму пяти строк (графа 9):
.
4. Находим , используя формулу 9.11:
.
5. Рассчитаем коэффициент конкордации:
Учитывая малое значение коэффициента конкордации, можно сказать, что зависимость между рассматриваемыми показателями весьма незначительна.
Существуют
и другие коэффициенты для измерения
тесноты зависимости (коэффициенты
ассоциации
и контингенции
;
коэффициент взаимной сопряженности
Пирсона
;
коэффициент Чупрова
),
которые применяются достаточно редко.
9.4 Непараметрические методы
Применение корреляционного и регрессионного анализа требует, чтобы все признаки были количественно измеренными. Построение аналитических группировок предполагает, что количественным должен быть результативный признак. Параметрические методы основаны на использовании основных количественных параметров распределения (средних величин и дисперсий).
Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными) признаками. Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет только об установлении наличия связи и измерении ее тесноты.
В практике статистических исследований приходится иногда анализировать связи между альтернативными признаками, представленными только группами с противоположными (взаимоисключающими) характеристиками. Тесноту связи в этом случае можно оценить, вычислив коэффициент ассоциации.
Для расчета коэффициента ассоциации строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:
a |
b |
a+b |
c |
d |
c+d |
a+c |
b+d |
a+b+c+d |
Применительно
к таблице «четырех полей» с частотами
и
коэффициент
ассоциации выражается формулой:
.
(9.16)
Коэффициент ассоциации изменяется от -1 до +1; чем ближе к +1 или -1, тем сильнее связаны между собой изучаемые признаки.
Если
не
менее 0,3, то это свидетельствует о наличии
связи между качественными признаками.
Пример 9.5. Имеющиеся данные о росте отцов и сыновей представлены в таблице 9.5.
Таблица 9.5 - Распределение отцов и сыновей по росту, чел.
Рост сына |
Рост отца
|
Всего |
|
Ниже среднего |
Выше среднего |
||
Ниже среднего |
75 |
23 |
98 |
Выше среднего |
25 |
77 |
102 |
Итого |
100 |
100 |
200 |
Подсчитаем коэффициент ассоциации по данным таблицы 9.5:
Поскольку
,
между ростом отцов и сыновей существует
корреляционная связь.
Если по каждому из взаимосвязанных признаков выделяется число групп более двух, то для подобного рода таблиц теснота связи между качественными признаками может быть измерена с помощью показателя взаимной сопряженности А.A. Чупрова:
(9.17)
где
- число возможных значений первой
статистической величины (число групп
по столбцам);
-
число возможных значений второй
статистической величины (число групп
по строкам);
-
показатель взаимной сопряженности
(определяется как сумма отношений
квадратов частот клетки таблицы
распределения к произведению итоговых
частот соответствующего столбца и
строки).
Вычтя из этой суммы единицу, получим .
Коэффициент взаимной сопряженности А.А. Чупрова изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых признаков.
Пример 9.6. Данные об уровне образования членов 100 семей приведены в таблице 9.6.
Таблица 9.6 - Распределение семей по уровню образования мужа и жены
Образование мужа |
Образование жены |
Итого |
|||
неполное среднее |
среднее и среднее специальное |
высшее |
А |
В |
|
Неполное среднее |
17 (289) 13,136 |
12 (144) 2,769 |
3 (9) 0,346 |
32 - 16,251 |
0,508 |
Среднее и среднее специальное |
3 (9) 0,409 |
33 (1089) 20,942 |
9 (81) 3,115 |
45 - 24,466 |
0,544 |
Высшее |
2 (4) 0,182 |
7 (49) 0,942 |
14 (196) 7,538 |
23 - 8,662 |
0,377 |
Итого |
22 |
52 |
26 |
100 |
1,429 |
Примечание: частоты - верхние строки; их квадраты (в скобках) - средние строки; квадраты частот, деленные на суммы частот по столбцу - нижние строки; в итоговых столбцах - сумма частот, сумма результатов деления (А), а также результат деления нижнего числа на верхнее - последний столбец (В).
Тогда
,
.
Коэффициент взаимной сопряженности А.А. Чупрова:
.
Его значение показывает заметную связь между уровнями образования мужа и жены при формировании семьи.
