
- •4.1. Основные понятия
- •4.2. Корреляционное поле. Корреляционная таблица
- •4.3. Выбор метода корреляционного анализа
- •4.4. Биссериальный коэффициент корреляции
- •4.5. Непараметрический показатель связи – коэффициент Фехнера
- •4.6. Коэффициенты корреляции рангов
- •4.7. Коэффициенты ассоциации и контингенции
- •4.8. Коэффициенты оценки связи качественных
- •4.9. Коэффициенты корреляции количественных признаков
- •4.10. Множественная корреляция
4.10. Множественная корреляция
Для определения тесноты связи между откликом и несколькими факторами на практике используются следующие коэффициенты: конкордации, множественной корреляции и множественной детерминации.
Коэффициент конкордации – определяет тесноту связи между произвольным количеством признаков, которые могут быть качественными или количественными. Требуется, чтобы они были проранжированными.
Коэффициент конкордации вычисляется по следующей формуле:
(4.10.1)
где m – количество признаков;
n – общее количество наблюдений;
S - отклонение суммы квадратов рангов от средней квадратов рангов которое вычисляется по формуле:
(4.10.2)
где n – общее количество наблюдений;
si – сумма рангов всех признаков по i-ой строке.
Сила связи определяется по критерию Пирсона, вычисляемого по формуле:
(4.10.3)
Пример 4.10.1
Вычисление коэффициента конкордации продемонстрируем на примере определения тесноты связи между уставным капиталом, числом акций, выставленных на продажу, и уставным капиталом. Исходные данные и результаты предварительных расчётов представлены в таблице 4.10.1.
Таблица 4.10.1. Исходные данные примера 4.10.1
№ |
Устав. кап. -х |
Число акций –у |
Число рабо-тников - z |
Ранг х |
Ранг у |
Ранг z |
Сумма строк |
Квадр. сумм |
1 |
29540 |
856 |
119 |
9 |
7 |
1 |
17 |
289 |
2 |
16050 |
930 |
125 |
1 |
9 |
2 |
12 |
144 |
3 |
41020 |
1563 |
132 |
10 |
10 |
3 |
23 |
529 |
4 |
23500 |
682 |
141 |
6 |
5 |
4 |
15 |
225 |
5 |
26250 |
616 |
150 |
7 |
3 |
5 |
15 |
225 |
6 |
17950 |
495 |
165 |
4 |
2 |
6 |
12 |
144 |
7 |
28130 |
815 |
178 |
8 |
6 |
7 |
21 |
441 |
8 |
17510 |
858 |
181 |
3 |
8 |
8 |
19 |
361 |
9 |
17000 |
467 |
201 |
2 |
1 |
9 |
12 |
144 |
10 |
22640 |
661 |
204 |
5 |
4 |
10 |
19 |
361 |
Итого |
|
|
|
|
|
|
165 |
2863 |
Вычислим отклонение суммы квадратов рангов от среднего значения квадратов рангов:
S= 2863-1652/10=140.5.
По (4.10.1) вычислим коэффициент конкордации:
W=12·140.5/(32(103-10))=0.19.
По (4.10.2) вычислим значение критерия Пирсона:
χ2=12·140.5/(3·10·(10-1))=6.24.
По статистической таблице [2] находим критическое значение критерия Пирсона для рекомендуемого уровня значимости α=0.05 и количества степеней свободы n-1=10-1=9: χ2крит=16.919. Ввиду того, что вычисленное значение критерия Пирсона не превышает критическое значение делаем заключение об отсутствии связи между откликом – уставным капиталом и двумя факторами: количеством акций, выставленных на продажу, и количеством работников на предприятиях.
Коэффициенты множественной детерминации и корреляции требуют наличия линейной зависимости между откликом и всеми факторами и нормальности всех переменных, используемых в вычислениях. К достоинствам этих коэффициентов относится наличие возможности оценки их существенности.
Эти показатели как правило используются для оценки качества уравне-ний регрессии в стандартных процедурах регрессионного анализа. Они так-же могут использоваться и для самостоятельных расчётов по определению силы связи между случайными переменными. Вычисления являются матрич-ными и поэтому при проведении вычислений без применения компьютеров сложными.
Для вычисления коэффициента множественной детерминации требуется первоначально вычислить парные коэффициенты линейной корреляции между всеми переменными, т.е. откликом и всеми факторами и составить соответствующую матрицу. Коэффициент множественной детерминации –
R2y,x1,x2,…xm делением определителя матрицы Δ* на определитель матрицы Δ.
ryx1
ryx2
…
ryxm
0
1 rx1x2 … rx1xm rx1y
Δ
. .
. .
. . . . . . . . .
rxmx1 rxmx2 … 1 rxmy
1 rx1x2
…
rx1xm
Δ
. .
. . . . . . .
rxmx1 rxmx2 … 1
R2yx1x2…xm = Δ*/ Δ. (4.10.6)
Rкор,yx1x2…xm
= √Δ*/
Δ.
(4.10.7)
По статистическим таблицам [11] находим критические значения коэффициентов множественной детерминации и корреляции для рекомендуемого уровня значимости α=0.05 и количества степеней свободы равного количеству наблюдений минус 1, и если вычисленные по (4.10.6) и (4.10.7) значения превышают критические, то корреляционная связь между откликом и факторами считается существенной.
Для простоты приведём пример вычисления коэффициентов детермина-ции и корреляции для результативного показателя у – добычи нефти и двух наиболее существенно влияющих на неё факторов: х1 – разведочного бурения и х2 – количества добывающих скважин.
Пример 4.10.2
Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, приведённых в таблице 4.10.2, полученные по таблице 4.9.4. Для упрощения формул фактор х4 таблицы 4.9.4 переименован в фактор х2.
Таблица 4.10.2. Исходные данные для примера 4.10.2
Показатель |
Код |
1996 г. |
1977 г. |
1998 г. |
1999 г. |
2000 г. |
2001 г. |
2002 г. |
Добыча нефти в млн. тонн |
y |
269,91 |
270,94 |
264,70 |
268,53 |
281,29 |
301,73 |
341,60 |
Разведочное бурение в тыс. метрах |
x1 |
1026,4 |
1006,7 |
789.0 |
824,9 |
1013,7 |
1145,1 |
1410,4 |
Кол. добываю- щих скважин |
х2 |
106645 |
101224 |
97557 |
101937 |
109939 |
114883 |
113672 |
По данным таблицы 4.10.2 вычислены коэффициенты линейной корре-ляции между всеми переменными и результаты вычислений помещены в таблицу 4.10.3.
Таблица 4.10.3. Коэффициенты линейной корреляции для переменных
примера 4.10.2
Коды |
y |
x1 |
x2 |
y |
1 |
0,932 |
0,865 |
x1 |
0,932 |
1 |
0,831 |
x2 |
0,865 |
0,831 |
1 |
Коэффициент множественной детерминации вычисляется по формуле:
(4.10.8)
Коэффициент множественной корреляции вычисляется по формуле:
(4.10.9)
Проведём вычисления по формулам (4.10.8) и (4.10.9):
По шкале Чеддока коэффициент множественной корреляции попадает в диапазон значений от 0.5 до 0.7 и следовательно корреляционная связь меж-ду результативным показателем у – добычи нефти и двух влияющих на неё факторов: х1 – разведочного бурения и х4 – количества добывающих скважин должна быть отнесена к заметным.
Полезно бывает вычислить и частные коэффициенты корреляции, кото-рые исключают влияние всех факторов кроме одного, по следующим формулам:
(4.10.10)
(4.10.11)
Естественно, что влияние фактора х1 на х2 без учёта влияния результатив-ного показателя у такое же как влияние фактора х2 на х1 без учёта влияния результативного показателя у:
(4.10.12)
По формулам (4.10.10) – (4.10.12) вычислим частные коэффициенты корреляции.
Частные коэффициенты линейной корреляции уменьшают значения коэффициентов линейной корреляции за счёт исключения совместного влияния переменных, что не противоречит здравому смыслу.