3.3. Многомерные таблицы сопряженности с управляющей переменной
Часто исследователю приходится иметь дело с таблицами сопряженности более чем с двумя входами – с так называемыми многомерными таблицами. В этом случае поступают следующим образом: по-прежнему работают с двумерными таблицами, выясняя тем самым связи между двумя признаками, а остальные признаки — так называемые управляющие – при этом принимают поочередно фиксированные значения (в случае одной управляющей переменной) или же фиксированные сочетания значений (если управляющих переменных больше одной). Разумеется, выбор двух признаков для формирования двумерных таблиц сопряженности произволен и диктуется исключительно интересами исследователя.
Приведем пример из эмпирической социологии. По данным широкомасштабного опроса, который проводился в 35 регионах Российской Федерации в 1993 г., необходимо сравнить две области – Курскую и Орловскую – по связи двух признаков: “Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”. Используется та же процедура Crosstabs (Таблицы сопряженности) программы SPSS Base, но задаются не два, а три признака. Первые два задают строки и столбцы двумерных таблиц (признаки “Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”), третий признак – “Область” является управляющей переменной и задает слои трехмерной таблицы (табл. 3.12).
Таблица 3.12
Таблица сопряженности “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)
|
|
|
Как изменилось экон. и фин. положение Вашей семьи за последний год? |
Итого | ||||
Область
|
|
|
Cущественно улучшилось |
Немного улучшилось |
Осталось без изменений |
Немного ухудшилось |
Существенно ухудшилось |
|
Курская
|
Какое у Вас образо-вание?
|
Без образования, неграмотный |
|
1 |
2 |
10 |
6 |
19 |
Начальное образование |
|
3 |
12 |
27 |
37 |
79 | ||
Незакончен. среднее |
1 |
4 |
24 |
44 |
56 |
129 | ||
Среднее |
4 |
24 |
58 |
61 |
89 |
236 | ||
Среднее специальное |
10 |
40 |
69 |
69 |
92 |
280 | ||
Незакончен. высшее |
4 |
12 |
14 |
12 |
6 |
48 | ||
Высшее |
1 |
30 |
41 |
40 |
63 |
175 | ||
Ученая степень |
|
|
|
|
1 |
1 | ||
Итого |
|
20 |
114 |
222 |
263 |
350 |
967 |
Окончание таблицы 3.12
Орловская
|
Какое у Вас образо-вание?
|
Без образования, неграмотный |
|
|
|
3 |
6 |
9 |
Начальное образование |
3 |
5 |
13 |
19 |
23 |
63 | ||
Незакончен. среднее |
1 |
10 |
31 |
35 |
38 |
115 | ||
Среднее |
4 |
23 |
71 |
69 |
66 |
233 | ||
Среднее специальное |
6 |
31 |
78 |
73 |
82 |
270 | ||
Незакончен. высшее |
2 |
19 |
20 |
16 |
18 |
75 | ||
Высшее |
5 |
27 |
46 |
48 |
56 |
182 | ||
Ученая степень |
|
|
2 |
2 |
1 |
5 | ||
Итого |
|
21 |
115 |
261 |
265 |
290 |
952 |
Некоторые ячейки таблицы сопряженности (табл. 3.12) оказались мало наполненными, что нарушает требование со стороны корректности расчета критерия хи-квадрат (не более 20% ячеек с ожидаемыми значениями, меньшими 5 и отсутствие клеток с ожидаемыми значениями, меньшими 1). После исключения этих строк таблица сопряженности представлена в виде процентов по строкам (табл. 3.13).
Таблица 3.13
Таблица сопряженностей «Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область» % в Какое у Вас образование? (опрос 1993 года)
|
|
|
Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
Итого | ||||
Область
|
|
|
Cущественно улучшилось |
Немного улучшилось |
Осталось без изменений |
Немного ухудшилось |
Существенно ухудшилось |
|
Курская |
Какое у Вас образо-вание?
|
Начальное образование |
|
3,8% |
15,2% |
34,2% |
46,8% |
100,0% |
|
Незакончен. среднее |
0,8% |
3,1% |
18,6% |
34,1% |
43,4% |
100,0% | |
|
Среднее |
1,7% |
10,2% |
24,6% |
25,8% |
37,7% |
100,0% | |
|
Среднее специальное |
3,6% |
14,3% |
24,6% |
24,6% |
32,9% |
100,0% |
Окончание таблицы 3.13
|
|
Незакончен. высшее |
8,3% |
25,0% |
29,2% |
25,0% |
12,5% |
100,0% |
|
Высшее |
0,6% |
17,1% |
23,4% |
22,9% |
36,0% |
100,0% | |
|
Итого |
|
2,1% |
11,9% |
23,0% |
26,7% |
36,2% |
100,0% |
Орловская |
Какое у Вас образо-вание?
|
Начальное образование |
4,8% |
7,9% |
20,6% |
30,2% |
36,5% |
100,0% |
|
Незакончен. среднее |
0,9% |
8,7% |
27,0% |
30,4% |
33,0% |
100,0% | |
|
Среднее |
1,7% |
9,9% |
30,5% |
29,6% |
28,3% |
100,0% | |
|
Среднее специальное |
2,2% |
11,5% |
28,9% |
27,0% |
30,4% |
100,0% | |
|
Незакончен. высшее |
2,7% |
25,3% |
26,7% |
21,3% |
24,0% |
100,0% | |
|
Высшее |
2,7% |
14,8% |
25,3% |
26,4% |
30,8% |
100,0% | |
|
Итого |
|
2,2% |
12,3% |
27,6% |
27,7% |
30,2% |
100,0% |
Из табл. 3.14 “Критерии хи-квадрат” видно, что для обоих слоев – Курской и Орловской областей – требование к наполненности ячеек выполнено, поэтому следует принять статистический вывод о значимости связи рассматриваемых признаков (“Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”) по выборке для Курской области и незначимости — для Орловской: значение критерия Пирсона 2=65,294 для первого слоя при 20 степенях свободы значимо на высоком уровне не менее 0,0005, а для второго слоя (2=24,881 при том же числе степеней свободы) — на уровне ошибки первого рода =0,206, что не позволяет принять гипотезу о наличии связи между признаками.
Таблица 3.14
Критерии хи-квадрат для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)
Область |
|
Значение |
Ст. св. |
Асимпт. значимость (2-стор.) |
Курская |
Хи-квадрат Пирсона |
65,294 |
20 |
0,000 |
|
Отношение правдоподобия |
69,111 |
20 |
0,000 |
|
Линейно-линейная связь |
24,734 |
1 |
0,000 |
|
Количество валидных наблюдений |
947 |
|
|
Орловская |
Хи-квадрат Пирсона |
24,881 |
20 |
0.206 |
|
Отношение правдоподобия |
22,734 |
20 |
0,302 |
|
Линейно-линейная связь |
4,437 |
1 |
0,035 |
|
Количество валидных наблюдений |
938 |
|
|
Этот вывод подтверждается и значениями других коэффициентов связи, основанных на критерии Пирсона (табл. 3.15): критерий фи равен 0,263 и 0,163 для Курской и Орловской области соответственно; мера Крамера – 0,131 и 0,081, коэффициент сопряженности – 0,254 и 0,161, с теми же уровнями значимости. (Столь небольшая величина перечисленных мер связи, весьма далекая от единицы, но оказавшаяся значимой для выборки по Курской области, не должна смущать, поскольку число степеней свободы и объем выборки весьма велики.)
Таблица 3.15
Симметричные меры для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)
Область |
|
|
Значение |
Прибл. значимость |
Курская
|
Номинальная по номинальной
|
Фи |
0.263 |
0.000 |
V Крамера |
0.131 |
0.000 | ||
Коэффициент сопряженности |
0.254 |
0.000 | ||
Кол-во валидных наблюдений |
|
947 |
| |
Орловская
|
Номинальная по номинальной
|
Фи |
0.163 |
0.206 |
V Крамера |
0.081 |
0.206 | ||
Коэффициент сопряженности |
0.161 |
0.206 | ||
Кол-во валидных наблюдений |
|
938 |
|
Для первого слоя – Курской области – можно также рассмотреть направленные меры связи (для второго слоя – Орловской области – такой анализ не имеет смысла ввиду незначимости хи-критерия). В табл. 3.16, полученной также с помощью процедуры Crosstabs программы SPSS Base, приведены значения коэффициента лямбда, тау Гудмена и Краскала и коэффициента неопределенности. В этой таблице приведены также значения направленных мер связи и для Орловской области. Как и ожидалось, все эти критерии оказались незначимы статистически.
Таблица 3.16
Направленные меры для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)
Область |
|
|
Значение |
Асимпт.стд. ошибка |
Прибл. T |
Прибл. значимость |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Курская |
Лямбда |
Симметричная |
0,006 |
0,004 |
1,792 |
0,073 |
|
|
Зависимая Какое у Вас образование? |
0,000 |
0,000 |
. |
. |
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,013 |
0,007 |
1,792 |
0,073 |
|
Тау Гудмена и Краскала |
Зависимая Какое у Вас образование? |
0,010 |
0,003 |
|
0,000 |
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,015 |
0,004 |
|
0,000 |
|
Коэффициент неопределен- ности |
Симметричная |
0,024 |
0,005 |
4,538 |
0,000 |
|
|
Зависимая Какое у Вас образование? |
0,022 |
0,005 |
4,538 |
0,000 |
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,026 |
0,006 |
4,538 |
0,000 |
Орловская |
Лямбда |
Симметричная |
0,005 |
0,010 |
0,529 |
0,597 |
|
|
Зависимая Какое у Вас образование? |
0,000 |
0,000 |
. |
. |
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,011 |
0,020 |
0,529 |
0,597 |
|
Тау Гудмена и Краскала |
Зависимая Какое у Вас образование? |
0,004 |
0,002 |
|
0,629 |
Окончание таблицы 3.16
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,006 |
0,003 |
|
0,420 |
|
Коэффициент неопределен-ности |
Симметричная |
0,008 |
0,003 |
2,316 |
0,302 |
|
|
Зависимая Какое у Вас образование? |
0,007 |
0,003 |
2,316 |
0,302 |
|
|
Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год? |
0,009 |
0,004 |
2,316 |
0,302 |
По величине коэффициентов и приблизительного уровня значимости можно заключить, что уровень образования респондентов Курской области в определенной мере определяет изменение экономического и финансового положения их семей и наоборот, изменение экономического и финансового положения их семей: критерий лямбда=0,007 значим на уровне 0,073, что лишь немного превышает нормативное значение 0,05; два других критерия значимы на высоком уровне, меньше чем 0,0005. (Обратное заключение: изменение экономического и финансового положения семей респондентов Курской области в определенной мере определяет уровень их образования, хотя и вытекает из формальной значимости соответствующих критериев, лишено смысла.)
Разумеется, полученные результаты являются лишь основанием для более глубокого анализа таблиц сопряженности. Как правило, начинать надо с графического представления. На рис. 3.7 представлена диаграмма, иллюстрирующая распределение частоты (встречаемости) респондентов Курской области с различных уровнем образования по категориям признака “Как изменилось экономическое и финанасовое положение Вашей семьи за последний год?”.
Рис. 3.7. Диаграмма распределения частот респондентов Курской области с различным уровнем образования по категориям признака “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?” (социологический опрос 1993 г.) |
Нашей задачей не является детальный анализ полученных диаграмм и графиков; заметим лишь, что графическое представление на рис. 3.7 далеко не исчерпывает возможностей визуализации данных, представленных в таблицах сопряженности. Так, от частот целесообразно перейти к частостям (процентам по строкам либо по столбцам). Хотя такой опции применительно к графикам процедурой Crosstabs программы SPSS Base не предусмотрено, однако всегда имеется возможность “вторичного” ввода сгруппированных данных таблиц сопряженности в редактор данных с последующим их графическим анализом и аналитической обработкой с помощью других процедур.
Помимо упомянутых, существует еще большое количество разнообразных мер связи двух признаков, применение которых является довольно специфичным, и в данной монографии они не рассматриваются.