Скачиваний:
59
Добавлен:
08.04.2015
Размер:
595.46 Кб
Скачать

3.3. Многомерные таблицы сопряженности с управляющей переменной

Часто исследователю приходится иметь дело с таблицами сопряженности более чем с двумя входами – с так называемыми многомерными таблицами. В этом случае поступают следующим образом: по-прежнему работают с двумерными таблицами, выясняя тем самым связи между двумя признаками, а остальные признаки — так называемые управляющие – при этом принимают поочередно фиксированные значения (в случае одной управляющей переменной) или же фиксированные сочетания значений (если управляющих переменных больше одной). Разумеется, выбор двух признаков для формирования двумерных таблиц сопряженности произволен и диктуется исключительно интересами исследователя.

Приведем пример из эмпирической социологии. По данным широкомасштабного опроса, который проводился в 35 регионах Российской Федерации в 1993 г., необходимо сравнить две области – Курскую и Орловскую – по связи двух признаков: “Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”. Используется та же процедура Crosstabs (Таблицы сопряженности) программы SPSS Base, но задаются не два, а три признака. Первые два задают строки и столбцы двумерных таблиц (признаки “Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”), третий признак – “Область” является управляющей переменной и задает слои трехмерной таблицы (табл. 3.12).

Таблица 3.12

Таблица сопряженности “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)

Как изменилось экон. и фин. положение Вашей семьи за последний год?

Итого

Область

Cущественно улучшилось

Немного улучшилось

Осталось без изменений

Немного ухудшилось

Существенно ухудшилось

Курская

Какое у Вас образо-вание?

Без образования, неграмотный

1

2

10

6

19

Начальное образование

3

12

27

37

79

Незакончен. среднее

1

4

24

44

56

129

Среднее

4

24

58

61

89

236

Среднее специальное

10

40

69

69

92

280

Незакончен. высшее

4

12

14

12

6

48

Высшее

1

30

41

40

63

175

Ученая степень

1

1

Итого

20

114

222

263

350

967

Окончание таблицы 3.12

Орловская

Какое у Вас образо-вание?

Без образования, неграмотный

3

6

9

Начальное образование

3

5

13

19

23

63

Незакончен. среднее

1

10

31

35

38

115

Среднее

4

23

71

69

66

233

Среднее специальное

6

31

78

73

82

270

Незакончен. высшее

2

19

20

16

18

75

Высшее

5

27

46

48

56

182

Ученая степень

2

2

1

5

Итого

21

115

261

265

290

952

Некоторые ячейки таблицы сопряженности (табл. 3.12) оказались мало наполненными, что нарушает требование со стороны корректности расчета критерия хи-квадрат (не более 20% ячеек с ожидаемыми значениями, меньшими 5 и отсутствие клеток с ожидаемыми значениями, меньшими 1). После исключения этих строк таблица сопряженности представлена в виде процентов по строкам (табл. 3.13).

Таблица 3.13

Таблица сопряженностей «Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область» % в Какое у Вас образование? (опрос 1993 года)

Как изменилось экономическое и фин. положение Вашей семьи за последний год?

Итого

Область

Cущественно улучшилось

Немного улучшилось

Осталось без изменений

Немного ухудшилось

Существенно ухудшилось

Курская

Какое у Вас образо-вание?

Начальное образование

3,8%

15,2%

34,2%

46,8%

100,0%

Незакончен. среднее

0,8%

3,1%

18,6%

34,1%

43,4%

100,0%

Среднее

1,7%

10,2%

24,6%

25,8%

37,7%

100,0%

Среднее специальное

3,6%

14,3%

24,6%

24,6%

32,9%

100,0%

Окончание таблицы 3.13

Незакончен. высшее

8,3%

25,0%

29,2%

25,0%

12,5%

100,0%

Высшее

0,6%

17,1%

23,4%

22,9%

36,0%

100,0%

Итого

2,1%

11,9%

23,0%

26,7%

36,2%

100,0%

Орловская

Какое у Вас образо-вание?

Начальное образование

4,8%

7,9%

20,6%

30,2%

36,5%

100,0%

Незакончен. среднее

0,9%

8,7%

27,0%

30,4%

33,0%

100,0%

Среднее

1,7%

9,9%

30,5%

29,6%

28,3%

100,0%

Среднее специальное

2,2%

11,5%

28,9%

27,0%

30,4%

100,0%

Незакончен. высшее

2,7%

25,3%

26,7%

21,3%

24,0%

100,0%

Высшее

2,7%

14,8%

25,3%

26,4%

30,8%

100,0%

Итого

2,2%

12,3%

27,6%

27,7%

30,2%

100,0%

Из табл. 3.14 “Критерии хи-квадрат” видно, что для обоих слоев – Курской и Орловской областей – требование к наполненности ячеек выполнено, поэтому следует принять статистический вывод о значимости связи рассматриваемых признаков (“Какое у Вас образование?” и “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?”) по выборке для Курской области и незначимости — для Орловской: значение критерия Пирсона 2=65,294 для первого слоя при 20 степенях свободы значимо на высоком уровне не менее 0,0005, а для второго слоя (2=24,881 при том же числе степеней свободы) — на уровне ошибки первого рода =0,206, что не позволяет принять гипотезу о наличии связи между признаками.

Таблица 3.14

Критерии хи-квадрат для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)

Область

Значение

Ст. св.

Асимпт. значимость (2-стор.)

Курская

Хи-квадрат Пирсона

65,294

20

0,000

Отношение правдоподобия

69,111

20

0,000

Линейно-линейная связь

24,734

1

0,000

Количество валидных наблюдений

947

Орловская

Хи-квадрат Пирсона

24,881

20

0.206

Отношение правдоподобия

22,734

20

0,302

Линейно-линейная связь

4,437

1

0,035

Количество валидных наблюдений

938

Этот вывод подтверждается и значениями других коэффициентов связи, основанных на критерии Пирсона (табл. 3.15): критерий фи равен 0,263 и 0,163 для Курской и Орловской области соответственно; мера Крамера – 0,131 и 0,081, коэффициент сопряженности – 0,254 и 0,161, с теми же уровнями значимости. (Столь небольшая величина перечисленных мер связи, весьма далекая от единицы, но оказавшаяся значимой для выборки по Курской области, не должна смущать, поскольку число степеней свободы и объем выборки весьма велики.)

Таблица 3.15

Симметричные меры для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)

Область

Значение

Прибл. значимость

Курская

Номинальная по номинальной

Фи

0.263

0.000

V Крамера

0.131

0.000

Коэффициент сопряженности

0.254

0.000

Кол-во валидных наблюдений

947

Орловская

Номинальная по номинальной

Фи

0.163

0.206

V Крамера

0.081

0.206

Коэффициент сопряженности

0.161

0.206

Кол-во валидных наблюдений

938

Для первого слоя – Курской области – можно также рассмотреть направленные меры связи (для второго слоя – Орловской области – такой анализ не имеет смысла ввиду незначимости хи-критерия). В табл. 3.16, полученной также с помощью процедуры Crosstabs программы SPSS Base, приведены значения коэффициента лямбда, тау Гудмена и Краскала и коэффициента неопределенности. В этой таблице приведены также значения направленных мер связи и для Орловской области. Как и ожидалось, все эти критерии оказались незначимы статистически.

Таблица 3.16

Направленные меры для таблицы сопряженностей “Какое у Вас образование? * Как изменилось экономическое и фин. положение Вашей семьи за последний год? * Область” (опрос 1993 года)

Область

Значение

Асимпт.стд. ошибка

Прибл. T

Прибл. значимость

1

2

3

4

5

6

7

Курская

Лямбда

Симметричная

0,006

0,004

1,792

0,073

Зависимая Какое у Вас

образование?

0,000

0,000

.

.

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,013

0,007

1,792

0,073

Тау Гудмена и Краскала

Зависимая Какое у Вас

образование?

0,010

0,003

0,000

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,015

0,004

0,000

Коэффициент

неопределен- ности

Симметричная

0,024

0,005

4,538

0,000

Зависимая Какое у Вас

образование?

0,022

0,005

4,538

0,000

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,026

0,006

4,538

0,000

Орловская

Лямбда

Симметричная

0,005

0,010

0,529

0,597

Зависимая Какое у Вас образование?

0,000

0,000

.

.

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,011

0,020

0,529

0,597

Тау Гудмена и Краскала

Зависимая

Какое у Вас

образование?

0,004

0,002

0,629

Окончание таблицы 3.16

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,006

0,003

0,420

Коэффициент неопределен-ности

Симметричная

0,008

0,003

2,316

0,302

Зависимая Какое у Вас

образование?

0,007

0,003

2,316

0,302

Зависимая Как изменилось экономическое и фин. положение Вашей семьи за последний год?

0,009

0,004

2,316

0,302

По величине коэффициентов и приблизительного уровня значимости можно заключить, что уровень образования респондентов Курской области в определенной мере определяет изменение экономического и финансового положения их семей и наоборот, изменение экономического и финансового положения их семей: критерий лямбда=0,007 значим на уровне 0,073, что лишь немного превышает нормативное значение 0,05; два других критерия значимы на высоком уровне, меньше чем 0,0005. (Обратное заключение: изменение экономического и финансового положения семей респондентов Курской области в определенной мере определяет уровень их образования, хотя и вытекает из формальной значимости соответствующих критериев, лишено смысла.)

Разумеется, полученные результаты являются лишь основанием для более глубокого анализа таблиц сопряженности. Как правило, начинать надо с графического представления. На рис. 3.7 представлена диаграмма, иллюстрирующая распределение частоты (встречаемости) респондентов Курской области с различных уровнем образования по категориям признака “Как изменилось экономическое и финанасовое положение Вашей семьи за последний год?”.

Рис. 3.7. Диаграмма распределения частот респондентов Курской области с различным уровнем образования по категориям признака “Как изменилось экономическое и финансовое положение Вашей семьи за последний год?” (социологический опрос 1993 г.)

Нашей задачей не является детальный анализ полученных диаграмм и графиков; заметим лишь, что графическое представление на рис. 3.7 далеко не исчерпывает возможностей визуализации данных, представленных в таблицах сопряженности. Так, от частот целесообразно перейти к частостям (процентам по строкам либо по столбцам). Хотя такой опции применительно к графикам процедурой Crosstabs программы SPSS Base не предусмотрено, однако всегда имеется возможность “вторичного” ввода сгруппированных данных таблиц сопряженности в редактор данных с последующим их графическим анализом и аналитической обработкой с помощью других процедур.

Помимо упомянутых, существует еще большое количество разнообразных мер связи двух признаков, применение которых является довольно специфичным, и в данной монографии они не рассматриваются.

83

Соседние файлы в папке моно_2012_Шуметов_Крюкова