 
        
        СПСС 6
.docЗадание №-6. Статистическая проверка гипотез на основе построения таблиц сопряженности
На основе предварительно полученных таблиц одномерных распределений по переменным соответствующим теме исследования, их перекодировке (задание №3) и (построения типологических категорий респондентов (задание №5) можно выдвинуть массу гипотез следствий, которые имеют четкие указания на способы их проверки. Основной и преобладающий в социологических исследованиях способ проверки гипотез –построение таблиц сопряженности.
Основное требование: каждая выдвигаемая гипотеза должна сопровождаться указаниями на символические имена сопрягаемых переменных.
Пример гипотезы
Степень уверенности в возможной связи будущей жизни с профессией дипломата у студентов факультета МО может зависеть от различных факторов. К ним можно отнести как объективные (пол, курс обучения, форма обучения, материальное положение, среда социализации и т.п.), так и субъективные (притязания и ориентации, связанные с выбором занятий после окончания вуза, мировоззренческие принципы, нравственные ценности, гражданские позиции и т.п.). На основании данных предположений можно выдвинуть достаточно большое число различных гипотез, проверить которые можно на основе использования двумерных и трехмерных распределений (таблиц сопряженности).
Выдвинем и проверим подобные гипотезы – следствия на материалах массива данных «МО- 2002».
Например, можно утверждать, что d3. Возможность взаимопонимания и сотрудничества между людьми богатыми и людьми бедными у студентов зависит, прежде всего, от того, на каких условиях студентах учатся (f9 «на договорной основе» «на бюджетной основе»). Следствием из этой гипотезы может быть утверждение: студенты, которые учатся на бюджетной основе будут более снисходительны в общении с людьми «бедными», а студенты, учащиеся на договорной основе, будут легче сотрудничать с людьми богатыми. Конечно, не беря в счет исключения из этого «правила». Закономерность данной гипотезы заключается в том, что в основном, студенты, обучающиеся на бюджетной основе, из более бедных семей, нежели те, что учатся на договорной основе, так как стоимость обучения в год не такая уж и маленькая, и не каждая семья может себе это позволить. В связи с этим, те дети, что из более обеспеченных семей, легче находят общий язык с сверстниками их же положения, потому что такой фактор их объединяет, и в общении(они могут общаться на общие темы, и не смущать друг друга вопросом о деньгах) и в досуге (могут ходить в одинаковые по стоимости пребывания там заведения). Вывод: студенты, обучающиеся на договорной основе будут говорить, что общение между богатыми «невозможно», а на бюджетной будут говорить тоже, что невозможно.
Итак, символическое выражение данной связи можно зафиксировать с помощью имен переменных:
F9 by D3, где F9 (условия обучения) может рассматриваться как независимая переменная, а D3 (возможность взаимопонимания…) как зависимая.
Прежде, чем приступать к построению таблицы сопряженности, выполним процедуру получения частотных распределений по указанным переменным.
Используем процедуру: «Анализ», Описательные статистки, «Частоты» (табл.1-2)1.
Таблица 1
| f9. Вы учитесь | |||||
| 
 | Частота | Процент | Валидный процент | Накопленный процент | |
| Валидные | на бюджетной основе | 536 | 69,1 | 70,7 | 70,7 | 
| на договорной основе | 222 | 28,6 | 29,3 | 100,0 | |
| Итого | 758 | 97,7 | 100,0 | 
 | |
| Пропущенные | Системные пропущенные | 18 | 2,3 | 
 | 
 | 
| Итого | 776 | 100,0 | 
 | 
 | |
Убеждаемся в том, данные по полу носят представительный, статистически полный характер. Нет ни затруднившихся ответить, ни отказов от ответа. В противном случае необходимо было бы объявить их пропущенными значениями.
Вторая таблица по вопросу об уверенности должна быть сопровождена статистиками с мерами центральной тенденции: среднее, медианное, модальное значения), т.к. в данном случае используется полностью упорядоченная шкала. А также используем гистограмму с кривой нормального распределения, чтобы убедиться, что распределения по данному вопросу поддаются закону нормального распределения.
Таблица 2
| d3. Возможно ли взаимопонимание и сотрудничество между людьми богатыми и людьми бедными | |||||
| 
 | Частота | Процент | Валидный процент | Накопленный процент | |
| Валидные | уверены, что не возможно | 22 | 2,8 | 2,9 | 2,9 | 
| пожалуй, невозможно | 53 | 6,8 | 6,9 | 9,7 | |
| в чем-то возможно, в чем-то нет | 312 | 40,2 | 40,5 | 50,3 | |
| пожалуй, возможно | 180 | 23,2 | 23,4 | 73,6 | |
| уверены, что возможно | 203 | 26,2 | 26,4 | 100,0 | |
| Итого | 770 | 99,2 | 100,0 | 
 | |
| Пропущенные | 6 | 4 | ,5 | 
 | 
 | 
| Системные пропущенные | 2 | ,3 | 
 | 
 | |
| Итого | 6 | ,8 | 
 | 
 | |
| Итого | 776 | 100,0 | 
 | 
 | |
| Статистики | |||
| 
 | d3. Возможно ли взаимопонимание и сотрудничество между людьми богатыми и людьми бедными | f9. Вы учитесь | |
| N | Валидные | 770 | 758 | 
| Пропущенные | 6 | 18 | |
| Среднее | 3,64 | 1,29 | |
| Медиана | 3,00 | 1,00 | |
| Мода | 3 | 1 | |
| Стд. отклонение | 1,034 | ,455 | |
| Минимум | 1 | 1 | |
| Максимум | 5 | 2 | |

На основании полученных таблиц и гистограммы мы убеждаемся, что ответы распределяются в полном согласии с законом нормального распределения. Меры центральной тенденции: среднее, медиана, мода фактически совпадают.
В дальнейшем анализе можно использовать вместо пятичленной шкалы трехчленную, чтобы получаемые таблицы носили более компактный иллюстративный характер.
Проводим преобразования переменной D3 . После преобразований и обозначения новых значений переменной D3 в окне «Переменные» получаем (табл.3).
Таблица 3
| возможность взаимопонимания | |||||
| 
 | Частота | Процент | Валидный процент | Накопленный процент | |
| Валидные | невозможно | 75 | 9,7 | 9,7 | 9,7 | 
| в чем-то возможно, в чем-то нет | 312 | 40,2 | 40,5 | 50,3 | |
| возможно | 383 | 49,4 | 49,7 | 100,0 | |
| Итого | 770 | 99,2 | 100,0 | 
 | |
| Пропущенные | Системные пропущенные | 6 | ,8 | 
 | 
 | 
| Итого | 776 | 100,0 | 
 | 
 | |
Итак, для проверки гипотезы о взаимосвязи пола и уверенности респондентов в будущей занятости построим таблицу сопряженности. В качестве независимой переменной используется «условия обучения», зависимой - «возможность взаимопонимания». После выполнения процедуры «Анализ»→, «Дескриптивные статистики»,→ «Таблицы сопряженности» входим в диалоговое окно «Таблицы сопряженности». Помещаем независимую переменную в окно «строки», зависимую –«столбцы». Это делается для того, чтобы читать таблицу слева – направо.
Щелкнув по закладке «ячейки», зададим проценты по строкам. Затем – продолжить и ОК. Получаем таблицу размером 2 на 3.
Если необходимо, чтобы полученная таблица выглядела более компактной, активируем ее двойным щелчком левой кнопки мыши. Снижаем размерность с помощью пункта меню «Формат»- «Установить ширину ячеек» -40, повернуть внутренние метки столбцов, а также с помощью стрелок курсора.
В результате получаем следующую таблицу сопряженности (табл. 4).
Таблица 4
| Таблица сопряженности f9. Вы учитесь * возможность взаимопонимания | ||||||
| 
 | возможность взаимопонимания | Итого | ||||
| невозможно | в чем-то возможно, в чем-то нет | возможно | ||||
| f9. Вы учитесь | на бюджетной основе | Частота | 53 | 231 | 247 | 531 | 
| % в f9. Вы учитесь | 10,0% | 43,5% | 46,5% | 100,0% | ||
| на договорной основе | Частота | 22 | 75 | 124 | 221 | |
| % в f9. Вы учитесь | 10,0% | 33,9% | 56,1% | 100,0% | ||
| Итого | Частота | 75 | 306 | 371 | 752 | |
| % в f9. Вы учитесь | 10,0% | 40,7% | 49,3% | 100,0% | ||
1. Метод проверки гипотез на основе определения существенности (несущественности) в процентных различиях
Используем первый метод проверки наличия связи на основе сравнения относительных частот (%). Из таблицы видно, что среди студентов на бюдж основе большинство (46.5 %) говорят, что такое взаимопонимание возможно, и на договорной основе большинство говорит тоже самое (56,1%).
Таблица 5
Из полученной таблицы сопряженности видно, что по всем сравниваемым группам, различия не превышают 15 %, что недостаточно, чтобы в данном случае утверждать о наличии статистической связи.
Гипотеза не подтвердилась.
- 
Метод проверки гипотез на основе критерия Хи – квадрат 
Выявление статистически значимых связей на основе сравнения относительных частот можно использовать, когда таблицы имеют небольшую размерность и, когда их мало. Однако в целом это весьма трудоемкий и вместе с тем поверхностный путь выявления статистически значимых связей. Поэтому в социологическом анализе используется специально разработанные коэффициенты. К числу таковых, прежде всего, относится Хи – квадрат. Он основан на использовании сравнения наблюдаемых и ожидаемых частот. Проверим данную гипотезу с помощью критерия Хи- квадрат.
Для этого в диалоговом окне «таблицы сопряженности» закажем наблюдаемые и ожидаемые частоты, а относительные частоты «снимем».
Получаем таблицу (табл.6).
Таблица 6
| Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | ||||||
| 
 | в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | Итого | ||||
| Раздражает | Терпимо | Помогает | ||||
| f9. Вы учитесь | на бюджетной основе | Частота | 224 | 210 | 39 | 473 | 
| Ожидаемая частота | 205,1 | 219,8 | 48,1 | 473,0 | ||
| на договорной основе | Частота | 70 | 105 | 30 | 205 | |
| Ожидаемая частота | 88,9 | 95,2 | 20,9 | 205,0 | ||
| Итого | Частота | 294 | 315 | 69 | 678 | |
| Ожидаемая частота | 294,0 | 315,0 | 69,0 | 678,0 | ||
Ожидаемые частоты соответствуют идее нулевой гипотезы о несвязанности сопрягаемых признаков. Нулевая гипотеза в данном случае – это утверждение о равенстве наблюдаемых и ожидаемых частот. Ho: N набл. =N ожид. Если наблюдаемая частота – та, которая была зафиксирована в результате эмпирического наблюдения, то ожидаемая – та, которая имела бы место в случае несвязанности переменных. Ожидаемые частоты вычисляются по каждой клетке таблицы на основе деления произведений суммы итогов по столбцам и строкам на общее количество опрошенных.
N ожид = N итог по строке × N итог по столбцу / N наблюдений всего.
Так, ожидаемая частота в первой ячейке (205,1) получилась в результате: 294 · 473 / 678=.
Далее закажем нестандартизированные остатки, представляющие собой простую арифметическую разность между наблюдаемыми и ожидаемыми частотами (табл.7) .
Таблица 7
| Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | ||||||
| 
 | в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | Итого | ||||
| Раздражает | Терпимо | Помогает | ||||
| f9. Вы учитесь | на бюджетной основе | Частота | 224 | 210 | 39 | 473 | 
| Ожидаемая частота | 205,1 | 219,8 | 48,1 | 473,0 | ||
| Остаток | 18,9 | -9,8 | -9,1 | 
 | ||
| на договорной основе | Частота | 70 | 105 | 30 | 205 | |
| Ожидаемая частота | 88,9 | 95,2 | 20,9 | 205,0 | ||
| Остаток | -18,9 | 9,8 | 9,1 | 
 | ||
| Итого | Частота | 294 | 315 | 69 | 678 | |
| Ожидаемая частота | 294,0 | 315,0 | 69,0 | 678,0 | ||
Исходя из грубого правила, что чем больше разница между наблюдаемыми и ожидаемыми частотами, можно также предполагать наличие связи между сопрягаемыми переменными. Нестандартизированые остатки можно преобразовать в стандартизированные (табл.8).
Таблица 8
| Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | ||||||
| 
 | в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? | Итого | ||||
| Раздражает | Терпимо | Помогает | ||||
| f9. Вы учитесь | на бюджетной основе | Частота | 224 | 210 | 39 | 473 | 
| Ожидаемая частота | 205,1 | 219,8 | 48,1 | 473,0 | ||
| Остаток | 18,9 | -9,8 | -9,1 | 
 | ||
| Стандартиз. остаток | 1,3 | -,7 | -1,3 | 
 | ||
| на договорной основе | Частота | 70 | 105 | 30 | 205 | |
| Ожидаемая частота | 88,9 | 95,2 | 20,9 | 205,0 | ||
| Остаток | -18,9 | 9,8 | 9,1 | 
 | ||
| Стандартиз. остаток | -2,0 | 1,0 | 2,0 | 
 | ||
| Итого | Частота | 294 | 315 | 69 | 678 | |
| Ожидаемая частота | 294,0 | 315,0 | 69,0 | 678,0 | ||
