Осипов Г.В. Социология. Основы общей теории / Социология. Основы общей теории
.pdfГлава 21. Анализ и интерпретация эмпирических данных |
823 |
внимание в этом параграфе уделено изучению взаимозависи мостей нескольких признаков, а основные принципы регрес сионного анализа рассмотрены очень кратко.
В основе регрессионного анализа статистической зависимо сти ряда признаков лежит представление о форме, направле нии и тесноте (плотности) взаимосвязи.
Уравнение регрессии. Рассмотрим условный пример исполь зования уравнения регрессии. На основе выборочного обследо вания были получены данные о том, как связаны стаж работы в организации и заработная плата работника. Эти данные нане сены на график рис. 21.5.
100 - " °
3 |
9 |
15 |
21 |
27 |
33 |
X |
Рис. 21.5. Диаграмма рассеяния для распределения заработной платы и общего стажа работы
По оси X отложен стаж работы, а по оси Y — заработная плата. Каждая точка на рисунке характеризует стаж работы и заработную плату респондента. Видно, что облако точек распо ложено некоторым закономерным образом, и можно предпо ложить следующую зависимость: с увеличением стажа работы растет и заработная плата. Аналитически эта тенденция может быть описана с помощью уравнения регрессии.
Рассмотрим две величины х и у. Зафиксируем какое-либо значение переменной х, тогда у, как видно из рисунка, при нимает целый ряд значений. Обозначим у среднюю величину этих значений у при данном фиксированном х. Уравнение, описывающее зависимость средней величины ух от х, называ ется уравнением регрессии у от х.
Глава 21. Анализ и интерпретация эмпирических данных |
827 |
Сравнение статистических показателей г и г\2. Приведем сравнительную характеристику коэффициента корреляции (бу дем сравнивать г2) и корреляционного отношения г|2:
а) г2 = 0, если х и у независимы (обратное утверждение неверно);
б) г2 = г)2, = 1 тогда и только тогда, когда имеется строгая линейная функциональная зависимость у от х;
в) г2 = ц2/х < 1 тогда и только тогда, когда регрессия х и у строго линейна, но нет функциональной зависимости;
г) г2 < г\:'• < 1 указывает на то, что нет функциональной за висимости и существует нелинейная кривая регрессии.
Коэффициенты взаимозависимости для порядкового уровня измерения. К этой группе относятся коэффициенты ранговой корреляции Спирмена гч, Кендалла т и у. Эти коэффициенты ранговой корреляции используются для измерения взаимоза висимости между качественными признаками, значения ко торых могут быть упорядочены или проранжированы по сте пени убывания (или нарастания) данного качества у исследу емых социальных объектов. Таким образом, коэффициенты корреляции Спирмена и Кендалла используются как меры взаимосвязи рядов рангов, а не как меры связи между сами ми переменными.
Коэффициенты Спирмена и Кендалла обладают примерно одинаковыми свойствами, но т в случае многих рангов, а так же при введении дополнительных объектов в ходе исследова ния имеет определенные вычислительные преимущества.
Другая мера связи между двумя упорядоченными перемен ными — у. Она, так же как и предыдущие коэффициенты, из меняется от +1 до - 1 и может быть подсчитана при любом числе связанных рангов.
Множественный коэффициент корреляции W, иногда называ емый коэффициентом конкордации, используется для измере ния степени согласованности двух или нескольких рядов проранжированных значений переменных.
Коэффициенты взаимозависимости для номинального уровня измерения. Связь в табл. 2 x 2 . Простейшая задача о взаимоза висимости возникает тогда, когда имеются два признака, каж дый из которых принимает два значения.
828 |
Раздел шестой. Социологическое исследование |
Представим данные о группировке по двум признакам так:
|
В |
не В |
сумма |
А |
а |
b |
a + b |
не А |
с |
d |
c + d |
сумма |
а + с |
b+ d |
n (либо 100%) |
Для характеристики степени связи двух признаков приме няется коэффициент Ф, определяемый формулой:
ab-bc
ф =
yl(a + b)(a + c)(b + d)(c + d)
Коэффициент Ф равен 0, если нет соответствия между двумя дихотомическими переменными, и равен 1 или —1, когда имеется полное соответствие между ними. В силу труд ностей с интерпретацией знака коэффициента для категоризованных (номинальных) переменных часто используют в анализе лишь абсолютную величину — \ф\. Ф легко интер претируется, поскольку показано, что он представляет со бой просто коэффициент корреляции г, если значения каж дой дихотомической переменной обозначить 0 и 1.
Ф вычисляется для категоризованных данных, представ ляющих естественные дихотомии: пол, раса и т. п. Приведе ние количественных переменных к дихотомическому виду связано с выбором граничной точки разделения (например, мужчины до 30 лет и мужчины старше 30 лет). Искусствен ная дихотомизация, столь часто необходимая в конкретном исследовании при изучении взаимосвязи признаков, может привести к тому, что одна часть дихотомической перемен ной по своему воздействию будет более значима для одной связи, другая — для другой, а это дает ошибочный резуль тат.
Измерение связи в табл. с х к. Рассмотрим теперь более об щую ситуацию, когда две переменные классифицированы на две или более категории (см. табл. 21.7). Запишем это таким об разом:
Глава 21. Анализ и интерпретация эмпирических данных |
831 |
Если зависимая переменная — это категории столбцов таб лицы, то совершенно аналогично предыдущему вычисляется:
У.maxn,j -maxя,.
Х = ^ ^ |
, |
сп - max n,.
i
где max я; — наибольшая частота в строке «j»; max nr — наи большая маргинальная частота для столбцов «i». '
Коэффициены Хг и кс имеют пределы изменения от 0 до 1. Чем ближе Хг или Хс к 1, тем больше относительное уменьше ние в ошибке и больше соответствие (связь) между переменны ми. Эти коэффициенты могут быть использованы для таблиц любого размера.
Вряде случаев удобно использовать симметричную X:
х=А±4.
2 ' Разнообразие корреляционных коэффициентов, применяе
мых при анализе социологических данных, продиктовано стремлением отразить реально существующее разнообразие ти пов связей в обществе. Поэтому данное обстоятельство следует рассматривать скорее как свидетельство достоинств статисти ческого аппарата, заключающихся в гибкости и большой при способленности его к анализу сложнейших взаимосвязей. Каж дый корреляционный коэффициент приспособлен для измере ния вполне определенного вида связи.
Обычно предпочитают использовать наиболее распростра ненные в практике социологических исследований коэффици енты, так как тем самым достигается возможность сравнения полученных результатов с материалами других исследований.
Приложение
Социология в России: современные технологические инновации в эмпирических исследованиях
За последнее десятилетие произошел существенный скачок в техническом обеспечении работы социолога. Особенно это ощутимо в нашей стране. В таких странах, как США, и в про шлом работа социолога с вычислительными средствами была
832 Раздел шестой. Социологическое исследование
не столь непосильным трудом, как у нас. Большие и «недруже ственные» машины прежних поколений были камнем преткно вения для большинства социологов. Быстрое продвижение в нашу жизнь персональных компьютеров и основанных на их использовании технологий коренным образом изменило воз можности и стиль работы исследователя. В чем главные досто инства этих машин?
Первое и главное достоинство их в том, что они — дей ствительно «персональный» инструмент в руках человека напо добие ручки, калькулятора. Они позволяют, не обращаясь к программистам и другим специалистам, самостоятельно и эф фективно выполнять сложные работы. Этому помогает «друже ственность» современных машин и программ для них. Простые очевидные принципы «общения», часто опирающиеся на ин туицию, помогают работать с машиной без сколько-нибудь глубоких знаний их устройства, языков программирования; на чальное время обучения совсем не велико.
Вместе с тем вычислительные мощности современных пер сональных компьютеров могут удовлетворить большую часть потенциальных исследовательских потребностей социологов.
Программное обеспечение — вторая неотъемлемая часть этих инноваций. Развитое программное обеспечение также по зволяет решить большую часть стандартных задач.
И наконец, относительно невысокая стоимость делает все эти технологические новшества доступными для небольших исследовательских групп, изменяя организационные принци пы самой исследовательской работы.
Рассмотрим несколько подробнее этапы исследовательского цикла.
Подготовка инструментария. Социологическая анкета по своему дизайну представляет собой довольно сложный доку мент, к качеству выполнения которого предъявляются весьма серьезные требования. Для ввода и форматирования в нужном виде различных документов используются так называемые тек стовые редакторы. Наиболее широкое распространение у нас в стране, как и во всем мире, получили такие текстовые редак торы, как MS Word, Word Perfect и другие, а также отече ственная разработка Lexicon.
Сбор данных. Сбор данных становится все более технически нагруженным этапом социологического исследования. В главе