Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теоретический материал_2 раздел (1).doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
1.83 Mб
Скачать

2.2.3. Статистические методы анализа социологической информации

Количественная обработка основана на методах статистического анализа и представляет собой манипуляцию с измеренными ха­рактеристиками изучаемого объекта. Это, в основном, внешнее изучение объекта. Здесь доминирует аналитическая составляющая познания, что отражено в используемых исследователями количественных методах обработки эмпирического ма­териала.

В результате количественной обра­ботки упорядочиваются показатели изучаемых объектов. Реализуется количественная обработка с помощью математико-статистических методов. Количественная обработка состоит из двух этапов.

Н первом этапе (первичная обработка) информация упорядочивается. Данные группируются по выделенным критериям и заносятся в таблицы, по необходимости иллюстрируются графически. В такой форме данные описывают всю совокупность в целом: ее однородность, компактность. Эта информация связана с понятиями «распределение данных».

Методы первичной обработки включают представление количественной информации в табличной форме (табулирова­ние), и построение диаграмм, гистограмм, полигонов рас­пределения и кривых распределения.

Посредством диаграмм отра­жаются распределения дискретных данных, другие графики используют для представления непрерывных данных.

На втором этапе (вторичная обработка) осуществляется статис­тический анализ результатов первичной обработки. Она разбивается на описательную и корреляционную статистику — выявление связи между явлениями. Этот этап обработки данных дает возможность представить их в сжа­том виде. В результате исследователь имеет возможность оценить:

– наиболее характерное для выборки значение;

– величину разброса («размы­тость») данных относительно этого значения;

– характер и силу связей между отдельными дан­ными.

Для решения первого вопроса в социологии обычно используются вычисления среднего арифметического, медианы и моды.

Эти величины являются обобщающими показателями, позво­ляют судить обо всей выборке и дают возможность сравнивать разные выборки между собой.

Среднее арифметическое применяется при стремлении к наибольшей точности, и для дальнейшего вычисления стандартного отклонения.

Медиана — используется, когда в исследуемой совокупности присутствуют «нетипичные» данные, резко влияющие на среднее.

Мода высчитывается в случае, когда не нужна точность, но важно быстро опреде­лить меру центральной тенденции.

Для решения второго – используются меры разброса: размах, сред­нее отклонение, дисперсия, стандартное отклонение.

Данные статистические показатели (статистики) характери­зующие из­меняющийся признак, «пе­ременной». Они позволяют судить об однородности, компактности и надежности полученных данных.

Для решения третьего в социологии применяются корреляционный, дисперсионный, регрессионный, факторный, кластерный анализ.

Эти связи, или корреляции определяют посредством коэффициентов линейной корреляции (R). Широкое использование методов корреляционного ана­лиза в социологических исследованиях связано с условным допущением, что большинство социальных явлений описываются линейными зависимостями. Однако наличие корреляции не означает, что между переменными су­ществует причинная связь. Даже если связь при­чинна, коэффициент корреляции не может указать, какая переменная есть причина, а какая – следствие.

Использование различных компьютерных программ (например, статистический пакет для работы в области общественных наук – SPSS) позволяет проводить необходимый статистический анализ практически любых выборок.

Корреляционный анализ.

Корреляционный анализ позволяет установить тесноту, направленность и фор­му связи между переменными. Переменные в корреляционном анализе равнозначны, а соотношения между ними задаются исследователем.

Виды корреляции:

1. По тесноте связи выделяют полную корреляцию (обязательная вза­имозависимость между переменными, коэффициент корреляции R = 1); связь не установлена ( R = 0); частичная( 0<R<1 , меньше 0,2 —очень слабая связь, (0.2-0,4) — корреляция невысокая, (0,4-0,6) — явно выраженная кор­реляция, (0,6-0,8) — высокая корреляция, больше 0,8 — очень высокая).

2. По направленности выделяют прямую (коэффициент R со знаком «плюс»; при увеличении значения одной переменной увеличивается другая) и обратную (коэффициент R со знаком «минус»; увеличение значения одной переменной влечет уменьшение другой).

3. По форме выделяют прямолинейную (равномерное изменение одной переменной со­ответствуют равномерному изменению другой) и криволинейную (равномерное изменение одного признака сочетается с неравномерным изменением другого).

При выявлении сопряжения порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену. При сравнении метрических данных используется коэффициент корреляции по К. Пирсону.

Дисперсионный анализ.

Использование метода позволяет вы­являть как взаимосвязь между изучаемыми признаками, так и влияние различных факторов на исследуемый признак, выделяя наиболее существен­ные из них.

В зависимости от числа переменных различают одно-, двух-, многофакторный анализ. В зависимости от характера переменных – анализ с постоянными, случайными или смешанными факторами.

Факторный анализ.

При использовании данного метода, исследователь уменьшает количество признаков за счет объединения их в совокупности, выступаю­щие как целостные единицы, характеризующие изучаемый объект. Эти единицы называют факторами, (необходимо отличать их от факторов дисперсионного анализа, т.е. отдельных переменных). Именно совокупность признаков может харак­теризовать социальное явление или закономерность, тогда как по отдельности эти признаки не дают информации.

В большинстве случаев факторы латентны, т.е. скрыты от непосредственного наблюдения. Факторный анализ продуктивен в предварительных исследованиях, когда необходимо выделить скрытые закономерности в исследуемой обла­сти.

В основе процедуры анализа лежит матрица корреляций – таблица ко­эффициентов корреляции каждого признака со всеми остальными.

В зависимости от числа факторов различают однофакторный (по Спирмену), би­факторный (по Холзингеру) и многофакторный (по Терстоуну) ана­лизы.

По характеру связи между факторами метод делится на анализ с независимыми и с зависимыми факторами.

Использование метода фактор­ного анализа предполагает весьма сложный математический и логический аппараты, что создает трудности для его широкого применения в социологических исследованиях. Тем не менее, популярность его в социологическом анализе постоянно растет.

Регрессионный анализ.

Данный анализ исследует зависимость среднего значения одного показателя от вариаций других значений других. Рассматриваемые величины здесь носят случайный характер.

Регрессионный анализ – это замена одних объектов другими, близкими к исходным, но более простыми осуществляется с помощью математического метода наименьших квадратов.

Таксономический анализ.

В результате таксономии в той или иной метрике определяется расстояние между изучаемыми объектами и дается упорядоченное описание их взаи­моотношений на количественном уровне.

Данный метод обычно применяется в сочетании с другими приемами количественного анализа данных.

Процедура метода по преимуществу математическая и результаты представляются численно. Вместе с тем, кластерный анализ со­вмещает количественную обработку данных с их качественным анализом.

Пример выполнения кейс-задания: Ситуация 3.

Задание:

1.Определить дисперсию Ϭ для среднего значения изучаемого признака,

2. построить гистограмму распределения изучаемого признака (в %),

3. рассчитать коэффициент корреляции между рядами данных.

Алгоритм выполнения задания № 1

    1. Оценить среднее арифметическое значение «x» формуле

Средняя арифметическая простая  рассчитывается для не сгруппированных данным по формуле:   или    , где x j  – отдельные значения признака, j – порядковый номер единицы наблюдения, которая характеризуется значением  x j , N – число единиц наблюдения (объем совокупности).

_

    1. Рассчитать отклонения по формуле (x j – x)

    2. Рассчитать дисперсию по формуле

_

где x j – значение признака в j – ом наблюдении, x – среднее значение признака, n –число наблюдений.

Оценить дисперсию личного потребления картофеля по данным с 1990 по 1998 гг. Заполнить таблицу, подобрав из алгоритма соответствующие действия и произведя необходимые расчеты.

Годы

Значения показателя

Отклонения от среднего

Квадрат отклонения

Дисперсия

1990

15,7

-2,14

4,6

1991

16,7

-1,14

1,31

1992

17,5

-0,34

09,12

1993

18.8

0,96

0,91

1994

18,0

0,16

0,02

1995

18,3

0,46

0,21

1996

18,5

0.66

0,43

1997

19,1

1,26

1,58

1998

18,0

0,16

0,02

Среднее значение

17,84

1,02

Алгоритм выполнения задания № 2

В исследования уровня доверия населения полиции в регионах Российской Федерации были получены результаты, приведенные в таблице ниже.

Уровень доверия *

Частота наблюдений

(доля регионов РФ в %)

высокий (более 65%)

8,0

выше среднего(55%-65%)

27,0

средний (45%-55%)

29,0

ниже среднего (35%-45%)

20,0

низкий (25%-35%)

13,0

очень низкий (до 25%)

3,0

Для проведения статистического анализа данных методом построения гистограммы необходимо:

2.1 обозначить и упорядочить значения группировочного признака (уровень доверия полиции),

2.2. определить частоту наблюдений (доли регионов) по каждому значению признака,

2.3. воспользовавшись специальной компьютерной программой (Excel, Word) построить гистограмму распределения значений изучаемого признака.