- •Часть 1 методы сбора информации
- •1. Организационные аспекты эмпирических политических исследований
- •2. Выборка
- •3. Измерение
- •4. Опросы
- •5. Наблюдение
- •6. Работа с документами
- •7. Эксперимент
- •8. Качественные методы
- •Часть 2 методы анализа информации
- •9. Подготовка данных к обработке
- •10. Элементарные приемы обработки информации
- •10.2. Средние показатели вариационного ряда. Меры вариации и рассеяния
- •11. Анализ временных рядов. Статистическое прогнозирование
- •12. Прикладные методики анализа документов
- •13. Статистический анализ
- •14. Качественный анализ
- •Часть 1. Методы сбора информации
- •Часть 2. Методы анализа информации
10.2. Средние показатели вариационного ряда. Меры вариации и рассеяния
Средняя арифметическая дает представление об усредненном случае. Данный показатель позволяет сравнить между собой не только группы одного ряда распределения, но и сами ряды распределения, если они строятся по идентичным признакам:
где
- значения
вариаций признака;
– сумма; N
–
число респондентов. При обработке
данных массовых опросов чаще используется
взвешенная
арифметическая:
[c.103]
где
–
числовое значение i-й
позиции признака,
-
число респондентов, выделенных по
i-й
позиции признака, N
- общее число респондентов.
Для номинального уровня измерения (например, поддержки того или иного политического объединения), где цифры не связаны с порядком расположения категорий (а потому использование средней арифметической лишено смысла), для измерения средней тенденции используют моду. Мода – наиболее часто встречающееся значение признака в серии зарегистрированных наблюдений. Возможно унимодальное, бимодальное или многомодальное распределение признака. Определение моды в номинальных и порядковых рядах распределения не вызывает сложностей. В интервальном ряду говорят не о нахождении моды, а об определении модального интервала. Для этого переходят от деления на интервалы, основанного на содержательном критерии, к делению на интервалы по формальным критериям. Значение моды для интервального ряда (с равными интервалами) определяется по формуле
где
-
нижняя граница модального интервала;
– величина интервала;
– частота модального класса;
–
частота интервала, предшествовавшего
модальному;
–
частота интервала, следующего
за модальным.
Недостатки моды: а) невозможность использовать ее в дальнейших вычислениях; б) вероятность существования нескольких модальных величин в вариационном ряду; в) зависимость ее величины от интервала группировки.
Для измерения среднего значения порядковых и интервальных данных чаще всего используют медиану. Для номинальных этот показатель шкал не используется. Медиана – значение среднего признака в упорядоченном (ранжированном по возрастанию или убыванию признака) ряду, причем до и после него находится равное число наблюдений.
При нечетном количестве наблюдений медиана приходится ровно на середину упорядоченного ряда (например, при 1001 наблюдении медианой будет величина 501-го наблюдения). При наличии четного количества признаков (наблюдений) в ряду рассчитывают среднее арифметическое для двух наблюдений, расположенных в центре ряда. [c.104]
При числе наблюдений, равном 1000, медиана рассчитывается как средняя арифметическая 500-го и 501-го наблюдения:
где
–
нижняя граница медианного интервала;
– величина интервала;
–
частота (относительная) медианного
интервала; n
–
сумма
частот (относительных частот) интервалов;
nh
–
частота (относительная),
накопленная до медианного интервала.
Если для исследования используется динамический ряд (изменение признака во времени), то в качестве среднего значения может быть использовано среднее геометрическое (корень n-й степени из произведения всех значений признака X):
Например, в регионе N в течение четырех месяцев число забастовок составило соответственно 34, 56, 21, 39. Среднее геометрическое для этого ряда будет равно
Помимо названных средних значений ряда можно рассчитывать среднее квадратическое и среднее гармоническое.
Для вычисления неравномерности распределения признака используют вариационный размах, среднее абсолютное отклонение, дисперсию, коэффициент вариации. С их помощью можно определить степень отклонения от средних значений ряда. Это позволяет ответить на вопрос, является ли наиболее типичное значение признака репрезентативным для всей совокупности. Например, нам известно, что рейтинг доверия к местной исполнительной власти в городе N в течение 1998 г. составил 23, 19, 24, 31, 30, 25, 22, 28, 35, 38, 42, 45%. Разность между наибольшим и наименьшим значением ряда – вариационный размах – определяется по формуле
Для нашего ряда он будет равен 26% (45% - 19%).
Среднее абсолютное отклонение – среднее арифметическое абсолютных величин отклонений отдельных значений признака от их средней арифметической: [c.105]
где
–
число значений в ряду;
–
сумма отклонений значения
ряда от средней арифметической по
подсовокупностям (значения
суммируются без учета знака отклонения,
по модулю).
Для
нашего примера
,
а
Формула дисперсии для порядковых и интервальных рядов:
Если число наблюдений больше 30, то в знаменателе из единица не вычитается.
Среднеквадратическое
отклонение
(сигма) вычисляется как корень
квадратный из дисперсии. С его помощью
можно сравнивать меры
рассеяния разных признаков или одного
признака для разных подсовокупностей.
Для нашего примера среднеквадратическое
отклонение равно
8,3.
Для оценки дисперсии (разброса) номинальных данных используют коэффициент вариации. Он показывает процентную долю всех признаков, которые не входят в модальную категорию.
Формула коэффициента вариации для номинального ряда:
где
– количество всех наблюдений, не
являющихся модальными;
N–
общее
число наблюдений.
,
При
,
модальное значение
ряда является типичным.
Например, был задан вопрос о существовании партии, программу которой поддерживает респондент. Из 1000 опрошенных 350 человек дали утвердительный ответ, 400 – отрицательный, 250 человек не смогли определиться. Тогда коэффициент вариации будет равен отношению суммы респондентов, ответивших позитивно и затруднившихся с ответом, к общему числу опрошенных (350 + 250)/1000 = 0,6.
Дисперсия для ряда с альтернативными признаками определяется по формуле
[c.106]
Для выборки в 1000 человек, из которых 650 собираются принять участие в голосовании, а 350 – нет, дисперсия будет равна (650 х 350)/10002 = 22,75.
Закон распределения. Нормальное распределение признака в вариационном ряду можно определить, если: 1) в ряду есть единственная мода, находящаяся в самом центре распределения; 2) частоты симметрично убывают по направлениям к предельным значениям ряда; 3) распределение признака подчиняется «правилу трех сигм», т. е. 68,3% всех случаев распределяются в пределах одного стандартного отклонения от центра ряда, 95,5% случаев – в пределах двух стандартных отклонений, 99,7% – в пределах трех отклонений (рис.8).
Рис. 8. Иллюстрация к «правилу трех сигм».
10.3. Индексы
Индекс – обобщенный производный показатель, сформированный на основе исходных данных с помощью простейших математических операций.
К индексам прибегают для интеграции индикаторов в единый условный показатель для корректного анализа информации. Индексы выполняют функцию иллюстрации тенденции, без объективной числовой характеристики и используются сугубо в целях сопоставительного анализа.
За пределами межгруппового сравнения индексы не имеют ни семантической, ни эмпирической значимости. В политических исследованиях индексы часто используют при анализе текстовой информации (в контент-анализе текстов).
В общем виде индекс имеет следующий вид:
где х – эмпирические индикаторы, число которых равно п. [c.107]
Чаще всего в политических исследованиях используют индекс «удовлетворенности», который показывает относительную величину группы людей, дающих позитивный ответ, относительно общего числа респондентов. Для шкалы с тремя градациями («да», «нет», «затрудняюсь ответить») индекс удовлетворенности будет иметь вид
При
этом
–
количество позитивных ответов,
–
количество затруднившихся
с ответом,
–
количество отрицательных ответов.
Значение данного индекса может колебаться от -1 до +1. Знак индекса («+» или «-») свидетельствует о доминанте того или иного типа ответов.
Несколько модернизировав данный индекс, можно использовать его для порядковых шкал, например, для сравнения электоральной активности различных социальных групп. В этом случае индекс приобретет следующий вид:
При
этом
–
количество людей, абсолютно точно
намеренных участвовать
в голосовании,
–
число скорее уверенных в своем участии
в голосовании,
–
количество затруднившихся с ответом,
–
число склонных дать скорее отрицательный
ответ,
–
количество дающих абсолютно уверенно
отрицательный ответ.
Несколько модернизировав этот индекс, можно использовать его для анализа любых показателей.
