Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Попова. Методика и техника эмперических политич...doc
Скачиваний:
5
Добавлен:
01.03.2025
Размер:
2.81 Mб
Скачать

10.2. Средние показатели вариационного ряда. Меры вариации и рассеяния

Средняя арифметическая дает представление об усредненном случае. Данный показатель позволяет сравнить между собой не только группы одного ряда распределения, но и сами ряды распределения, если они строятся по идентичным признакам:

где - значения вариаций признака; – сумма; N – число респон­дентов. При обработке данных массовых опросов чаще используется взвешенная арифметическая:

[c.103]

где – числовое значение i-й позиции признака, - число респон­дентов, выделенных по i-й позиции признака, N - общее число респон­дентов.

Для номинального уровня измерения (например, поддержки того или иного политического объединения), где цифры не связаны с по­рядком расположения категорий (а потому использование средней арифметической лишено смысла), для измерения средней тенденции используют моду. Мода – наиболее часто встречающееся значение признака в серии зарегистрированных наблюдений. Возможно унимо­дальное, бимодальное или многомодальное распределение признака. Определение моды в номинальных и порядковых рядах распределения не вызывает сложностей. В интервальном ряду говорят не о нахожде­нии моды, а об определении модального интервала. Для этого перехо­дят от деления на интервалы, основанного на содержательном крите­рии, к делению на интервалы по формальным критериям. Значение моды для интервального ряда (с равными интервалами) определяется по формуле

где - нижняя граница модального интервала; – величина интер­вала; – частота модального класса; – частота интервала, предшествовавшего модальному; – частота интервала, следующе­го за модальным.

Недостатки моды: а) невозможность использовать ее в дальней­ших вычислениях; б) вероятность существования нескольких модаль­ных величин в вариационном ряду; в) зависимость ее величины от ин­тервала группировки.

Для измерения среднего значения порядковых и интервальных данных чаще всего используют медиану. Для номинальных этот пока­затель шкал не используется. Медиана – значение среднего признака в упорядоченном (ранжированном по возрастанию или убыванию при­знака) ряду, причем до и после него находится равное число наблюде­ний.

При нечетном количестве наблюдений медиана приходится ровно на середину упорядоченного ряда (например, при 1001 наблюдении медианой будет величина 501-го наблюдения). При наличии четного количества признаков (наблюдений) в ряду рассчитывают среднее арифметическое для двух наблюдений, расположенных в центре ряда. [c.104]

При числе наблюдений, равном 1000, медиана рассчитывается как средняя арифметическая 500-го и 501-го наблюдения:

где – нижняя граница медианного интервала; – величина ин­тервала; – частота (относительная) медианного интервала; n – сумма частот (относительных частот) интервалов; nh – частота (отно­сительная), накопленная до медианного интервала.

Если для исследования используется динамический ряд (измене­ние признака во времени), то в качестве среднего значения может быть использовано среднее геометрическое (корень n-й степени из произве­дения всех значений признака X):

Например, в регионе N в течение четырех месяцев число забасто­вок составило соответственно 34, 56, 21, 39. Среднее геометрическое для этого ряда будет равно

Помимо названных средних значений ряда можно рассчитывать среднее квадратическое и среднее гармоническое.

Для вычисления неравномерности распределения признака исполь­зуют вариационный размах, среднее абсолютное отклонение, диспер­сию, коэффициент вариации. С их помощью можно определить сте­пень отклонения от средних значений ряда. Это позволяет ответить на вопрос, является ли наиболее типичное значение признака репрезента­тивным для всей совокупности. Например, нам известно, что рейтинг доверия к местной исполнительной власти в городе N в течение 1998 г. составил 23, 19, 24, 31, 30, 25, 22, 28, 35, 38, 42, 45%. Разность между наибольшим и наименьшим значением ряда – вариационный размах – определяется по формуле

Для нашего ряда он будет равен 26% (45% - 19%).

Среднее абсолютное отклонение – среднее арифметическое аб­солютных величин отклонений отдельных значений признака от их средней арифметической: [c.105]

где – число значений в ряду; – сумма отклонений значения ряда от средней арифметической по подсовокупностям (зна­чения суммируются без учета знака отклонения, по модулю).

Для нашего примера , а

Формула дисперсии для порядковых и интервальных рядов:

Если число наблюдений больше 30, то в знаменателе из единица не вычитается.

Среднеквадратическое отклонение (сигма) вычисляется как ко­рень квадратный из дисперсии. С его помощью можно сравнивать ме­ры рассеяния разных признаков или одного признака для разных подсовокупностей. Для нашего примера среднеквадратическое отклонение равно 8,3.

Для оценки дисперсии (разброса) номинальных данных исполь­зуют коэффициент вариации. Он показывает процентную долю всех признаков, которые не входят в модальную категорию.

Формула коэффициента вариации для номинального ряда:

где – количество всех наблюдений, не являющихся мо­дальными; N– общее число наблюдений. , При , мо­дальное значение ряда является типичным.

Например, был задан вопрос о существовании партии, программу которой поддерживает респондент. Из 1000 опрошенных 350 человек дали утвердительный ответ, 400 – отрицательный, 250 человек не смогли определиться. Тогда коэффициент вариации будет равен от­ношению суммы респондентов, ответивших позитивно и затруднив­шихся с ответом, к общему числу опрошенных (350 + 250)/1000 = 0,6.

Дисперсия для ряда с альтернативными признаками определяется по формуле

[c.106]

Для выборки в 1000 человек, из которых 650 собираются принять участие в голосовании, а 350 – нет, дисперсия будет равна (650 х 350)/10002 = 22,75.

Закон распределения. Нормальное распределение признака в ва­риационном ряду можно определить, если: 1) в ряду есть единственная мода, находящаяся в самом центре распределения; 2) частоты сим­метрично убывают по направлениям к предельным значениям ряда; 3) распределение признака подчиняется «правилу трех сигм», т. е. 68,3% всех случаев распределяются в пределах одного стандартного отклонения от центра ряда, 95,5% случаев – в пределах двух стан­дартных отклонений, 99,7% – в пределах трех отклонений (рис.8).

Рис. 8. Иллюстрация к «правилу трех сигм».

10.3. Индексы

Индекс – обобщенный производный показатель, сформирован­ный на основе исходных данных с помощью простейших математиче­ских операций.

К индексам прибегают для интеграции индикаторов в единый ус­ловный показатель для корректного анализа информации. Индексы выполняют функцию иллюстрации тенденции, без объективной число­вой характеристики и используются сугубо в целях сопоставительного анализа.

За пределами межгруппового сравнения индексы не имеют ни семантической, ни эмпирической значимости. В политических исследованиях индексы часто используют при анализе текстовой информации (в контент-анализе текстов).

В общем виде индекс имеет следующий вид:

где х – эмпирические индикаторы, число которых равно п. [c.107]

Чаще всего в политических исследованиях используют индекс «удовлетворенности», который показывает относительную величину группы людей, дающих позитивный ответ, относительно общего числа респондентов. Для шкалы с тремя градациями («да», «нет», «затруд­няюсь ответить») индекс удовлетворенности будет иметь вид

При этом – количество позитивных ответов, – количество затруднившихся с ответом, – количество отрицательных ответов.

Значение данного индекса может колебаться от -1 до +1. Знак индекса («+» или «-») свидетельствует о доминанте того или иного типа ответов.

Несколько модернизировав данный индекс, можно использовать его для порядковых шкал, например, для сравнения электоральной активности различных социальных групп. В этом случае индекс приобретет следующий вид:

При этом – количество людей, абсолютно точно намеренных участвовать в голосовании, – число скорее уверенных в своем уча­стии в голосовании, – количество затруднившихся с ответом, – число склонных дать скорее отрицательный ответ, – количе­ство дающих абсолютно уверенно отрицательный ответ.

Несколько модернизировав этот индекс, можно использовать его для анализа любых показателей.