- •Вопросы к экзамену по курсу «Методы обработки и анализа информации в сфере молодежной политики»
- •1. Статистические закономерности в анализе социологической информации.
- •2. Моделирование социальной реальности.
- •3. Специфика математико-статистических методов применительно к социологической информации.
- •4. Задачи математики применительно к социологической информации.
- •5. Сложности использования математических методов в социологии.
- •1. Проблема соотношения выборки и генеральной совокупности
- •2. Отсутствие строгих обоснований возможности применения конкретных методов математической статистики. Эвристичность (непредсказуемость)многих алгоритмов анализа данных
- •6. Программно-аналитический комплекс «spss»: общая характеристика.
- •2. Краткая история возникновения и развития spss.
- •3. Модули программы spss
- •7. Подготовка и создание базы данных в spss: подготовка социологических данных к обработке (в т.Ч. Дихотомический и категориальный способы кодировки).
- •8. Корректировка базы данных.
- •9. Методы анализа одномерных распределений: описание и графическое представление социологических данных, построение таблиц частотного распределения для многозначных вопросов.
- •10. Модификация массива социологических данных: перекодирование с созданием новых переменных, перекодирование в старых переменных, условный отбор данных.
- •11. Меры центральной (средней) тенденции.
- •12. Шкалирование и виды шкал.
- •13. Меры разброса.
- •14. Показатели распределения признака.
- •15. Стандартизация показателей.
- •16. Таблицы сопряженности.
- •17. Коэффициенты критерия «хи-квадрат» и его вычисление в spss.
- •18. Меры связанности для переменных номинальной шкалы: симметричные и направленные меры.
- •3.1. Симметричные меры
- •3.2. Направленные меры
- •19. Меры связанности для переменных порядковой (ранговой) шкалы.
- •20. Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки.
- •Ошибки выборки
- •Необходимый объем выборки
14. Показатели распределения признака.
Любое реальное распределение можно изобразить схематически в виде кривой, воспроизводящей основные особенности данного распределения. Под кривой распределения понимается графическое изображение в виде непрерывной линии изменения частот, функционально связанных с изменением вариант.
Элементами распределения являются:
варианта
частота
В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределения:
одновершинные
многовершинные
К одновершинным относятся те, в которых один, обычно центральный вариант, имеет наибольшую частоту (плотность распределения). Частоты же остальных вариантов убывают по мере удаления от центрального.
Если частоты убывают слева и справа от центрального значения одинаково, то такие распределения называются симметричными.
Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными.
Многовершинные распределения — это распределения, в которых несколько центров, т. е. такие, у которых несколько максимумов частот.
Для однородных совокупностей, как правило, характерны одновершинные распределения.
Многовершинность распределения свидетельствует о неоднородности изучаемого явления. В этом случае необходимо произвести перегруппировку данных с целью выделения более однородных групп:
Кривые распределения бывают:
симметричными
асимметричными.
В зависимости от того, какая ветвь кривой распределения вытянута, различают:
правостороннюю асимметрию(отрицательная, значения признака большие)
левостороннюю асимметрию.(положительная, значения признака преобладают маленькие)
Для
характеристики степени асимметрии двух
или нескольких рядов пользуются
коэффициентом
асимметрии.
А>0 правосторонняя ассиметрия, А<0
правосторонняя.
Коэффициент
эксцесса:
необходим для оценки островершинности
распределения. Если Е=0 распределение
нормальное, если больше, то гипотеза о
нормальном распределении отвергается.
15. Стандартизация показателей.
Одной из задач, возникающих при одномерном анализе данных, является задача сопоставления значения определенной переменной для конкретного респондента со средним значением этой переменной в какой-то социальной группе.
Например, мы знаем, что респондент имеет заработную плату в размере 2 500 руб. Не зная средней величины зарплаты в регионе, где проживает респондент, мы не сможет сказать много или мало он получает. Величина 2 500 может быть проинтерпретирована лишь в сравнении с доходами других людей.
Для того чтобы можно было сразу оценить относительную величину того или иного количественного показателя для конкретного респондента, используется подход стандартизации исходных данных.
Существует несколько различных подходов к стандартизации данных, но наиболее распространенным является так называемая Z-статистика. Вычисление стандартизированной величины Zxy для значения переменной х проводится по
формуле
Zxi = (xi – x)/S,
где Xi – значение переменной х для определенного респондента;
X – среднее значение переменной х;
S – стандартное отклонение для переменной х.
Значение показателя Z значительно более информативно с точки зрения задачи относительного положения данного респондента, чем значение исходной переменной х. Если для респондента значение Z положительно, то он имеет значение переменной х больше, чем средний опрошенный респондент.
После того, как будет известно большее или меньшее значение переменной х имеет данный респондент по сравнению с другими опрошенными, необходимо узнать, насколько это значение больше или меньше, чем у других респондентов.
В знаменателе формулы для расчета Z стоит дисперсия переменной х, следовательно, 68 % Zx должно лежать в интервале от -1 до +1, а 95 % – в интервале от -2 до +2.
Таким образом, если по модулю значение Zx меньше 1, то значение переменной х для данного респондента вполне типично.
Если значение Zx по модулю находится в интервале от 1 до 2, то можно говорить, что данный респондент по рассматриваемому показателю значительно отличается от среднего респондента.
И наконец, если Zx по модулю превосходит 2, то можно утверждать, что респондент резко отличается от среднего.
Стандартизированная по формуле величина имеет среднее значение, равное 0, и дисперсию, равную 1.
Чтобы провести стандартизацию показателей при помощи SPSS, следует использовать блок команд:
Аnalyze / Анализ →
Descriptive statistics / Описательные статистики →
Descriptive / Описательные.
В результате откроется окно. Там будет операция «сохранять стандартиз.значения переменных»
После вычислений автоматически создается новая переменная, содержащая в себе стандартизированные значения, и размещается она последней в матрице данных
Новая переменная zvar21 представляет собой Z-стандартизированное значение переменной var00021. Использование стандартизированной переменной позволяет сказать, что доход респондента номер 21 приблизительно равен среднему значению по массиву опрошенных. В то время как доход у респондента под номером 32 значительно выше, нежели у среднего респондента.
Использование стандартизированных переменных может быть полезно при сопоставлении показателей, измеренных в различных единицах. Так, например, мы располагаем результатами исследований, проведенных в России и США. У российского респондента А средний доход составляет 9 000 руб. в месяц, у американского респондента В доход равен 2 000 дол. в месяц. Не зная значений средних доходов россиян и американцев, мы не можем их сопоставить и определить, кто из респондентов (А или В) находится выше в своем социальном кругу с точки зрения доходов. Но мы можем ответить на данный вопрос, если сопоставим не исходные объективные данные, а стандартизированные показатели.
