- •Вопросы к экзамену по курсу «Методы обработки и анализа информации в сфере молодежной политики»
- •1. Статистические закономерности в анализе социологической информации.
- •2. Моделирование социальной реальности.
- •3. Специфика математико-статистических методов применительно к социологической информации.
- •4. Задачи математики применительно к социологической информации.
- •5. Сложности использования математических методов в социологии.
- •1. Проблема соотношения выборки и генеральной совокупности
- •2. Отсутствие строгих обоснований возможности применения конкретных методов математической статистики. Эвристичность (непредсказуемость)многих алгоритмов анализа данных
- •6. Программно-аналитический комплекс «spss»: общая характеристика.
- •2. Краткая история возникновения и развития spss.
- •3. Модули программы spss
- •7. Подготовка и создание базы данных в spss: подготовка социологических данных к обработке (в т.Ч. Дихотомический и категориальный способы кодировки).
- •8. Корректировка базы данных.
- •9. Методы анализа одномерных распределений: описание и графическое представление социологических данных, построение таблиц частотного распределения для многозначных вопросов.
- •10. Модификация массива социологических данных: перекодирование с созданием новых переменных, перекодирование в старых переменных, условный отбор данных.
- •11. Меры центральной (средней) тенденции.
- •12. Шкалирование и виды шкал.
- •13. Меры разброса.
- •14. Показатели распределения признака.
- •15. Стандартизация показателей.
- •16. Таблицы сопряженности.
- •17. Коэффициенты критерия «хи-квадрат» и его вычисление в spss.
- •18. Меры связанности для переменных номинальной шкалы: симметричные и направленные меры.
- •3.1. Симметричные меры
- •3.2. Направленные меры
- •19. Меры связанности для переменных порядковой (ранговой) шкалы.
- •20. Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки.
- •Ошибки выборки
- •Необходимый объем выборки
5. Сложности использования математических методов в социологии.
1. Проблема соотношения выборки и генеральной совокупности
1) На практике нередко нарушаются условия вероятностного порождения данных.
2) Не всегда бывает ясно, какова изучаемая генеральная совокупность.
3) Для многих методов отсутствуют разработанные способы перенесения результатов их применения с выборки на генеральную совокупность.
4) Перенос результатов с выборки на генеральную совокупность может быть затруднен из-за осуществления "ремонта" выборки (например, ее перевзвешивания),
2. Отсутствие строгих обоснований возможности применения конкретных методов математической статистики. Эвристичность (непредсказуемость)многих алгоритмов анализа данных
3. Использование шкал низких типов. Проблемы с использованием в социологии традиционных математико-статистических методов возникают также в связи с тем, что интересующие социолога данные, как правилo, бывают получены по шкалам низких типов. К шкалам низкого типа обычно относят шкалы, позволяющие получать "числа", очень не похожие на те действительные числа, к которым мы привыкли, осваивая курс школьной математики. Эта непохожесть означает невозможность работать с этими числами по обычным правилам арифметики. К шкалам же высокого типа причисляют те, с помощью которых получаются числа, в достаточной мере похожие на действительные числа, т.е. такие, с которыми позволено делать почти все, что мы привыкли делать с числами. Шкалами низкого типа обычно считают шкалы, называемые в литературе номинальными и порядковыми, а шкалами высокого типа – интервальные и шкалы отношений (в теории измерений известны и другие шкалы как низкого, так и высокого типов). Шкалы низкого типа (и получаемые с их помощью данные) часто называют также качественными, а шкалы высокого типа (и соответствующие данные) – количественными, или числовыми.4.Необходимость соотнесения модели, "заложенной" в методе, с содержанием задачи. Приведем несколько примеров. Начнем, казалось бы, с самого простого – с расчета мер средней тенденции. В математике известно бесконечное количество таких мер. Предположим, что модельер должен определить, какая длина должна быть у очередной модели женских юбок, выпускаемых какой-то фабрикой, и для этой цели опрашивает женщин рассматриваемого региона, просит их указать "любимую" длину. Если мы в качестве длины, рекомендуемой фабрике, укажем медиану соответствующего распределения, то тем самым окажемся перед риском выпустить неходовой товар: половина женщин решит, что юбка для них слишком коротка, а половина – что чересчур длинна. Покупать продукцию фабрики никто не захочет. А вот если в качестве меры средней тенденции мы используем моду, то удовлетворим женщин, выразивших наиболее часто встречающееся мнение
6. Программно-аналитический комплекс «spss»: общая характеристика.
Для решения задач, связанных с анализом данных при наличии случайных и непредсказуемых воздействий, математиками за последние 10 лет был выработан мощный арсенал методов, называемых в совокупности математической статистикой (прикладной статистикой или анализом данных). Эти методы позволяют выявлять закономерности на фоне случайностей, делать обоснованные выводы и прогнозы, давать оценки вероятностей их выполнения или невыполнения. Широкому внедрению методов анализа данных в 60–70 гг. способствовало появление компьютеров. Статистические программные пакеты сделали методы анализа данных более доступными и наглядными. Сегодня уже не надо вручную считать сложные формулы, строить таблицы и т.д. Теперь исследователю остается лишь творческая работа: постановка задач, выбор методов измерения, интерпретация результатов. Впервые компьютерные программы по обработке социологической информации появляются во 2-й половине 60-х гг. в социологических центрах.В США появляются и некоторое время развиваются параллельно 4 статистических пакета.
1. OSIRIS – в Мичиганском университете в рамках социологического департамента.
2. NORC (статистический пакет для общественных наук) – создан на базе крупной академической ассоциации в Чикаго. В дальнейшем именно на этой основе и сформировался пакет SPSS.
3. BMDP (пакет обработки биомедицинской информации) – в Калифорнии.
4. SAS (система статистического анализа) – в Северной Каролине.
Следует отметить, что все эти пакеты составляли социологи.В настоящее время SPSS – это самое распространенное пользовательское приложение для статистического анализа во всем мире (оно занимает 92 % на рынке). Но следует помнить, что данный пакет программ удобен в применении только для массовых опросов. Основу программы составляет базисный модуль, предоставляющий разнообразные возможности регистрации и изменения информации. Он содержит методы анализа, которые применяются чаще всего. Этот модуль входит в базовую поставку и включает все процедуры ввода, отбора и корректировки данных. Наряду с простыми методиками статистического анализа данных – частотный анализ, расчет статистических характеристик, таблицы сопряженности, корреляции, построение графиков – этот модуль включает непараметрические тесты (непараметрические тесты не учитывают параметры распределения, т.е. средние значения и дисперсию), а также усложненные методы анализа данных: многомерный линейный регрессионный анализ, дискриминационный анализ, факторный анализ, кластерный, дисперсионный.Regression Models (регрессионные модели). Данный модуль включает в себя различные методы регрессионного анализа, такие как бинарная и многозначная логистическая регрессия, нелинейная регрессия и пробит-анализ.Advanced Models (усложненные модели). В этот модуль входят различные методы дисперсионного анализа (многомерный, с учетом повторных измерений), необходимые после применения общих линейных моделей, включая метод Каплана-Майера и регрессию Кокса, а также логлинейные модели.Модули и программы, расширяющие возможности SPSS.Tables. Модуль служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению с упрощенными частотными таблицами и таблицами сопряженности, которые строятся в базисном модуле.Amos. (Analysis of moment structures – анализ моментных структур.) Включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории.
Answer Tree (дерево решений). Включает 4 различных метода деления популяции на отдельные семейства (сегменты) с помощью заранее заданных категориальных переменных. Деление проводится таким образом, что зависимая переменная в различных сегментах принимает значимо различающиеся значения. Типичным примером применения данного метода является создание характерных профилей покупателей при исследовании потребительского рынка.Categories. Модуль содержит различные методы для анализа категориальных данных, а именно: метод анализа соответствия и три метода оптимального масштабирования (анализ однородности, нелинейный анализ главных компонентов, нелинейный канонический анализ корреляции).Conjoin (анализ совместимости). Применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты должны по своему усмотрению расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения. На основании этого выводятся так называемые частичные показатели полезности отдельных категорий каждого потребительского свойства.Data Entry (ввод данных). Точные тесты. Этот модуль служит для точного вычисления вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию χ-квадрат, а также при непараметрических тестах. Sample Power. При помощи данной программы может быть определен оптимальный размер выборки для большинства статистических анализов, используемых в SPSS.
