
- •Моделирование социальной реальности.
- •Специфика математико-статистических методов применительно к социологической информации.
- •Задачи математики применительно к социологической информации.
- •5. Сложности использования математических методов в социологии.
- •1)Проблема соотношения выборочной и генеральной совокупности.
- •3)Для многих методов отсутствуют разработанные способы перенесения результатов их применения с выборочной на генеральную совокупность
- •4)Методы переноса результатов с выборочной на генеральную совокупность базируется на серьёзных научных теориях.
- •II. Отсутствие строгих обоснований возможности применения конкретных методов математической статистики.
- •III. Использование шкал низких типов.
- •IV. Необходимость соотнесения модели метода с содержанием социологической задачи.
- •6. Программно-аналитический комплекс «spss»: общая характеристика.
- •2. Краткая история возникновения и развития spss.
- •3. Модули программы spss
- •7. Подготовка и создание базы данных в spss: подготовка социологических данных к обработке (в т.Ч. Дихотомический и категориальный способы кодировки).
- •1. Основы работы с электронной таблицей spss
- •Основные группы команд пакета spss, расположенные в главном меню
- •2. Подготовка социологических данных к обработке
- •3. Создание базы данных при помощи spss
- •Имя переменной (Name)
- •Тип переменной (Type)
- •(Для численной переменной)
- •Формат столбца (Width)
- •Десятичные разряды (Decimal)
- •Метка переменной (Label)
- •Метки значений (Values)
- •Отсутствующие значения (Missing Values)
- •Шкала измерения (Measure)
- •Создание переменных для многозначных вопросов и их кодировка.
- •Многозначного вопроса
- •8. Корректировка базы данных
- •«Редактор данных: просмотр данных» с метками кодовых значений
- •«В какой степени Вы удовлетворены результатами прошедших выборов?» (фрагмент приложения программы spss)
- •9. Методы анализа одномерных распределений: описание и графическое представление социологических данных, построение таблиц частотного распределения для многозначных вопросов.
- •Чувства
- •Чувства
- •Частоты для множественных ответов»
- •10. Модификация массива социологических данных: перекодирование с созданием новых переменных, перекодирование в старых переменных, условный отбор данных.
- •1.1. Перекодирование с созданием новых переменных
- •Перекодировать в другие переменные
- •1.2. Перекодирование в старых переменных.
- •Перекодировать в те же переменные»
- •11. Меры центральной (средней) тенденции.
- •1.1. Меры центральной (или средней) тенденции
- •Со средним значением по массиву (данные взяты произвольно)
- •«Какие чувства Вы испытываете, когда думаете о ближайшем будущем?» (фрагмент приложения программы spss)
- •12. Шкалирование и виды шкал.
- •13. Меры разброса.
- •Меры разброса
- •14. Показатели распределения признака.
- •15. Стандартизация показателей.
- •Сохранить стандартизированные значения в переменных
- •16. Таблицы сопряженности.
- •Функция «Статистики» Функция «Не выводить таблицы»
- •17. Коэффициенты критерия «хи-квадрат» и его вычисление в spss.
- •Программы spss)
- •18. Меры связанности для переменных номинальной шкалы: симметричные и направленные меры.
- •3.1. Симметричные меры
- •3.2. Направленные меры
- •3.3. Вычисление в spss
- •Программы spss)
- •19. Меры связанности для переменных порядковой (ранговой) шкалы.
- •20. Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки.
- •21. Многоступенчатая выборка: алгоритм формирования.
Со средним значением по массиву (данные взяты произвольно)
Доход |
Среднее значение (руб.) |
Расхождение реального дохода и среднего значения (остаток) |
17 000 |
15 500 |
1 500 |
13 000 |
15 500 |
-2 500 |
18 000 |
15 500 |
2 500 |
15 000 |
15 500 |
500 |
14 500 |
15 500 |
-1 000 |
Мода. Для номинальных переменных мерой центральной тенденции может выступать только мода - наиболее часто встречающееся значение переменной. Мода не имеет какого-либо показателя разброса. Определенной характеристикой может считаться лишь само процентное значение модальной величины.
В таблице 5.3 отражено распределение ответов на вопрос о чувствах.
Таблица 5.3. Частотное распределение ответов респондентов на вопрос
«Какие чувства Вы испытываете, когда думаете о ближайшем будущем?» (фрагмент приложения программы spss)
|
Frequency / Частота |
Percent / Процент |
Valid Percent / Валидный процент |
Cumulative Percent / Кумулятивный/ суммарный процент |
|
Valid Валидные |
Надежда |
252 |
31,4 |
31,5 |
31,5 |
тревога |
300 |
37,4 |
37,5 |
69,1 |
|
спокойствие |
90 |
11,2 |
11,3 |
80,4 |
|
никаких |
153 |
19,1 |
19,1 |
99,5 |
|
з.о. |
4 |
0,5 |
0,5 |
100,0 |
|
Total / Итого |
799 |
99,6 |
100,0 |
|
|
Missing / Пропущенные |
System / Без ответа |
3 |
0,4 |
||
Total / Итого |
802 |
100,0 |
Как видно из табл. 5.3, модальное значение 37,5 % приходится на ответ «чувство тревоги». Это говорит нам о том, что на все другие ответы приходится 62,3 %. Это очень слабое указание на распределение признака, т.к. не дается информации о том, как разбросаны данные по другим градациям переменной.
Возможны ситуации, когда модальных значений может быть несколько или они могут вообще отсутствовать.
Медиана. Для переменных, измеренных на порядковом уровне, основной мерой центральной тенденции является медиана.
Медиана – это значение признака, которое делит вариационный ряд, отвечающий этому признаку, пополам. Вариационный ряд – последовательность значений признака, расположенных в порядке их возрастания.
Таким образом, медиана обладает тем свойством, что половина всех выборочных значений признака меньше ее, а половина – больше.
Данная мера центральной тенденции имеет смысл только для порядковых и метрических шкал (для номинальных она не подходит, поскольку ее интерпретация будет бессмысленна с содержательной стороны).
Например, мы имеем 11 измеренных значений: 3, 7, 8, 5, 4, 6, 3, 9, 2, 8, 4.
Вариационный ряд будет представлять собой упорядоченную в порядке возрастания совокупность значений – 2, 3, 3, 4, 4, 5, 6, 7, 8, 8, 9. В этом случае медиана равна 5.
Если вариационный ряд содержит четное число измерений, например: 12 – 2, 3, 3, 4, 4, 5, 6, 7, 8, 8, 8, 9, то медиана будет равна среднему арифметическому двух центральных значений: Ме= (5+6)/2=5,5.
Так, например, по результатам исследования 2004 г. определим степень выраженности качества «надежный» у Президента РФ. Респондентам предлагалось по 7-балльной шкале оценить, в какой мере Президенту присуще данное качество, где 1 – практически не характерно, 7 – полностью присуще. Ответы распределились следующим образом (табл. 5.4).
Таблица 5.4. Распределение ответов респондентов на вопрос
«Оцените, в какой мере В.В. Путину присуще качество
«надежный»?» (фрагмент приложения программы SPSS)
|
Frequency / Частота |
Percent / Процент |
Valid Percent / Валидный процент |
Cumulative Percent / Кумулятивный/ суммарный процент |
|
Valid Валидные |
1,00 |
25 |
3,1 |
3,2 |
3,2 |
2,00 |
18 |
2,2 |
2,3 |
5,6 |
|
3,00 |
42 |
5,2 |
5,4 |
11,0 |
|
4,00 |
84 |
10,5 |
10,9 |
21, 9 |
|
5,00 |
91 |
11,3 |
11,8 |
33,6 |
|
6,00 |
146 |
18,2 |
18,9 |
52,5 |
|
7,00 |
367 |
45,8 |
47,5 |
100,0 |
|
/ Итого |
773 |
96,4 |
100,0 |
|
|
Missing / Пропущенные |
System / Без ответа |
29 |
3,6 |
||
Total / Итого |
802 |
100,0 |
Медиана – это такое значение переменной, меньше которого отметили 50 % респондентов. В данном случае градации 1, 2, 3, 4, 5, 6 отметили 52,5 % респондентов, следовательно, градация 6 – медиана.
При анализе данных, основанных на использовании какой-либо модели, всегда стоит вопрос о качестве данной модели. Эффективным инструментом для ее определения являются остатки.
Функцию оценки качества модели среднего выполняют меры разброса: дисперсия, среднеквадратичное отклонение, стандартная ошибка среднего.