
- •Предисловие
- •Глава 1. Информация, обрабатываемая статистическим пакетом
- •1.1. Анкетные данные
- •1.2. Типы переменных
- •1.2.1. Типы кодирования переменных
- •1.2.2. Тип шкалы измерения переменной
- •1.2.3. Неколичественные шкалы
- •1.2.4. Количественные шкалы
- •1.2.5. Неальтернативные признаки
- •1.3. Имена и метки переменных
- •1.4. Коды неопределенных значений
- •Глава 2. Общее описание статистического пакета для социологических исследований и подготовка данных
- •2.1. Структура пакета
- •2.2. Схема организации данных, окна spss
- •2.3. Управление работой пакета
- •2.3.1. Основные команды меню spss верхнего уровня
- •2.3.2. Статусная строка
- •2.3.3. Ввод данных с экрана
- •2.4. Режим диалога и командный режим
- •2.4.1. Командный режим работы с пакетом. Основные правила написания команд на языке пакета
- •2.4.2. Порядок выполнения команд
- •2.4.3. Команды вызоваGeTи сохранения данныхSave
- •2.4.4. Основные команды описания данных
- •2.5. Основные команды преобразования данных
- •2.5.1. КомандыComputEиIf
- •2.5.1.1. Основные функции и операторы команд computEиIf
- •Сдвиг, произведенный функцией lag (данные «Проблем и жалоб»)
- •2.5.1.2. Работа с неопределенными значениями
- •2.5.1.3. Функции для неопределенных значений
- •2.5.1.4. Работа с пользовательскими неопределенными значениями
- •2.5.1.5. Работа с функциями missinGиSysmis.
- •2.5.2. КомандаRecode
- •2.5.3. КомандаCount
- •2.5.4. Условное выполнение команд
- •Интервалы для мужчин и женщин
- •2.5.5. КомандаRank
- •2.5.6. Отбор подмножеств наблюдений
- •2.5.7. КомандаSplitfile
- •Описательные статистики для групп, полученные при расщеплении данных для сравнения
- •2.5.8. Взвешивание выборкиWeight
- •2.6. Операции с файлами
- •2.6.1. Агрегирование данных (командаAggregate)
- •2.6.1.1. Функции агрегирования
- •2.6.1.2. Пример агрегирования файла
- •2.6.2. Объединение файлов (merge files)
- •Глава 3. Процедуры получения описательных статистик и таблиц сопряженности
- •3.1. Команды получения распределений и описательных статистик
- •3.1.1. Frequencies – получение одномерных распределений переменных
- •3.1.1.1. Подкоманды /barchart, /piecharTи /histogram– диаграммы распределения
- •3.1.1.2. Подкоманды /ntiles, /percentiles–n-тили, процентили
- •3.1.1.3. Подкоманда /statistics– описательные статистики
- •Статистики переменной v14 – «Душевой доход», выданные командой frequencies
- •3.1.2.Descriptives– описательные статистики
- •3.1.3.Explore– исследование распределений и сравнение групп объектов
- •3.2 Анализ связи между неколичественными переменными
- •3.2.1.Crosstabs– таблицы сопряженности
- •3.2.1.1. Подкоманда /tables– задание таблиц
- •Распределение переменной «Точка зрения на иностранную помощь» в разрезе региона и пола респондентов
- •3.2.1.2. Подкоманда /cells
- •Связь ответов на вопросы «Точки зрения на иностранную помощь» и «Возможности удовлетворения территориальных требований Японии» (частоты и проценты)
- •3.2.1.3. Cтатистики смещения частот
- •Связь ответов на вопросы «Точки зрения на иностранную помощь» и «Возможностью удовлетворить территориальные требования Японии» (статистики смещений частот)
- •3.2.1.4. Подкоманда /statistics– исследование связи неколичественных переменных
- •Тесты хи-квадрат
- •3.2.1.5. Измерение силы связи между номинальными переменными
- •3.2.1.6. Коэффициенты связи между ранговыми переменными
- •Коэффициенты для ранговых переменных
- •3.2.1.7. Точные методы оценки значимости
- •3.3. Сложные табличные отчеты. Таблицы для неальтернативных вопросов
- •3.3.1. Работа с командой General Tables
- •Средний возраст в группах по ответам на вопрос III «Что мешает заключить договор?» для мужчин и женщин
- •3.3.2. Типичные примеры использования Multiple Response Tables
- •3.4. Множественные сравнения в таблицах для неальтернативных вопросов. Программа Typology Tables
- •3.4.3. Как выяснить надежность результата?
- •3.4.4. Критические значенияZ-статистики при множественных сравнениях
- •3.4.5. Статистические эксперименты
- •3.4.6. Работа с программой Typology Tables
- •3.4.7. Примеры использования программы Typology Tables
- •3.4.7.1. Частотная таблица. Наличие крупной собственности и покупки спиртного и табака.
- •Покупка алкоголя и табачных изделий и наличие крупной собственности (фрагмент таблицы сопряженности, частоты и % по строкам)
- •3.4.7.2. Таблица средних. Молочные продукты и жилплощадь
- •Средняя жилплощадь в группах семей по покупкам молочных продуктов
- •3.4.7.3. Душевой доход любителей сладкого и жилье. Одновременное сравнение средних по строкам таблицы
- •Средний логарифм доходов в группах по жилищным условиям и покупкам сладкого (среднее, стд. Отклонение, численность в группах)
- •Глава 4. Сравнение средних, корреляции
- •4.1. Compare Means – простые параметрические методы сравнения средних
- •4.1.1. Одновыборочный тест (One sample t-test)
- •Одновыборочный t-тест. Средний промедианный доход незначимо отличается от нуля
- •Одновыборочный t-тест. Средний логарифм промедианного дохода в группе с относительно низким образованием отличается от нуля при уровне значимости 5 %
- •4.1.2. Двухвыборочный t-тест (independent sample t-test)
- •4.1.3. Двухвыборочныйt-тестдля связанных выборок (Paired sample t-test)
- •4.1.4. КомандаMeans– сравнение характеристик числовой переменной по группам
- •Среднемесячный душевой доход в семье
- •Результаты однофакторного дисперсионного анализа
- •4.1.5. Одномерный дисперсионный анализ (oneway)
- •4.1.6. Множественные сравнения
- •Oneway, сравнение среднего промедианного логарифма доходов
- •Oneway, проверка однородности дисперсий
- •Oneway, обычный дисперсионный анализ
- •Oneway, группы неразличимых средних
- •Oneway, множественные попарные сравнения
- •4.2. Correlationsкорреляции
- •4.2.1. Парные корреляции
- •Коэффициенты корреляции Спирмена (Spearman's rho)
- •4.2.2. Частные корреляции
- •Коэффициент корреляции времени приготовления пищи и закупки продуктов
- •Коэффициент корреляции времени приготовления пищи и закупки продуктов
- •Глава 5. Непараметрические тесты. Командаnonparametrictests
- •5.1. Одновыборочные тесты
- •5.1.1.Тест хи-квадрат
- •Наблюдаемые и ожидаемые частоты
- •Статистика хи-квадрат
- •Значимость критерия хи-квадрат
- •5.1.2. Тест, основанный на биномиальном распределении
- •Значимость критерия хи-квадрат
- •5.1.3. Тест КолмогороваСмирнова
- •Проверка нормальности распределения доходов с использованием критерия Колмогорова – Смирнова
- •Проверка лог-нормальности распределения доходов
- •5.2. Тесты сравнения нескольких выборок
- •5.2.1. Двухвыборочный тест КолмогороваСмирнова
- •Cравнение распределения доходов в двух группах на основе критерия Колмогорова – Смирнова
- •5.2.2. Тест медиан
- •Метод медиан. Разделение на две подвыборки
- •Метод медиан. Значимость критерия
- •5.3. Тесты для ранговых переменных
- •5.3.1. Двухвыборочный тест Манна – Уитни (Mann – Witney)
- •Критерий Манна Уитни. Суммы рангов
- •Критерий Манна Уитни. Значимость критерия
- •5.3.2. Одномерный дисперсионный анализ КраскэлаУоллиса (KruskalWallis)
- •Тест Краскэла – Уоллиса. Средние ранги
- •Тест Краскэла Уоллиса. Значимость критерия
- •5.4. Тесты для связанных выборок (Related samples)
- •5.4.1. Двухвыборочный критерий знаков (Sign)
- •Тест знаков для парных наблюдений. Частоты
- •Тест знаков для парных наблюдений. Значимость критерия
- •5.4.2. Двухвыборочный знаково-ранговый критерий Вилкоксона (Wilcoxon)
- •Знаково-ранговый тест Вилкоксона. Средние ранги
- •Знаково-ранговый тест Вилкоксона. Средние ранги
- •5.4.3. Критерий Фридмана (Friedman)
- •Tест Фридмана. Средние ранги
- •Tест Фридмана. Значимость
- •Глава 6. Регрессионный анализ
- •6.1. Классическая линейная модель регрессионного анализа
- •6.1.1. Существует ли линейная регрессионная зависимость?
- •6.1.2. Коэффициенты детерминации и множественной корреляции
- •6.1.3. Оценка влияния независимой переменной
- •6.1.3.1. Стандартизация переменных. Бета-коэффициенты
- •6.1.3.2. Надежность и значимость коэффициента регрессии
- •6.1.3.3. Значимость включения переменной в регрессию
- •6.1.4. Пошаговая процедура построения модели
- •6.1.5. Переменные, порождаемые регрессионным уравнением
- •6.1.6. Взвешенная регрессия
- •6.1.7. Команда построения линейной модели регрессии
- •6.1.8. Пример построения модели
- •Общие характеристики уравнения
- •Дисперсионный анализ уравнения
- •Коэффициенты регрессии
- •6.1.9.Можно ли в регрессии использовать неколичественные переменные?
- •Коэффициенты регрессии с индексными переменными
- •6.1.10.Взаимодействие переменных
- •6.2.Логистическая регрессия
- •6.2.1.Отношение шансов и логит
- •6.2.2. Решение уравнения с использованием логита
- •6.2.3. Неколичественные данные
- •6.2.4. Взаимодействие переменных
- •6.2.5. Пример логистической регрессии и статистики
- •Средняя зарплата по децилям
- •6.2.6. Качество логистической регрессии
- •6.2.7. Вероятность правильного предсказания
- •Связь наблюдения и предсказания в логистической регрессии
- •6.2.8. Коэффициенты логистической регрессии
- •6.2.9. О статистике Вальда
- •6.2.10. Сохранение переменных
- •Глава 7. Исследование структуры данных
- •7.1. Факторный анализ
- •7.1.1. Метод главных компонент
- •7.1.2. Интерпретация факторов
- •7.1.3. Оценка факторов
- •7.1.4. Статистические гипотезы в факторном анализе
- •7.1.5. Задание факторного анализа
- •Дисперсия, объясненная факторным анализом
- •Матрица факторных нагрузок
- •Матрица факторных нагрузок после вращения факторов
- •7.2. Кластерный анализ
- •7.2.1. Иерархический кластерный анализ
- •Протокол объединения кластеров
- •7.2.2. Быстрый кластерный анализ
- •Центры кластеров (Final Cluster Centers)
- •Дисперсионный анализ в методе k-средних (anova, имееет только описательное значение)
- •7.3. Многомерное шкалирование
- •7.3.1. Евклидово пространство
- •7.3.2. Идея многомерного шкалирования
- •7.3.3. Качество подгонки модели
- •7.3.4. Вызов процедуры многомерного шкалирования
- •7.3.5. Исходная матрица расстояний
- •7.3.6. Пример построения шкал
- •Коэффициенты ранговой корреляции Спирмена построенных шкал с обеспеченностью предметами быта
- •Литература
- •Приложение 1 Анкета опроса общественного мнения
- •Приложение 2 Переменные файла обследования общественного мнения
- •Оглавление
- •Глава 1. Информация, обрабатываемая статистическим пакетом 5
- •Глава 2. Общее описание статистического пакета для социологических исследований и подготовка данных 10
- •Глава 3. Процедуры получения описательных статистик и таблиц сопряженности 40
- •Глава 4. Сравнение средних, корреляции 78
- •Глава 5. Непараметрические тесты. Команда nonparametric tests 96
- •Глава 6. Регрессионный анализ 109
- •Глава 7. Исследование структуры данных 131
Распределение переменной «Точка зрения на иностранную помощь» в разрезе региона и пола респондентов
V8 Пол |
R регион |
Содержимое ячеек |
V1 точка зрения на иностр. помощь | ||||
Не нужна |
Огранич. |
Нужна |
Не знаю |
Total | |||
Муж. |
Дальн./В. |
Count |
25 |
91 |
22 |
7 |
145 |
% |
17,2 |
62,8 |
15,2 |
4,8 |
100 | ||
Вост./Сиб. |
Count |
25 |
56 |
13 |
1 |
95 | |
% |
26,3 |
58,9 |
13,7 |
1,1 |
100 | ||
Зап./Сиб. |
Count |
38 |
65 |
13 |
3 |
119 | |
% |
31,9 |
54,6 |
10,9 |
2,5 |
100 | ||
Total |
Count |
88 |
212 |
48 |
11 |
359 | |
% |
24,5 |
59,1 |
13,4 |
3,1 |
100 | ||
Жен. |
Дальн./В. |
Count |
26 |
87 |
9 |
6 |
128 |
% |
20,3 |
68,0 |
7,0 |
4,7 |
100 | ||
Вост./Сиб. |
Count |
23 |
54 |
6 |
7 |
90 | |
% |
25,6 |
60,0 |
6,7 |
7,8 |
100 | ||
Зап./Сиб. |
Count |
40 |
75 |
9 |
7 |
131 | |
% |
30,5 |
57,3 |
6,9 |
5,3 |
100 | ||
Total |
Count |
89 |
216 |
24 |
20 |
349 | |
% |
25,5 |
61,9 |
6,9 |
5,7 |
100 |
Употребление BYв командеCROSSTABSвозможно до 10 раз, но и этого достаточно, чтобы занять все ресурсы компьютера.
Если мы хотим получить в одной команде CROSSTABSнесколько независимых таблиц, то следует отделять списки переменных символом /:
CROSSTABS V8 V11 BY V4 V1/ V12 BY V1 /CELLS row.
Таблица, заполненная одними частотами Nij, обычно не имеет смысла, так как она не проясняет должным образом взаимосвязи переменных. Для исследования взаимосвязи необходимы статистики оценки взаимосвязи самих переменных и статистики оценки связи их значений.
3.2.1.2. Подкоманда /cells
Параметр CELLSзадает вывод некоторых статистик (см. ниже параметры подкомандыCELLS) для клеток таблицы сопряженности.Cellsпереводится как «клетка». Если этот параметр не указан, то в клетках таблицы выводятся только абсолютные частоты.
Примерзадания статистик клеток:
CROSSTABS V1 BY V4 /CELLS = COUNT ROW COLUMN.
Параметры подкоманды /CELLS:
COUNT – абсолютное число объектов (Nij);
ROW – проценты по строке;
COLUMN – проценты по столбцу;
TOTAL – проценты по отношению ко всей выборке;
EXPECTED – частоты (Eij = Ni.×N.j/N), ожидаемые в случае независимости переменных (N – общая сумма частот в таблице);
RESID – изменение (Nij –Eij) частотыNijпо сравнению с ожидаемымEijв условиях независимости переменных;
SRESID –
стандартизованное изменение частоты
по сравнению с ожидаемым (Nij–Eij)/.
Напомним, что статистика хи-квадрат,
вычисляемая для проверки гипотезы
независимости рассматриваемых переменных,
является суммой квадратов этих величин.
ASRESID – стандартизованные изменения частоты Zij= (Nij–Eij)/σij, где σijвычисляется исходя из гипергеометрического распределенияNij(см. ниже п. 3.3.1). СтатистикаZijимеет асимптотически нормальное распределениеN(0,1);
ALL– вывод для клетки всех статистик.
Табл.3.4 получена в результате преобразования данных и применения процедурыCROSSTABSс параметромCELLS:
RECODE v4 (1,2 = 1)(3 = 2)(4 = 3) into W4.
VAR LAB W4 "Возможность удовлетворить территориальные требования Японии".
VAL LAB W4 1 "отдать" 2 "не надо" "не знаю".
CROSSTABS /TABLES = v1 BY W4 /CELLS = COUNT ROW col.
Верхний процент в клетке означает отношение числа объектов, попавших в эту клетку, к итоговой сумме числа объектов по строке. Нижний процент соответствует отношению значения клетки к итоговой сумме по столбцу. По величине процентов, приведенных в клетках, можно сравнивать группы респондентов по распределению как по значениям «вертикальной» переменной, так и по «горизонтальной».
В частности, анализируя первую строку матрицы (она соответствует ответам тех респондентов, которые считают, что иностранная помощь не нужна), видим, что основная часть – 81,7% этой группы респондентов против передачи островов Японии. При этом их доля среди тех, кто против передачи островов, составляет всего27,2%; а основная часть (62,0%) противников передачи островов допускает возможность получения ограниченной иностранной помощи. В последнем столбце таблицы расположены итоги по каждой строке, которые совпадают с распределением по переменнойv1. Так как до выполнения командыCROSSTABSбыли объявлены неопределенные значенияv1иv4, таблица рассчитывалась без их учета, поэтому объем выборки, учтенный в таблице, составил 712 анкет из 721 имеющихся. Аналогичные данные для столбцов приведены в строкеTOTAL.
Таблица 3.4