
Case_SPSS
.pdf
Федеральное государственное образовательное учреждение высшего профессионального образования «ФИНАНСОВЫЙ УНИВЕРСИТЕТ
ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»
(Финансовый университет)
Кафедра «Информационные технологии»
А.В.Золотарюк
ПРОФЕССИОНАЛЬНЫЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ:
ПРИМЕНЕНИЕ ПАКЕТА SPSS В СОЦИОЛОГИИ
Комплексные задания для самостоятельной работы
Для студентов, обучающихся по направлению 040100.62 «Социология»
Москва, 2013
Федеральное государственное образовательное учреждение высшего профессионального образования
«ФИНАНСОВЫЙ УНИВЕРСИТЕТ ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»
(Финансовый университет)
Кафедра «Информационные технологии»
А.В.Золотарюк
ПРОФЕССИОНАЛЬНЫЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ:
ПРИМЕНЕНИЕ ПАКЕТА SPSS В СОЦИОЛОГИИ
Комплексные задания для самостоятельной работы
Для студентов, обучающихся по направлению 040100.62 «Социология»
Одобрено рабочей группой кафедры «Информационные технологии»
Москва, 2013
|
ОГЛАВЛЕНИЕ |
|
ВВЕДЕНИЕ...................................................................................................................................................... |
3 |
|
1. ПАКЕТ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ SPSS...................................................... |
5 |
|
1.1. |
Общая информация о пакете SPSS и его структуре ................................................................. |
5 |
1.2. Задачи и ключевые возможности поставок пакета SPSS ......................................................... |
8 |
|
1.3. Схема обработки информации в SPSS ..................................................................................... |
15 |
|
1.4. Назначение и общие возможности модулей IBM SPSS.......................................................... |
17 |
|
1.5. Направления практического использования SPSS.................................................................. |
21 |
|
1.6. |
Работа в SPSS.............................................................................................................................. |
25 |
2. ПРИМЕР РЕШЕНИЯ ЗАДАЧИ В SPSS МЕТОДОМ КЛАСТЕРНОГО АНАЛИЗА.............. |
40 |
|
3. КОМПЛЕКСНОЕ ЗАДАНИЕ НА ОСВОЕНИЕ ТЕХНОЛОГИИ ИСПОЛЬЗОВАНИЯ |
|
|
ПАКЕТА SPSS ....................................................................................................................................... |
46 |
|
3.1. |
Общие сведения ........................................................................................................................ |
46 |
3.2. Исходные данные для многомерного статистического анализа .......................................... |
47 |
|
2.3. Методы исследования и защита работы................................................................................. |
49 |
|
ЛИТЕРАТУРА ............................................................................................................................................. |
50 |
2
ВВЕДЕНИЕ
Знание тренда общественных настроений, вызванных различными социально-экономическими процессами, позволяет за счет компетентных решений руководителей нивелировать негативные явления, поддерживать и развивать положительное, что способствует развитию государства, укреплению его экономической и военно-политической мощи, обеспечивает рост народного благосостояния, в первую очередь особо нуждающихся.
Наличие информации, собираемой в ходе исследований общественного мнения, недостаточно для выработки позитивных управленческих воздействий. Необходима ее научно-обоснованная статистическая обработка с целью получения обобщенных результатов, извлечения из массивов исходных данных нетривиальных, явно не просматривающихся знаний, представления итоговых показателей в наглядном графическом виде.
Социологи для обработки накопленных данных применяют пакет SPSS (IBM SPSS Statisics) либо пакет Statistica. Первый пакет является более предпочтительным, так как он, по своей сути, ориентирован, прежде всего, на социологию.
Рабочая программа учебной дисциплины «Профессиональные компьютерные программы», входящей в вариативную часть обязательных дисциплин математического цикла Федерального государственного образовательного стандарта высшего профессионального образования по направлению 040100.62 «Социология», предусматривает изучение и того, и другого пакетов как профессионально-ориентированных компьютерных систем, способствующих решению прикладных задач социологической сферы деятельности.
К сожалению, в ходе практических занятий в вузе, осваивать технологию работы в SPSS часто не представляется возможным из-за отсутствия пакета в перечне установленных лицензионных программ корпоративной сети образовательного учреждения. Причинами такой ситуации являются, прежде всего, очень высокая стоимость лицензий на использование SPSS, а также затруднения в установке бесплатной, ограниченной по срокам использования, ознакомительной версии пакета в нужное время, в соответствие с расписанием учебных занятий, на часть компьютеров разветвленной сети вуза.
3
Решением проблемы было бы наличие облачной версии пакета, но, к сожалению, фирма IBM, как разработчик SPSS, пока не планирует переход на облачные технологии.
Таким образом, выход из создавшейся ситуации может быть только один: перенести практическое освоение пакета SPSS на самостоятельную работу студентов, предоставив им все методические и технологические материалы по скачиванию и установке ознакомительной версии пакета на личный компьютер и его использованию в ходе решения внеаудиторной лабораторной работы по тематике предметной области социолога.
В настоящих комплексных заданиях описывается общая характеристика пакета SPSS и его применение. Приводится тематика исследовательской внеаудиторной лабораторной работы, требования к ее выполнению, оформлению и публичной защите. Даны массивы исходных данных для каждого из вариантов.
Выполнение заданий требует от студентов проявления профессионально-ориентированных компетенций и знаний, приобретенных в процессе обучения в вузе, а также принятия самостоятельного решения на каждом из технологических этапов работы, выбора наиболее приемлемого пути продолжения аналитического исследования.
4

1. ПАКЕТ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ SPSS
1.1. Общая информация о пакете SPSS и его структуре
Пакет SPSS (Statistical Package for the Social Sciences — cтатистический пакет для социальных наук) изначально1 был разработан как компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в социальных науках.
В2009 г. пакет стал называться PASW Statistics (Predictive Analytics
SoftWare – интеллектуальное аналитическое программное обеспечение).
С июля 2009 г. пакет сопровождается фирмой IBM (International Business Machines) под именем IBM SPSS Statisics.
В2013 г. планируется выход очередной версии пакета - IBM SPSS Statistics 22, работающей под управлением различных операционных систем
-Windows, MacOsX, Linux.
Имея модульную структуру, пакет SPSS обеспечивает комплексную статистическую обработку – от планирования до управления данными, выполнения анализа и представления результатов. Мощные средства анализа и обработки данных с развитым графическим интерфейсом, удобные меню и простые диалоговые окна существенно упрощают работу пользователя.
Основные блоки SPSS:
редактор данных - гибкая система, внешне похожая на электронную таблицу, служит для определения, ввода, редактирования и просмотра данных;
визуализатор - средство просмотра, упрощающее отображение результатов, позволяющее показывать и скрывать отдельные элементы вывода, изменять порядок вывода результатов, перемещать готовые к презентации таблицы и диаграммы в другие приложения и получать их из других программных приложений;
многомерные мобильные таблицы – служат для отображения результатов анализа, позволяя исследовать таблицы, перемещая строки, столбцы и слои и, таким образом, выявлять важные моменты, которые могут потеряться в стандартных отчетах. Обеспечивают также сравнение групп, расщепляя таблицы таким
1Первоначально пакет SPSS был разработан в 1968 г. в Чикагском университете; разработчики пакета:
Норман Най, Хедли Халл, Дейл Бент
5
образом, чтобы каждый раз на экран выводилась только одна группа;
высококачественная графика – средство формирования полноцветных диаграмм с высоким разрешением: круговых и линейчатых диаграмм, гистограмм, диаграмм рассеяния, объемных диаграмм и многих-многих других;
доступ к базам данных - конструктор чтения баз данных, позволяющий легко, несколькими нажатиями кнопки мыши, загружать данные из любых источников;
преобразование данных - средство преобразования данных, помогает готовить данные к анализу: можно с легкостью выделять подмножества в данных, объединять категории, добавлять, агрегировать, сливать, расщеплять и транспонировать файлы, а также проводить другие преобразования;
Справочная система – комплекс средств поддержки начинающего пользователя, включающий:
-электронный учебник, содержащий детальный обзор средств
и возможностей пакета; |
|
- контекстную справку, помогающую |
разобраться в |
конкретных задачах при работе с диалоговыми окнами;
-всплывающие определения, объясняющие статистические термины в мобильных таблицах;
-репетитор по статистике, помогающий в поиске необходимой процедуры обработки;
- примеры анализа, облегчающие |
интерпретировать |
результаты в аналогичных типовых задачах;
командный язык, обеспечивающий доступ к дополнительным функциональным возможностям пакета, недоступным через меню и диалоговые окна, и позволяющий сохранять и автоматизировать различные повторяющиеся процессы и задачи. Полная документация по командному языку интегрирована в справочную систему и доступна в виде отдельного PDF-документа «Руководство по синтаксису», который можно вызвать в меню команды
«Справка».
Предусмотрены различные варианты поставки продуктов IBM SPSS
Statistics:
6
IBM SPSS Statistics Standart – включает основные аналитические возможности для решения широкого спектра хозяйственных и исследовательских задач;
IBM SPSS Statistics Professional – дополнительно содержит средства,
связанные с обеспечением качества данных и их полноты, а также автоматизации функций статистики и прогнозирования;
IBM SPSS Statistics Premium – включает полный набор аналитических методик, систему моделирования на основе структурных уравнений (SEM), средства подробной оценки и проверки выборочных данных, процедуры прямого маркетинга.
IBM SPSS Statistics for Education (только на английском языке) –
включает основные модули, популярные в учебном процессе (для студентов, сотрудников и преподавателей).
В настоящее время пакет представляет собой полнофункциональную исследовательскую систему для статистической обработки и анализа разноплановой информации - бизнес-структурами, представителями государственных органов, научными подразделениями, академическими организациями и вузами. Результаты анализа можно наглядно представлять в виде таблиц и диаграмм различных типов, распространять сетевым пользователям, внедрять полученные результаты в другие программные системы.
Последние версии пакета обладают мощными аналитическими инструментами и средствами ускорения работы, позволяют проще и быстрее выявлять ценную информацию в данных, делать более точные прогнозы и обеспечивать большую отдачу от аналитики при решении прикладных задач. Они содержат все современные средства импорта-экспорта данных, предобработки, реструктуризации и визуальной категоризации данных. Обеспечиваются широкие возможности имитационного моделирования данных с заданными характеристиками методом Монте-Карло (в т.ч., с характеристиками фактических данных, формой распределения и связями между переменными). Тем самым предоставляется возможность специалистам, связанным с планированием и моделированием затрат и рисков, надежнее оценивать диапазон возможных значений прогнозируемого показателя и оценивать его отклик при воздействии на управляемые переменные.
7
1.2. Задачи и ключевые возможности поставок пакета
SPSS
Профессиональная поставка пакета SPSS Statistics Professional
обеспечивает решение всех задач полного жизненного цикла углубленного,
нестандартного анализа – качества данных, их сложности, автоматизации и прогнозирования.
Ключевые возможности профессиональной поставки реализуются множеством инструментальных средств и процедур.
1.Линейные модели включают разнообразные процедуры регрессионного и расширенного статистического анализа, спроектированные с учетом присущих характеристик составных отношений описания данных. Они предполагают применение:
обобщенных линейных смешанных моделей (GLMM) для работы с иерархическими данными;
процедур общих линейных моделей (GLM) и смешанных моделей;
обобщенных линейных моделей (GENLIN):
-линейной регрессии для ответов с нормальным распределением;
-логарифмических моделей для двоичных данных;
-логарифмически-линейных моделей для данных подсчета;
-реализации других полезных статистических моделей с использованием самых общих формулировок;
процедур обобщенных оценочных уравнений (GEE), расширяющих обобщенные линейные модели для возможности обработки связанных осевых и сгруппированных данных.
2.Нелинейные модели предоставляют возможность применять к данным более сложные модели. Они обеспечивают использование:
полиномиальной логарифмической регрессии (MLR) для прогнозирования категорийных исходов с числом категорий больше двух;
двоичной логарифмической регрессии для разбивки данных на две группы;
нелинейной регрессии (NLR) и ограниченной нелинейной регрессии (CNLR) для оценки параметров нелинейных моделей;
пробит-анализа для оценки значения стимулов.
8
3.Настраиваемые таблицы позволяют пользователям легко определять суть данных и быстро выводить обзор результатов в разных стилях для разных потребителей:
при наличии дедуктивной статистики можно сравнивать средние значения и соотношения для демографических групп, сегментов потребителей или других категорийных переменных;
обеспечивается формирование итоговой статистики (от простых подсчетов категорийных переменных до величин дисперсии) и сортировка категорий по любому из используемых итогов статистики;
предусмотрено использование трех тестов значимости:
-проверка независимости по критерию хи-квадрат;
-сравнение средних значений столбцов (проверка по критерию Стьюдента);
-сравнение соотношений столбцов (проверка по z-критерию);
интерактивный редактор таблиц позволяет:
-создавать сводные таблицы с помощью мыши;
-исключать определенные категории;
-показывать ячейки с отсутствующими значениями;
-добавлять в таблицы промежуточные итоги;
таблицы можно просматривать в реальном режиме времени и изменять по мере создания;
таблицы можно экспортировать в документы Microsoft Word, Excel, PowerPoint или HTML для использования в отчетах.
4.Подготовка данных рационализирует этап подготовки данных аналитического процесса:
позволяет определить подозрительные или недопустимые варианты, переменные и значения данных;
позволяет просматривать шаблоны отсутствующих данных и создавать обзоры распределений переменных;
функция Optimal Binning позволяет найти наилучший исход из возможных для алгоритмов, предназначенных для номинальных атрибутов;
9