- •Вопросы к экзамену по курсу «Методы обработки и анализа информации в сфере молодежной политики»
- •1. Статистические закономерности в анализе социологической информации.
- •2. Моделирование социальной реальности.
- •3. Специфика математико-статистических методов применительно к социологической информации.
- •4. Задачи математики применительно к социологической информации.
- •5. Сложности использования математических методов в социологии.
- •1. Проблема соотношения выборки и генеральной совокупности
- •2. Отсутствие строгих обоснований возможности применения конкретных методов математической статистики. Эвристичность (непредсказуемость)многих алгоритмов анализа данных
- •6. Программно-аналитический комплекс «spss»: общая характеристика.
- •2. Краткая история возникновения и развития spss.
- •3. Модули программы spss
- •7. Подготовка и создание базы данных в spss: подготовка социологических данных к обработке (в т.Ч. Дихотомический и категориальный способы кодировки).
- •8. Корректировка базы данных.
- •9. Методы анализа одномерных распределений: описание и графическое представление социологических данных, построение таблиц частотного распределения для многозначных вопросов.
- •10. Модификация массива социологических данных: перекодирование с созданием новых переменных, перекодирование в старых переменных, условный отбор данных.
- •11. Меры центральной (средней) тенденции.
- •12. Шкалирование и виды шкал.
- •13. Меры разброса.
- •14. Показатели распределения признака.
- •15. Стандартизация показателей.
- •16. Таблицы сопряженности.
- •17. Коэффициенты критерия «хи-квадрат» и его вычисление в spss.
- •18. Меры связанности для переменных номинальной шкалы: симметричные и направленные меры.
- •3.1. Симметричные меры
- •3.2. Направленные меры
- •19. Меры связанности для переменных порядковой (ранговой) шкалы.
- •20. Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки.
- •Ошибки выборки
- •Необходимый объем выборки
2. Краткая история возникновения и развития spss.
Первая версия программно-аналитического комплекса SPSS появилась в 60-х гг. ХХ в. в США. В то время (1965 г.) два студента Норман Най (Norman Nie) и Дейл Бент (Dale Bent), специализировавшиеся в области политологии, попытались отыскать в Стенфордском университете в Сан-Франциско компьютерную программу, подходящую для анализа социологической информации. Вскоре они разочаровались в своих попытках, т.к. имеющиеся программы не удовлетворяли потребностей социологов, были либо неудачно построены, либо не обеспечивали наглядность представления обработанной информации. К тому же принципы
пользования менялись от программы к программе. Тогда они решили разработать свою собственную программу, со своей концепцией и единым синтаксисом.
В их распоряжении в то время был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана новая версия программы, которая еще через год (1967 г.) могла работать на IBM 360. Программы того периода времени представляли собой пакеты перфокарт. На это указывает и исходное название программы, которое авторы дали своему продукту. SPSS – это аббревиатура: Statistical Package for Social Science.
В 1970 г. работа над программой была продолжена на базе Чикагского университета. К середине 70-х гг., когда стало ясно, что программное обеспечение – это своего рода товар, который приносит прибыль, Норман Най организовал новую специальную фирму по разработке и усовершенствованию созданной ими программы. К тому моменту было произведено уже 60 инсталляций программы SPSS. Первое руководство для
пользователей описывало 11 различных процедур. В это время SPSS отделяется от пакета NORC, на базе которого первоначально формировалась.
Спустя 5 лет программа была инсталлирована уже 600 раз, причем под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера.
В 1975 г. была разработана 6-я версия (SPSS 6). В период до 1981 г. вышли версии 7, 8, 9. Командный язык (синтаксис), используемый в SPSS, в то время был еще не так хорошо развит, как сегодня, и, естественно, он был ориентирован на перфокарты. Поэтому так называемые управляющие карты
состояли из идентификационного поля, представляющего собой столбцы 1-15, и поля параметров (столбцы 16-80). В 1983 г. командный язык программы был полностью переработан, синтаксис стал значительно удобней. Чтобы
отметить этот факт, программа была переименована в SPSSХ, где буква Х должна служить и номером версии в римских числах, и сокращением для extended (расширенный).
\ Год от года постоянно увеличивалось и количество процедур.
С появлением персональных компьютеров была разработана РС-версия SPSS. В 1983 г. появилась версия SPSS/PC+, рассчитанная на операционную систему MS-DOS. Позже, с момента основания в 1984 г. европейского
торгового представительства в Горинхеме в Нидерландах и благодаря основанию в 1968 г. филиала в Мюнхене, SPSS стала широко применяться и в Германии.
В России первый запуск программы SPSS произошел 13 февраля1982 г. В настоящее время это самое распространенное пользовательское приложение для статистического анализа во всем мире. Для того, чтобы отразить возможность использования программы во всех областях, имеющих отношение к статистическому анализу, буква Х была вновь удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности). Если версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ, то SPSS для операционной системы Windows (SPSS for Windows) стала большим шагом вперед. Эта версия программы, во-первых, обладает всеми возможностями версии для больших ЭВМ; во-вторых, за некоторыми немногочисленными исключениями программой можно пользоваться без особых знаний в области прикладного программирования. Не случайно данную программу называют пакет для домохозяек. Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, т.е. с помощью мыши и соответствующих диалоговых окон. Первая версия SPSS for Windows имела порядковый номер 5. Затем последовали 6.0 и 6.1 с некоторыми нововведениями в статистической и графической областях. Версия 6.1 была первой статистической программой для Windows, которая использовала 32-битную архитектуру Windows 3.1. Это можно было заметить по более высокой скорости выполнения вычислений. Усовершенствования также коснулись и интерфейса пользователя. В конце концов была выпущена версия 6.1.3, которая уже могла работать и в Windows 95, и в NT. В начале 1996 г. появилась 7-я версия программы SPSS. (7.0, затем 7.5). Наряду с расширением возможностей в сфере статистики разница между версиями заключалась в том, что последняя была выполнена на немецком языке. Причем 7-я версия могла работать лишь при наличии Windows 95 (NT). Прогресс 8-й версии заключался в усовершенствовании графической оболочки. Возможность составления интерактивных графиков предоставляет ряд преимуществ по сравнению с традиционными графиками, которые являются стандартом для многих других пакетов.
Версия 9.0 включает в себя несколько новых статистических методов, в том числе многозначную логистическую регрессию, и новые графические возможности.
Версия 10.0 имеет 2 существенных отличия по сравнению с предыдущими версиями.
1. Благодаря закладкам «Просмотр данных» и «Просмотр переменных» облегчен переход между полем ввода данных и описанием переменных, т.е. форма описания переменных была упрощена и стала соответствовать общепринятым стандартам, применяемым в сфере табличных расчетов.
2. В области статистики добавлен регрессионный анализ с целевой переменной, относящейся к порядковой шкале.
Большинство изменений в версии SPSS 11.0 связано с усовершенствованием и добавлением статистических процедур.
1. Появилась новая процедура «Descriptive ratio statistics» (дескриптивные статистики отношений).
2. В функцию «Advanced Model» (усложненные модели) добавлена новая статистическая процедура «Linear mixed models» (Смешанные линейные модели), известная как «Hierarchical Linear Models» (Иерархические линейные модели), которая используется для получения наиболее точной прогнозирующей модели при работе с вложенной структурой данных.
3. Улучшена масштабируемость и повышена производительность функций многомерной логистической регрессии («Multinomial Logistic Regression»), иерархического кластерного анализа («Hierarchical Cluster Analysis»).
4. Скорость выполнения иерархического кластерного анализа возросла от 5 до 50 раз в зависимости типа вычислений. А скорость выполнения мультиноминальной логистической регрессии и общих линейных моделей («General Linear Models») увеличилась в 10 раз.
5. Появилась возможность к доступу данных только для чтения.
6. Повышена защита данных путем шифрования при обмене между клиентом и сервером SPSS.
Сегодня пакет содержит все основные разделы анализа данных и во многих зарубежных и отечественных университетах является базовым для преподавания анализа данных студентам гуманитарного направления. Следует заметить, что практически ежегодно выпускается новая версия SPSS, постоянно изменяется дизайн, появляются новые программы и возможности работы с пакетом.
