- •Рабочая программа дисциплины (модуля)
- •1. Цели освоения дисциплины Статистический анализ данных (spss)
- •2. Место дисциплины в структуре ооп бакалавриата
- •3. Компетенции обучающегося, формируемые в результате освоения дисциплины Статистический анализ данных (spss).
- •4. Структура и содержание дисциплины Статистический анализ данных (spss).
- •Тематический план учебной дисциплины 4 семестр очная форма
- •Тема 1. Введение в spss для Windows.
- •Тема 2. Чтение данных из Excel, баз данных и текстовых файлов.
- •Тема 3. Определение атрибутов переменных и меток.
- •Тема 4. Итожащие статистики для отдельных переменных.
- •Тема 5. Изменение значений данных.
- •Тема 6. Выявление взаимосвязей между переменными.
- •Тема 7. Создание и редактирование диаграмм.
- •Тема 8. Вывод результатов в spss.
- •Тема 9. Введение в командный язык (синтаксис) spss.
- •5. Образовательные технологии
- •6. Учебно-методическое обеспечение самостоятельной работы студентов. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины.
- •7. Учебно-методическое и информационное обеспечение дисциплины
- •8. Материально-техническое обеспечение дисциплины
- •Вопросы к экзамену.
- •Сведения о файле данных
- •Ввод и чтение данных
- •Свойства переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных
- •Преобразование значений данных
- •Вопросы:
- •Изучение связи между категориальными переменными
- •Вопрос:
- •Вопрос:
- •Мобильные таблицы
- •Создание диаграмм
- •Задание параметров плана выборки
- •Частоты и описательные статистики
- •Таблицы сопряженности
- •Отношения
- •Контрольная работа для студентов курсу Статистический анализ данных spss
- •Ввод и чтение данных. Описание переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных.
- •Преобразование данных
- •Изучение связи между категориальными переменными
- •Мобильные таблицы
- •Создание диаграмм
Таблицы сопряженности
Откройте файл данных SPSS exer_property_assess_sample.sav. Этот файл содержит выборку владений, отобранных в ходе выполнения упражнений к Главе 3.
Откройте (выберите в меню Файл..Открыть..Синтаксис) файл синтаксиса NewPropertyValues.sps. Команды синтаксиса в этом файле моделируют новые значения оценки стоимости владений в выборке. Выберите в меню Запуск..Все, чтобы создать новые переменные.
Для проведения последующего анализа используйте файл exer_property_assess.csplan, созданный в ходе выполнения упражнений к Главе 3, в качестве файла плана отбора.
Создайте таблицу сопряженности с переменной Категория нового значения оценки стоимости владения [newcat] в строках таблицы и Категория количества лет, прошедших с момента последней оценки [timecat] в столбцах таблицы. Запросите параметр процент по столбцу. Исследуйте выведенную таблицу сопряженности и охарактеризуйте разницу процентов в категориях оценки в обоих столбцах (категориях по сроку, прошедшему с момента последней оценки ).
Повторите указанные выше шаги анализа, используя ВПР план отбора и выборку, сформированную в ходе выполнения упражнений к Главе 3. Не забудьте указать файл данных SPSS, содержащий вероятности совместного включения.
Отношения
Откройте файл данных SPSS exer_property_assess_sample.sav. Этот файл содержит выборку владений, отобранных в ходе выполнения упражнений к Главе 3.
Откройте (выберите в меню Файл..Открыть..Синтаксис) файл синтаксиса SPSS NewPropertyValues.sps. Команды синтаксиса в этом файле моделируют новые значения оценки стоимости владений в выборке. Выберите в меню Запуск..Все, чтобы сгенерировать новые переменные.
Для проведения последующего анализа используйте файл exer_property_assess.csplan, созданный в ходе выполнения упражнений к Главе 3, в качестве файла плана отбора.
Оцените отношение Нового значения оценки стоимости владения [newval] к Последнему значению оценки стоимости владения [lastval] и задайте вывод соответствующей стандартной ошибки и 95%-ого доверительного интервала.
Повторите анализ с переменной Категория количества лет, прошедших с момента последней оценки [timecat] в качестве переменной, задающей подсовокупности. Опишите результаты.
Повторите анализ с Район [county] в качестве переменной, задающей подсовокупности. Опишите результаты.
Повторите указанные выше шаги анализа, используя ВПР план отбора и выборку, созданную в ходе выполнения упражнений к Главе 3. Не забудьте указать файл данных SPSS, содержащий вероятности совместного включения.
Простые таблицы с категориальными переменными
Для выполнения заданий откройте файл данных smgss91.sav.
Создайте простую частотную таблицу по переменной Является ли жизнь волнующей или унылой? [life]. Вместо частот в качестве итожащей статистики задайте проценты.
Вернитесь в диалоговое окно Настраиваемые таблицы и добавьте в таблицу итог; также следует скрыть метку итожащей статистики.
Создайте таблицу сопряженности с переменной Семейное положение [marital] в измерении столбцов и переменной Является ли жизнь волнующей или унылой? [life] в измерении строк.
Измените предыдущую таблицу. Вместо частот задайте в качестве итожащих статистик процент по столбцам (Сумма процентов для каждой категории семейного положения должна равняться 100%).
Вернитесь в диалоговое окно Настраиваемые таблицы и добавьте итоги для двух переменных в таблице.
Хотя Вы не проводили статистические тесты, можете ли Вы охарактеризовать взаимосвязь между семейным положением и восприятием жизни как интересной или скучной?
Сохраните полученный файл вывода с именем Tables2.spo. Файл вывода должен содержать пять таблиц, построенных в соответствии с заданиями 2.1-2.5.
Таблицы с категориальными переменными: состыковывание, вложение и слои
3.1. Создайте таблицу, содержащей состыковыванные переменные Является ли жизнь волнующей или унылой? [life] и Вера в жизнь после смерти [postlife] в измерении строк и переменной Уровень образования респондента [degree] в измерении столбцов.
Измените предыдущую таблицу, состыковав переменные Пол респондента [sex] и Уровень образования респондента [degree] в измерении столбцов, и задайте в качестве итожащей статистики процент по столбцам.
Вернитесь в диалоговое окно Настраиваемые таблицы и щелкните по кнопке Вставить. Изучите команду Ctable в синтаксисе, чтобы понять, каким образом производится состыковывание.
Вернитесь в диалоговое окно Настраиваемые таблицы. Удалите из таблицы переменную Является ли жизнь волнующей или унылой? [life] и вложите переменную Уровень образования респондента [degree] в переменную Пол респондента [sex] в измерении столбцов.
Сохраните полученный файл вывода с именем Tables3.spo. Файл вывода должен содержать три таблицы, построенные в соответствии с заданиями 3.1, 3.2, 3.4.
Итоги и подитоги
Создайте таблицу, содержащую проценты по столбцам по переменной Уровень образования респондента [degree] в измерении столбцов и переменной Является ли жизнь волнующей или унылой? [life] в измерении строк.
Добавьте итог по переменной Является ли жизнь волнующей или унылой? [life]. Задайте вывод частот в качестве итожащей статистики для итога.
Сохраните полученный файл вывода с именем Tables4.spo. Файл вывода должен содержать две таблицы, построенные в соответствии с заданиями 4.1, 4.2.
Таблицы для переменных с одинаковыми вариантами ответа
Создайте таблицу по двум переменным с одинаковыми вариантами ответа, которые представляют собой ответы респондента на вопросы Общая удовлетворенность жизнью [happy] и Удовлетворенность браком [hapmar]. Задайте вывод итогов и частот в качестве итожащих статистик.
Измените таблицу, задав вывод процентов.
Задайте проценты в качестве итожащих статистик для переменных, и частот в качестве итожащих статистик для итогов.
Сохраните полученный файл вывода с именем Tables5.spo. Файл вывода должен содержать три таблицы, построенные в соответствии с заданиями 5.1-5.3.
Итожащие статистики
Создайте таблицу сопряженности с переменными Является ли жизнь волнующей или унылой? [life] в измерении строк и переменной Семейное положение [marital] в измерении столбцов. В качестве итожащих статистик укажите проценты по столбцам (Сумма процентов для каждой категории семейного положения должна равняться 100%).
Вернитесь в диалоговое окно Настраиваемые таблицы и добавьте итог к переменной Семейное положение. Задайте вывод частот в качестве итожащей статистики для итога.
Вернитесь в диалоговое окно Настраиваемые таблицы и задайте вывод процентов по строкам.
Сохраните полученный файл вывода с именем Tables6.spo. Файл вывода должен содержать три таблицы, построенные в соответствии с заданиями 6.1-6.3.
Подытоживание количественных переменных
Создайте таблицу, содержащую средние значения переменных Количество лет, потраченных респондентом на образование [educ], Количество лет, потраченных супругом респондента на образование [speduc], Количество лет, потраченных матерью респондента на образование [maeduc], Количество лет, потраченных отцом респондента на образование [paeduc]. (Примечания: указанные переменные следует поместить в измерение столбцов).
Измените предыдущую таблицу так, чтобы средние значения включали в себя один знак после запятой.
Измените предыдущую таблицу, добавив в измерение строк переменную Регион взятия интервью.
Создайте таблицу с переменной Число часов в день, проводимых у телевизора [tvhours] в измерении столбцов и переменной Семейное положение [marital] в измерении строк. Добавьте итог по переменной Семейное положение [marital]. Задайте вывод среднего значения, медиана, максимального значения и количества валидных наблюдений в качестве итожащих статистик. Итожащие статистики должны располагаться в измерении строк.
Сохраните полученный файл вывода с именем Tables7.spo. Файл вывода должен содержать три таблицы, построенные в соответствии с заданиями 7.1-7.4.
Тесты значимости
Для выполнения заданий откройте файл данных gss96.sav.
Создайте таблицу с переменной За кого голосовали на выборах [pres92] в измерении строк и переменной Регион взятия интервью [region] в измерении столбцов. Исключите из таблицы категории Другое и Не голосовал (используя кнопку Категории и итоги в группе Показать), поскольку данные категории содержат малое количество ответов, и задайте вывод процентов по строкам.
Воспользуйтесь закладкой Статистические критерии, чтобы задать вывод Критерия независимости (хи-квадрат) и Сравнение пропорций столбцов (z-критерий). Существует ли зависимость между регионом и голосованием на президентских выборах? Какие регионы различаются по количеству голосовавших за Клинтона?
Создайте таблицу с переменной Число часов в день, проводимых у телевизора [tvhours] в измерении строк и переменной Семейное положение [marital] в измерении столбцов. Добавьте итог к переменной Семейное положение [marital]. Задайте вывод среднего значения с одним десятичным знаком.
Используйте закладку Статистические критерии для выбора теста Сравнение средних по столбцам (t-критерий). Какие категории респондентов с различным семейным положением отличаются друг от друга по среднему времени, проводимому у телевизора?
Сохраните полученный файл вывода с именем Tables8.spo. Файл вывода должен содержать четыре таблицы, построенные в соответствии с заданиями 8.1-8.4.
Наборы множественных ответов
Для выполнения заданий откройте файл данных smgss91.sav.
Используя диалоговое окно Наборы множественных ответов, создайте набор множественных ответов из переменных prob1, prob2, prob3 и prob4, которые содержат информацию об основных проблемах, с которыми столкнулся респондент.
Поэкспериментируйте с различными итожащими статистиками (сравните частоты и ответы, процент частоты и процент ответов), интерпретируя получаемые результаты.
Добавьте (состыкуйте) в таблицу переменные Пол респондента [sex] и Субъективная классовая принадлежность [class], чтобы сравнить различные демографические группы с точки зрения наличия проблем.
Добавьте в таблицы итоги, чтобы подытожить половые и классовые категории.
Сохраните полученный файл вывода с именем Tables9.spo. Файл вывода должен содержать три таблицы, построенные в соответствии с заданиями 9.2-9.4.