- •Рабочая программа дисциплины (модуля)
- •1. Цели освоения дисциплины Статистический анализ данных (spss)
- •2. Место дисциплины в структуре ооп бакалавриата
- •3. Компетенции обучающегося, формируемые в результате освоения дисциплины Статистический анализ данных (spss).
- •4. Структура и содержание дисциплины Статистический анализ данных (spss).
- •Тематический план учебной дисциплины 4 семестр очная форма
- •Тема 1. Введение в spss для Windows.
- •Тема 2. Чтение данных из Excel, баз данных и текстовых файлов.
- •Тема 3. Определение атрибутов переменных и меток.
- •Тема 4. Итожащие статистики для отдельных переменных.
- •Тема 5. Изменение значений данных.
- •Тема 6. Выявление взаимосвязей между переменными.
- •Тема 7. Создание и редактирование диаграмм.
- •Тема 8. Вывод результатов в spss.
- •Тема 9. Введение в командный язык (синтаксис) spss.
- •5. Образовательные технологии
- •6. Учебно-методическое обеспечение самостоятельной работы студентов. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины.
- •7. Учебно-методическое и информационное обеспечение дисциплины
- •8. Материально-техническое обеспечение дисциплины
- •Вопросы к экзамену.
- •Сведения о файле данных
- •Ввод и чтение данных
- •Свойства переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных
- •Преобразование значений данных
- •Вопросы:
- •Изучение связи между категориальными переменными
- •Вопрос:
- •Вопрос:
- •Мобильные таблицы
- •Создание диаграмм
- •Задание параметров плана выборки
- •Частоты и описательные статистики
- •Таблицы сопряженности
- •Отношения
- •Контрольная работа для студентов курсу Статистический анализ данных spss
- •Ввод и чтение данных. Описание переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных.
- •Преобразование данных
- •Изучение связи между категориальными переменными
- •Мобильные таблицы
- •Создание диаграмм
Подытоживание (обобщение) отдельных переменных
В этом упражнении анализируются данные о банковских служащих и подытоживаются данные по нескольким демографическим переменным и переменным по заработной плате. Такой вид анализа полезен для получения подытоживающей информации: например, насколько состоятельны сотрудники, максимальное и минимальное количество лет, потраченных на образование, каковы возраст и заработная плата.
1. Откройте файл NEWBANK4.sav, если он у Вас еще не открыт.
2. Запустите процедуру Частоты по переменным Категория сотрудника [jobcat], Национальное меньшинство [minority] и Пол сотрудника [gender], задав вычисление моды и построение столбиковых диаграмм. Просмотрите столбиковые диаграммы, чтобы лучше понять распределения значений этих переменных. К какой категории относится наибольшее число сотрудников, и к какой наименьшее?
3. Запустите процедуру Частоты по переменным Начальная заработная плата [salbeg] и Зарплата в настоящее время [salnow], запросив описательные статистики и гистограмму с нормальной кривой по каждой переменной. Отключите вывод таблицы частот.
4. Сохраните полученный файл вывода с именем NEWBANK5.spo.
Преобразование значений данных
В этом разделе мы исследуем данные о заработной плате различными путями, что потребует внесения некоторых изменений в данные. Во-первых, мы сгруппируем сотрудников в несколько категорий по величине заработной платы и посмотрим, сколько сотрудников попадает в каждую из категорий. Затем мы исследуем разницу между зарплатой в настоящее время и начальной зарплатой сотрудников.
1. Откройте файл NEWBANK4, если он у Вас еще не открыт. Выберите в меню Преобразовать..Перекодировать..В другие переменные и создайте новую переменную, которая группирует значения переменной Начальная заработная плата [salbeg] в 6 категорий (назовите переменную Группы по заработной плате [salgrp]).
Чтобы решить, какие диапазоны значений сгруппировать в категории, можно посмотреть на гистограмму или воспользоваться процедурой Визуальная категоризация. Для этого достаточно в диалоговом окне Визуальная категоризация щелкнуть по кнопке Границы интервалов... и в диалоговом окне Границы интервалов в группе Равные процентили ввести число 5 в поле Количество границ, так как именно 5 границ позволит создать 6 групп. Щелкните по кнопке Применить и в диалоговом окне Визуальная категоризация задайте содержательные метки для полученных категорий начальной заработной платы. Проверьте результаты перекодирования, запустив процедуру Частоты по переменной Группы по заработной плате [salgrp].
2. Воспользуйтесь процедурой Вычислить в меню Преобразовать для создания новой переменной [saldif], содержащей разности между переменными Зарплата в настоящее время [salnow] и Начальная зарплата [salbeg].
3. Запустите процедуру Описательные, чтобы получить информацию по созданной переменной [saldif].
Вопросы:
1. Можете ли Вы сказать, что есть такие сотрудники, начальная зарплата которых выше зарплаты в настоящее время?
2. Какая наибольшая разница в зарплате?
Чтобы оформить ответ на вопросы этого задания воспользуйтесь возможностью вставки текста в окне Вывода. (Совет: Чтобы вставить текст в файл Вывода SPSS щелкните по объекту Вывода, после которого Вам необходимо вставить текст, затем выберите в меню Вставка..Текст. Дважды щелкните по пустой рамке, появившейся после выделенного объекта Вывода, так чтобы рамка изменила свой статус на штриховую, и напечатайте необходимый текст внутри рамки).
5. Сохраните таблицы, полученные в Заданиях 1, 3 и ответы на вопросы Задания 3 в файле вывода NEWBANK6.spo, а измененные данные в файле NEWBANK6.sav.