
- •Занятие 1.
- •1. История spss
- •2. Запуск программы spss. Интерфейс программы.
- •3. Порядок ввода данных в таблицу.
- •4. Исследование основных случайных переменных группы.
- •Обнаружение ошибок ввода.
- •Описание файла. Исследуемые переменные:
- •Определение статистических параметров переменных и поиск ошибок исходных данных
- •Анализ ошибок.
- •Очистка данных от ошибочных значений
4. Исследование основных случайных переменных группы.
4.1 После ввода данных по переменным Vozrast (Возраст), Ves (Вес), Rost (Рост), Noga (Размер обуви), Pol (Пол), Volos (Цвет волос), Glaz (Цвет глаз) проверим еще раз кодировку текстовых переменных: в порядке нарастания какого-либо признака
a. Пол: 1 – М, 2 – Ж (произвольный порядок кодировки)
b. Цвет волос: кодировка от светлого к темному 1 – блондин, 2 – русый, 3 – шатен, 4 – брюнет.
c. Цвет глаз: кодировка 1 – голубой, 2 – серый, 3 – зеленый, 4 – карий.
4.2. Создание новой переменной на основе существующих. Создать переменную RV, значения которой были бы равны разности между значениями роста и веса для каждого участника. (Transform/Compute, далее с помощью панели настройки вычислений определить новую переменную).
4.3. Определение статистических параметров случайных переменных (Analyze/Descriptive statistics/Descriptives, в диалоговом окне щелкнуть по кнопке Options и установить нужные параметры):
Mean (Среднее)
Variance (Дисперсия)
Std.deviation (Стандартное отклонение)
S.E.mean(Ошибка среднего)
Minimum (Минимальное значение)
Maximum (Максимальное значение)
Выполнить вычисления:
Для всей совокупности
Отдельно для мужчин и женщин. Отбор данных с помощью меню Data/Select cases, в диалоговом окне установить переключатель if condition is satisfied, затем щелкнуть по кнопке IF и в следующем диалоговом окне установить условие отбора, для мужчин это Pol = 1. По окончании вычислений не забыть отменить условие отбора.
Сравнить значения ошибки среднего и стандартного отклонения. Показать, что среднее значение существенно меньше подвержено влиянию статистического разброса.
4.4. Графическое представление данных на примере роста и веса:
Bar
Line
Histogram
4.5. Определение зависимости между переменными. Analyze/Correlate/Bivariate, включить в анализ все введенные переменные. Проанализировать величины коэффициентов корреляции с точки зрения здравого смысла, определить минимальный и максимальный (по абсолютной величине) коэффициенты корреляции. Например, рост и размер обуви должны быть сильно связаны между собой, а вес и цвет волос нет.
4.6. Более детальный анализ зависимости переменных.
Для переменных Размер обуви и Рост построить график типа Scatter (Graphs/Scatter, ось Х – Рост, ось Y – Размер обуви). Объяснить по графику, в чем проявляется зависимость между переменными.
Построить график линейной регрессии (Analyze/Regression/Curve estimation, в диалоговом окне поставить флажок на опции Linear, Independent – Рост, Dependent – Размер обуви). Объяснить смысл линейного графика, показать параметры линейной зависимости и как эту зависимость можно использовать.
Построить таблицу пересечений (Analyze/Descriptive statistics/CrossTabs, столбцы – Рост, строки – Размер обуви) для тех же переменных. Показать, как можно наблюдать зависимость.
Повторить построения для переменных Цвет волос и Рост. Показать, чем отличаются графики, построенные по независимым переменным.
4.7. Вычисление средних значений одной переменной при условии фиксированных значений другой переменной (Analyze/Compare means/Means, Independent list – Пол, Dependent list – Рост).
Когда данные введены в компьютер, не следует сразу же приступать к анализу. На первом этапе сами данные следует подвергнуть подробному и всестороннему исследованию. Подобное исследование преследует три основных цели:
Обнаружение ошибок ввода,
Проверка закона распределения,
Описание данных подходящими статистическими характеристиками.