Лабораторная № 1.
SPSS
1. Подготовка эмпирических данных в прикладной эпидемиологии
Цель работы – обучение созданию базы данных и основам работы с пакетом программ SPSS.
Ход работы
Методические указания: при выполнении работы используйте предложенный алгоритм (выделен полужирным шрифтом); после выполнения каждого задания сохраняйте матрицу данных в своей папке.
Определите переменные, как предложено в таблице 1.1. При выполнении этого необходимо помнить, что в столбце ИМЯ длина вводимого имени – до 8 символов; запрещены слова: all, and, or, not, with, by, to, eq, ne, lt, le, gt, ge; запрещены символы: пробел, !, ?, ' и *; имя не может заканчиваться точкой; каждое имя должно быть уникальным; имена нечувствительны к регистру.
Таблица 1.1.
Определяемые переменные.
Имя |
Тип |
Ширина
|
Знаков после запятой |
Метка |
Значения |
Номер
|
Числовой |
3 |
0 |
Порядковый номер
|
|
Пол
|
Текстовый
|
2 |
0 |
Пол больного
|
м="мужской" ж="женский" |
Возраст
|
Числовой |
3 |
0 |
Возраст больного
|
|
Рост
|
Числовой |
3 |
2 |
Рост, м
|
|
Вес
|
Числовой |
3 |
0 |
Вес, кг
|
|
Курение
|
Числовой |
2 |
0 |
Сведения о курении |
0="не курит" 1="до 10 сигарет" 2="10-20 сигарет" 3="более 20 сигарет" |
Алкоголь
|
Числовой |
2 |
0
|
Употребление алкоголя
|
0="не употребляет" 1="1 раз в месяц" 2="1 раз в неделю" 3="2-3 раза в неделю" 4="ежедневно" |
АДдиаст
|
Числовой |
3 |
0 |
Артериальное давление диастолическое |
|
АДсист
|
Числовой |
3 |
0 |
Артериальное давление систолическое |
|
АДдиаст2 |
Числовой |
3 |
0 |
Артериальное давление диастолическое через месяц |
|
АДсист2 |
Числовой |
3 |
0 |
Артериальное давление систолическое через месяц |
|
Вид в SPSS представлен на рис. 1.1.
Рис. 1.1. Вкладка Variable View.
Создайте базу данных, состоящую из 50 человек, на основе предложенной (Приложение 1, таблица 1).
Добавьте в список еще одного больного:
- вставьте пустую строку после строки № 20;
- присвойте больному № 26;
- введите для него произвольные данные.
Алгоритм действий:
Окно редактора данных (Представление Данные): Правка > Перейти к наблюдению > ввести номер искомого наблюдения > Перейти
Окно редактора данных (Представление Данные): выделить строку с переменной, перед которой должна быть вставка > вызвать контекстное меню (правой кнопкой мыши) > Вставить наблюдения.
Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных.
В SPSS существует много возможностей для модификации данных. К важнейшим из них относятся:
Вычисление новых переменных путем использования различных арифметических выражений (математических формул)
Подсчет частоты появлений определенных значений
Перекодирование значений
Вычисление новых переменных при выполнении определенного условия
Агрегирование данных
Ранговые преобразования
Вычисление весов наблюдений
После переменной Вес создайте переменную ИМТ - "индекс массы тела":
- определите новую переменную, задайте для нее необходимые параметры (тип вводимых данных – числовой, ширина – 2, знаков после запятой – 1, метка – индекс массы тела, кг/м2);
- вычислите ИМТ=вес(кг)/рост2(м);
Алгоритм действий:
Окно редактора данных: Преобразование > Вычислить переменную > ввести имя вычисляемой переменной в окно Целевая переменная > в окне Числовое выражение задать формулу для вычисления, с использованием арифметических выражений и стандартных математических функций > OK (рисунок 1.2)
Рис. 1.2. Вид функции Вычислить переменную
Создайте переменную Результат "Соответствие между массой человека и его ростом ":
- вставьте новую переменную после переменной ИМТ;
- определите и задайте все параметры новой переменной (тип вводимых данных – текстовый, ширина – 8, знаков после запятой – 0, метка – соответствие между массой человека и его ростом);
- воспользовавшись таблицей 1.2, вычислите значения новой переменной через перекодировку результатов ИМТ.
Таблица 1.2
Соответствие ИМТ и статусом человека
Индекс массы тела |
Соответствие между массой человека и его ростом |
16 и менее |
Анорексия |
16 – 18,4 |
Дефицит массы тела |
18,5 – 24,9 |
Норма |
25 -29,9 |
Избыточный вес |
30 и более |
Ожирение |
Алгоритм действий:
Преобразование > Перекодировать в другие переменные > перенести имя перекодируемой переменной в окно Входная переменная Выходная переменная > ввести имя новой переменной в отрывшееся окно Выходная переменная > кнопка Старые и новые значения > в разделе Старые значения выбрать один из трех вариантов интервалов Диапазон (с двумя границами, с открытой верхней границей или с открытой нижней границей) > задать границы интервалов > в разделе Новое значение выбрать Значение > ввести новое значение > кнопка Добавить (правило перекодировки появится в окне) > задать последовательно все правила перекодировки, проверить их наличие в окне > Продолжить > Изменить > OK (рис. 1.3)
Рис. 1.3. Вид функции Перекодировать в другие переменные
Проверьте правильность вычисления переменной Результат:
- упорядочьте больных по убыванию переменной ИМТ;
- убедитесь, что значения индекса соответствуют результатам;
- при необходимости исправьте ошибки в правилах перекодировки.
Алгоритм действий:
Окно редактора данных (закладка Представление Данные): выделить столбец с переменной, по которой производится сортировка > вызвать контекстное меню (правой кнопкой мыши) > Сортировать по возрастанию или Сортировать по убыванию.
Осуществите "набор" из числа больных, у которых систолическое артериалное давление выше 120 мм.рт.ст.:
- упорядочьте матрицу данных по убыванию переменной АДсист;
- с помощью фильтра выделите больных, не соответствующих условию.
Алгоритм действий:
Окно редактора данных: Данные > Отобрать наблюдения… > в разделе Выбрать выбрать Если выполнено условие > кнопка Если… > в открывшемся окне задать критерии отбора, используя логические операторы > Продолжить > OK (рис. 1.4)
Рис. 1.4. Вид функции Отобрать наблюдения: Условия
Для снятия фильтра в разделе Выбрать выбрать Все наблюдения.
Проверьте качество ввода данных по одномерным распределениям (рис 1.5.) переменных Рост, Вес, Курение, Алкоголь.
При необходимости исправьте ошибки ввода.
Алгоритм действий:
Анализ > Описательные статистики > Частоты… > имена нужных переменных в окно Переменные > OK.
Рис. 1.5. Вид одномерных распределений в SPSS.
Постройте таблицы сопряженности (рис. 1.6.) между переменными Пол и Курение; Пол и Алкоголь.
Алгоритм действий:
Анализ > Описательные статистики > Таблицы сопряженности… > имя переменной, образующей строки таблицы, в окно Строки > имя переменной, образующей столбцы, в окно Столбцы > OK.
Рис. 1.6. Вид таблицы сопряженности в SPSS.
