Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПЗ2М-2 сем SPSS.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
1.63 Mб
Скачать

Занятие 2. Spss Исследование данных.

Сегодня мы более подробно остановимся на некоторых основных понятиях, с которыми непременно должен быть знаком пользователь, если он хочет использовать SPSS. В первую очередь сюда относятся предварительные оценки, которые выполняются перед проведением любого статистического теста:

1.Классификация переменных по статистическим шкалам

(об этом мы говорили на первом занятии по SPSS)

2.Проверка наличия нормального распределения.

3.Выделение независимых и зависимых выборок.

В большинстве случаев перед применением статистического теста ставится вопрос: каков характер заданных условий?

В частности, необходимо выяснить следующие моменты:

 К какой статистической шкале относится данная переменная?

 Если речь идёт о переменных с интервальной шкалой, то подчиняются ли они закону нормального распределения?

 Являются ли сравниваемые выборки зависимыми или независимыми? Другими словами нам необходимо провести исследование данных

Когда данные введены в компьютер, не следует сразу же приступать к анализу. На первом этапе сами данные следует подвергнуть подробному и всестороннему исследованию. Подобное исследование преследует три основных цели:

  •  Обнаружение ошибок ввода,

  •  Проверка закона распределения,

  •  Описание данных подходящими статистическими характеристиками.

  1. Обнаружение ошибок ввода.

Мы с вами уже касались этой задачи на прошлом занятии, но как говорят «повторение мать учения», поэтому еще раз вспомним основные способы обнаружения ошибок.

Самый точный метод проверки данных (то есть значений всех переменных) на ошибки при вводе состоит в том, чтобы командами меню Analyze (Анализ) Reports (Отчеты) Casesummaries... (Сводка наблюдений) вывести их список и сравнить каждое значение с оригиналом (например, анкетой). Однако этот способ требует очень много времени, особенно при большом объеме данных. Поэтому решиться на проведение такой скучной и утомительной работы можно только в редких случаях — как правило, когда объем данных ограничен.

В общем случае рекомендуется проводить частотный анализ значений переменных; для этого служат команды меню Analyze (Анализ) DescriptiveStatistics (Дескриптивные статистики) Frequencies... (Частоты). Результаты этого анализа при внимательном рассмотрении позволяют выявить недопустимые значения. Например, если переменная содержит данные роста в сантиметрах, то значение 384, обнаруживаемое при частотном анализе, явно свидетельствует о том, что в данных имеется ошибка. После проведения частотного анализа это значение можно отыскать в файле данных и исправить. Следовательно, при изучении частотных таблиц особое внимание надо обращать на максимальное и минимальное значения. Однако если вместо возраста 65 лет было введено, например, значение 56, то при помощи частотной таблицы эту ошибку обнаружить невозможно. Часто имеется также возможность провести смысловой анализ данных путем создания таблиц сопряженности. Например, если данные взяты из анкеты, в которой имелся вопрос о семейном положении (холост/не замужем, женат/замужем, вдовец/вдова, разведен(а)), то, построив таблицу сопряженности для этого вопроса и вопроса типа: «Если у вас есть семья, то приемлемо ли для вас проводить отпуск раздельно?», легко можно обнаружить, ответили ли на него только женатые/замужние опрашиваемые.Обладая некоторыми практическими навыками и фантазией, с помощью описанных и им подобных способов можно выявить большое количество ошибок ввода. Все такие ошибки обязательно должны быть исправлены. Даже если наблюдений несколько тысяч, то даже одно-единственное противоречивое значение наносит вред вашему исследованию: создается впечатление, что работа по сбору о подготовке информации выполнена поверхностно.

Загрузить на выполнение SPSS. Открыть файл jazvasi.sav.(D\информатика\занятия\лечебный, МПФ,стомат.\статистика)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]