Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Парыгина СА_Математическая статистика-SPSS

.PDF
Скачиваний:
45
Добавлен:
22.03.2015
Размер:
388.46 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«ЧЕРЕПОВЕЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Институт информационных технологий

Кафедра математики и информатики

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

СТАТИСТИЧЕСКАЯ ОБРАБОТКА И АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

С ПОМОЩЬЮ ПАКЕТА SPSS

Учебно-методическое пособие

Направления подготовки: 020400.62 Биология, 030300.62 Психология, 040100.62 Социология

Череповец

2014

Рассмотрено на заседании кафедры математики и информатики, протокол № 1 от 02.09.13 г.

Одобрено учебно-методической комиссией Института информационных технологий ЧГУ, протокол № 2 от 03.10.13 г.

Составитель: С.А. Парыгина, канд. психол. наук, доцент

Рецензенты: О.Ю. Лягинова – канд. пед. наук, доцент (ЧГУ); В.В. Хромов – канд. психол. наук, доцент (ЧГУ)

Научный редактор: М.И. Шутикова – д-р пед. наук, проф.

©Парыгина С.А., 2014

©ФГБОУ ВПО «Череповецкий государственный университет», 2014

2

Введение

Настоящее учебно-методическое пособие предназначено для организации лабораторных работ у студентов следующих направлений подготовки: 020400.62 Биология, 030300.62 Психология, 040100.62 Социология по дисциплинам: «Математические методы в биологии», «Математические методы в психологии» и «Методы прикладной статистики для социологов» соответственно.

Пособие содержит рекомендации к лабораторным работам по следующим разделам математической статистики: описательная статистика, дисперсионный, корреляционный, факторный и кластерный анализ.

Большинство заданий данного пособия имеют профессиональную направленность, т.е. в задачах моделируются результаты различных экспериментов (биологических, психологических, социологических). Это позволяет студентам указанных направлений подготовки лучше понять специфику применения методов математической статистики к обработке и анализу экспериментальных данных.

Данное учебно-методическое пособие предназначено для проведения лабораторных работ, а также позволяет организовать самостоятельную работу обучающихся и их подготовку к выполнению контрольных рейтинговых мероприятий.

3

Лабораторная работа 1

Изучение статистических возможностей электронного пакета SPSS

Теоретическая часть

SPSS – это аббревиатура от Statistical Package of the Social Science (статистический пакет для социальных наук). Как следует из названия, пакет SPSS представляет собой набор различных программ, предназначенных для обработки экспериментальных данных различного рода (социологических, психологических, биологических и др.). Эти программы облегчают процесс ввода информации, позволяют гибко менять структуру данных, использовать самые современные методы обработки и получать результаты в удобной и наглядной форме. В настоящее время удобнее использовать для работы версии, начиная с 12.0, где стала возможной русификация окон ввода и обработки результатов.

Целью данной лабораторной работы является изучение возможностей электронного пакета SPSS по реализации основных методов описательной статистики.

Описательный анализ экспериментальных данных с применением пакета SPSS включает в себя 2 основных этапа:

1.Ввод данных в электронную систему SPSS.

2.Реализация одномерного описательного анализа экспериментальных данных с помощью пакета SPSS.

Рассмотрим особенности каждого из этапов.

1.Ввод данных в электронную систему SPSS

Рассмотрим сначала некоторые общие понятия.

При работе с экспериментальными данными в математической статистике используются два основополагающих понятия: гене-

ральная совокупность и выборка.

В практических исследованиях синонимами понятия генераль-

ной совокупности являются понятия признака или переменной.

Признаки и переменные – это измеряемые социальные, психологи-

4

ческие, биологические и другие явления. Такими явлениями могут быть: средний доход на душу населения в регионе, электоральные предпочтения избирателей, уровень тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных реакций, морфометрические показатели вегетативных органов растений, антропометрические характеристики животных и т.д.

Значения признака или переменной, полученные у испытуемых в ходе экспериментального исследования, составляют выборку, которую на практике часто называют наблюдаемыми значениями. Эти значения определяются с помощью соответствующих измерительных шкал.

В конкретном исследовании, как правило, изучается сразу несколько переменных, которые могут определяться вопросами анкеты, экспериментальными показателями и т.д. Наблюдаемые значения переменных – варианты ответов анкеты, указанные респондентами или значения показателей, полученные в процессе эксперимента, – составляют выборку для каждой переменной.

Например, необходимо изучить, на чем и как быстро жители Вологодской области добираются до места работы. Для этого целесообразно провести опрос работающего населения, а соответствующая анкета может выглядеть следующим образом:

Анкета

1.Каким способом Вы предпочитаете добираться до места работы?

1.Общественным транспортом.

2.На личном автомобиле.

3.Пешком.

4.Затрудняюсь ответить.

2.Сколько времени у Вас занимает дорога до места работы?

(укажите в мин.)___________________________________________

3. В каком населенном пункте Вы проживаете? (Напишите).

_____________________________________________________________

5

Каждому вопросу анкеты сопоставляется своя переменная, при этом 3 переменные имеют разную математическую природу с точки зрения способа измерения их значений. Так, наблюдаемое значение первой переменной – это один из 4-х номеров в соответствии с вариантами ответа на данный вопрос (т.е. имеет место номинальное измерение с четырьмя категориями), для второй переменной – это числовое значение, измеренное в минутах (т.е. имеет место количественное измерение, в частности, шкала отношений), для третьей переменной – это текстовая информация (т.е. имеет место номинальное измерение нечисловой природы).

Редактор данных электронного пакета SPSS состоит из двух частей: таблицы, предназначенной для описания переменных, участвующих в эксперименте (вкладка Переменные) и таблицы, предназначенной для работы непосредственно с экспериментальными данными, т.е. наблюдаемыми значениями введенных переменных (вкладка Данные). Работу с экспериментальными данными в пакете SPSS необходимо начать с описания переменных.

Вкладка Переменные позволяет задать структуру файла данных для каждой переменной. Заголовки столбцов представляют собой параметры, с помощью которых можно описать переменную, а

именно: Имя, Тип, Ширина, Десятичные, Метка, Значения, Пропущенные, Ширина столбца, Выравнивание, Шкала, Роль.

Опишем эти параметры более подробно.

Имя – позволяет ввести выбранное имя переменной, при этом следует соблюдать некоторые правила: 1) можно использовать буквы латинского или русского алфавита и цифры, а также символы _ (подчеркивание), . (точка), @ и #; 2) не разрешается использовать пробелы, знаки других алфавитов и символы: !, ?," и *; 3) имя переменной должно начинаться с буквы; 4) последний символ имени не может быть точкой или знаком подчеркивания; 5) имена переменных нечувствительны к регистру, т.е. прописные и строчные буквы не различаются. В примере удобно задать следующие имена для переменных: для 1-й – вид_транспорта, для 2-й – вре-

мя_на_дорогу, для 3-йнаселенный_пункт.

6

Тип – определяет тип переменной, при этом текущим типом является тип Числовая, который используется для большинства переменных. Для некоторых переменных, значениями которых являются имена людей, названия городов и т.п., удобно выбрать тип Текстовая. В общем случае для каждой переменной можно выбрать один из 9-ти типов. В примере: переменные вид_транспорта

ивремя_на_дорогу являются числовыми, а переменная населенный_пункт – текстовая.

Ширина – задает максимальное число знаков, которое может иметь значение переменной, включая дробную часть. По умолчанию устанавливается ширина – 8 знаков, для большинства переменных этого вполне достаточно.

Десятичные – предназначен для задания числа десятичных знаков после запятой в случае, если тип переменной допускает использование дробных чисел. Для текстовых переменных число десятичных знаков автоматически устанавливается равным нулю, а для числовых переменных – равным 2.

Метка – позволяет более подробно описать переменную, используя при этом до 256 символов, а также различая строчные и прописные буквы. В это поле можно поместить соответствующий данной переменной вопрос анкеты или пояснения для того или иного экспериментального показателя.

Значения – позволяет более подробно описать возможные значения числовых категориальных переменных. В примере такой переменной является вид_транспорта, где каждому из 4-х значений сопоставляется свой вариант ответа. Тогда в окне Метки значений числу «1» приписываем значение «Общественный транспорт», числу «2» – «Личный автомобиль» и т.д.

Пропущенные – позволяет учитывать пропуски в данных, но используется очень редко, так как при наличии в матрице данных незаполненных ячеек система SPSS автоматически идентифицирует их как пропущенные.

Ширина столбца – определяет ширину, которую будет иметь

втаблице данный столбец при отображении значений.

7

Выравнивание – позволяет задать вид выравнивания значений в таблице данных.

Шкала – позволяет указать измерительную шкалу для данной переменной, причем в списке только 3 типа шкал: номинальная, порядковая и количественная (т.е. интервальная шкала объединена со шкалой отношений). По умолчанию для числовой переменной задается количественная шкала, а для текстовой – номинальная. Однако числовой тип переменной еще не означает, что она количественная: в примере переменная вид_транспорта имеет числовой тип, но является номинальной, так как числа только задают номера вариантов ответов анкеты, а переменная время_на_дорогу действительно является количественной.

Роль – определяет назначение переменной в отношении ее использования. По умолчанию всем переменным назначается роль

Входная.

Вкладка Данные позволяет осуществить непосредственный ввод наблюдаемых значений в программу, при этом соответствующие столбцы уже будут иметь заданные имена. Предварительно необходимо составить матрицу данных. Например, в результате опроса 10 респондентов (анкету см. выше), мы можем получить следующую матрицу данных (табл. 1.1).

 

 

Таблица 1.1

 

 

 

 

 

Переменные

 

 

вид_транспорта

время_на_дорогу, мин.

населенный_пункт

 

1

40

Череповец

 

2

20

Вологда

 

1

45

Вологда

 

3

25

Шексна

 

3

50

Череповец

 

1

55

Череповец

 

2

15

Вологда

 

1

35

Шексна

 

3

60

Череповец

 

2

25

Вологда

 

8

2. Реализация одномерного описательного анализа экспериментальных данных с помощью пакета SPSS

Описательный анализ больших массивов данных начинается с более удобного и компактного их представления. С этой целью в пакете SPSS предусмотрено построение так называемых частотных таблиц, представляющих собой, по существу, статистическое распределение частот, дополненное вычислением обычных и накопленных процентов. Такие таблицы удобно использовать как для количественных, так и для качественных переменных (включая номинальные переменные с текстовыми значениями), в качестве простейшего описания исходных данных.

Проиллюстрировать наглядно результаты описательного анализа данных можно с помощью графических возможностей электронного пакета SPSS. При этом для иллюстрации качественных переменных можно использовать простейшие графические формы (например, столбиковые или круговые диаграммы), базирующиеся непосредственно на результатах частотных таблиц. А для иллюстрации количественных переменных лучше применять специальные графические формы (например, гистограмму или кумулятивную кривую).

Следующей задачей, которую решает одномерный описательный анализ, является вычисление выборочных числовых характеристик, таких как процентили (квартили, децили и др.), меры центральной тенденции (мода, медиана, среднее значение), меры изменчивости или разброса (дисперсия, стандартное отклонение и др.), характеристики распределения (коэффициенты асимметрии и эксцесса). Однако возможность использования данных числовых характеристик для качественных переменных очень ограничена

(см. табл. 1.2.).

Выбрать те или иные статистические инструменты в пакете SPSS можно на главной панели инструментов в меню Анализ. Для реализации одномерного описательного анализа экспериментальных данных удобно использовать следующие команды подменю

Описательные статистики:

9

Таблица 1.2

Описание возможностей использования выборочных числовых характеристик для шкал различного типа

Тип измерительной

Допустимые числовые

п/п

шкалы

характеристики

1.

Номинальная

Мода

2.

Порядковая

Процентили.

 

 

Мода, медиана

3.

Количественная

Процентили.

 

(интервальная или отношений)

Все меры центральной тенденции.

 

 

Все меры изменчивости (разброса).

 

 

Коэффициенты асимметрии и эксцесса

Команда Частоты позволяет:

1)строить частотные таблицы;

2)строить простейшие графические объекты (столбиковые и круговые диаграммы);

3)вычислять выборочные числовые характеристики: квартили и другие процентили, максимальное и минимальное значения, меры центральной тенденции, меры изменчивости, асимметрию и эксцесс.

Для работы с командой Частоты в соответствующем окне в поле Переменные перечисляются переменные, для которых производятся вычисления, кнопка Статистики позволяет выбрать конкретные числовые характеристики, а кнопка Диаграммы – соответствующие графические объекты (для построения графических объектов в пакете SPSS существует также отдельное меню Графи-

ка).

Команда Описательные позволяет вычислять основные числовые характеристики описательной статистики: меры центральной тенденции, меры изменчивости, асимметрию и эксцесс. Данная команда более акцентирована на описательный анализ экспериментальных данных, чем предыдущая. Для работы с командой Описательные в соответствующем окне в поле Переменные перечисляются переменные, для которых производятся вычисления, в опции

10