
- •Дисциплина: Системы статистического анализа данных
- •1.1.2. Вычисление частот и построение гистограмм
- •1.2. Описательные статистики
- •1.3. Кросс табуляция (таблицы сопряженности)
- •2. Реализация в ststistica
- •2.1. Графическое представление информации.
- •2.1.1. Диаграммы
- •2.1.2. Вычисление частот и построение гистограмм
- •2.2. Описательные статистики
- •1.3. Кросс табуляция (таблицы сопряженности)
- •Индивидуальное задание
1.1.2. Вычисление частот и построение гистограмм
Команда Frequencies (Частоты)является одной из самых простых и часто используемых командSPSS. Действие команды сводится к подсчету количества объектов в каждой категории переменной. Она может быть использована для любых видов переменных, но при подсчете частот для непрерывной переменной, программа автоматически разделяет всю совокупность значений переменной на диапазоны.
Для расчета частот переменной необходимо использовать следующую последовательность команд:
Analyze (Анализ) - Descriptive Statistics (Описательные статистики) –
Frequencies (Частоты)
На экране появится диалоговое окно Frequencies (Частоты), в котором необходимо определить перемнную, для которой будут рассчитаны частоты. После нажатия кнопкиОКна экран будет выведено частотное распределение.
На рис.14. приведен пример расчета частот для дискретной переменной relatives(количество полных родственников в семье).
Рис.14.Частотное распределение для дискретной переменной
Как правило, при анализе структуры совокупности строится ее графическое отображение – гистограммы – для непрерывных переменных, столбиковые диаграммы - для всех остальных. Для того чтобы создать столбиковую диаграмму необходимо в окне Frequencies выбрать опцию Charts, а в меню Charts - вид диаграммы Bar chart (столбиковая диаграмма). В том случае, если нужно построить круговую диаграмму, необходимо выбрать видPie chart.
На рис.15. приведены столбиковая и круговая диаграмма для частотного распределения переменной relatives.
Рис.15. Столбиковая и круговая диаграммы для дискретной переменнойrelatives
Для построения гистограммы в окне Chartsнеобходимо выбрать вид диаграммыHistograms.На график одновременно с гистограммой может быть выведена кривая нормального распределения, для этого необходимо установить флажок в полеShow normal curve on histogram (рис.16).
Рис.16.Построение гистограммы
После нажатия кнопки ОК на экран будет выведена гистограмма.
На рис.17 приведен пример построения гистограммы для переменной index_1.
Рис.17.Гистограмма для непрерывной переменнойindex_1
Помимо вычисления частот и построения диаграмм, команда Frequencies позволяет выводить основные параметры изучаемых данных – среднее, моду, медиану, размах, дисперсию и другие. Для выведения этих данных нужно поставить соответствующие отметки в окнеStatistics.
Существует и другой метод построение гистограмм и коробчатых диаграмм– с помощью модуля описательных статистик.
1.2. Описательные статистики
Цель описательной (дескриптивной) статистики — обработка эмпирических данных, их систематизация, наглядное представление в форме графиков и таблиц, а также их количественное описание посредством основных статистических показателей без выдвижения предположений о модели распределения, присущих генеральной совокупности.
Эти показатели могут быть условно разбиты на три группы. Первая группа – меры центральной тенденции, вокруг которой группируются данные: среднее значение, мода и медиана. Вторая группа характеризует изменчивость значений переменной относительно среднего: стандартное отклонение и дисперсия. Диапазон изменчивости характеризуется минимумом, максимумом и размахом. Асимметрия и эксцесс представляют меру отклонения формы распределения от нормального вида.
Для расчета описательных статистик переменных необходимо использовать следующую последовательность команд:
Analyze (Анализ) – Descriptive Statistics (Описательные статистики) –
Descriptives (Описания)
На экран появится диалоговое окно Descriptives (Описания), в котором необходимо задать переменные, для которых будут вычислены описательные статистики. Щелчком на кнопке Options,открывается диалоговое окноDescriptives: Options (рис.18), в котором задаются те статистики, которые должны быть рассчитаны.
Рис.18. Вычисление описательных статистик
На рис.19 приведен пример расчета основных статистик для переменных age(возраст),height(рост),weight_1 (вес до программы похудения).
Descriptive Statistics | ||||||
|
N |
Minimum |
Maximum |
Mean |
Std. Deviation |
Variance |
Возраст |
50 |
20 |
57 |
37,38 |
9,562 |
91,424 |
Рост |
50 |
150 |
192 |
171,06 |
11,758 |
138,262 |
Вес до похудения |
50 |
77,0 |
163,0 |
117,440 |
24,0935 |
580,496 |
Valid N (listwise) |
50 |
|
|
|
|
|
Рис.19. Описательные статистики для переменныхage,height,weight_1
Модуль описательных статистик позволяет производить дифференцированный анализ данных. Для этого воспользовавшись командой Explore (Analyze – Descriptive Statistics - Explore), на экран появится диалоговое окноExplore (рис.20), в котором необходимо указатьсписок зависимых переменных (Dependent List)исписок влияющих переменных (Factor List).
Рис.20.Диалоговое окноExplore
Пример вычисления описательных статистик для переменной index_1, дифференцировав выборку по переменойsexпредставлен на рис.21.
Рис.21.Описательные статистики для переменнойindex_1 с дифференцирующим признакомsex
Если в поле Factor Listне вводить дифференцирующих переменных (для которых вся выборка разбивалась бы на две или более частей), программа произведет простой расчет описательных статистик.
Кроме того, если флажок в поле Displayпоставить в положениеPlots (рис.22) будет получено изображение гистограммы и коробчатой диаграммы (рис.23). Перемещение флажка в положениеBoth выводит на экран и описательные статистики, и выбранный вид диаграммы.
Рис.22. Диалоговые окна Explore, Explore Plots
Рис.23.Диаграммы для переменнойindex_1, дифференцированной по переменнойsex
Помимо простых описательных статистик, программа SPSSпозволяет рассчитыватьМ-оценки (M-estimates),выбросы (Outliers)иперцентили (Percentiles).Для того, чтобы произвести необходимые расчеты, нужно в окнеExplore (Исследование) клим мышки на кнопке Statistics (Статистика) открыть диалоговое окноExplore:Statistics и выбрать соответствующие команды (рис.24).
Рис.24. Диалоговые окна Explore, Explore: Statistics.
Пример расчета М-статистик, перцентилей и анализа выбросов для переменной index_1, дифференцировав выборку по переменойsexприведен на рис.25.
Рис.25. Пример расчета М-статистик, перцентилей и анализа выбросов