- •Рабочая программа дисциплины (модуля)
- •1. Цели освоения дисциплины Статистический анализ данных (spss)
- •2. Место дисциплины в структуре ооп бакалавриата
- •3. Компетенции обучающегося, формируемые в результате освоения дисциплины Статистический анализ данных (spss).
- •4. Структура и содержание дисциплины Статистический анализ данных (spss).
- •Тематический план учебной дисциплины 4 семестр очная форма
- •Тема 1. Введение в spss для Windows.
- •Тема 2. Чтение данных из Excel, баз данных и текстовых файлов.
- •Тема 3. Определение атрибутов переменных и меток.
- •Тема 4. Итожащие статистики для отдельных переменных.
- •Тема 5. Изменение значений данных.
- •Тема 6. Выявление взаимосвязей между переменными.
- •Тема 7. Создание и редактирование диаграмм.
- •Тема 8. Вывод результатов в spss.
- •Тема 9. Введение в командный язык (синтаксис) spss.
- •5. Образовательные технологии
- •6. Учебно-методическое обеспечение самостоятельной работы студентов. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины.
- •7. Учебно-методическое и информационное обеспечение дисциплины
- •8. Материально-техническое обеспечение дисциплины
- •Вопросы к экзамену.
- •Сведения о файле данных
- •Ввод и чтение данных
- •Свойства переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных
- •Преобразование значений данных
- •Вопросы:
- •Изучение связи между категориальными переменными
- •Вопрос:
- •Вопрос:
- •Мобильные таблицы
- •Создание диаграмм
- •Задание параметров плана выборки
- •Частоты и описательные статистики
- •Таблицы сопряженности
- •Отношения
- •Контрольная работа для студентов курсу Статистический анализ данных spss
- •Ввод и чтение данных. Описание переменных: метки переменных и значений, типы переменных, пропущенные значения
- •Подытоживание (обобщение) отдельных переменных.
- •Преобразование данных
- •Изучение связи между категориальными переменными
- •Мобильные таблицы
- •Создание диаграмм
Подытоживание (обобщение) отдельных переменных.
2.1. Для каких перечисленных ниже переменных будут полезными частотные таблицы?
Количество километров, проезжаемое за год
Систолическое кровяное давление
Доход в рублях
Удовлетворенность браком
Площадь офиса в квадратных метрах
Зарплата генерального директора
Регион
Количество автомобилей в домохозяйстве
Ответ: d, f, g, h.
Безусловно все категориальные переменные (d, g) и количественные с небольшим количеством вариантов значений (f, h). Вряд ли зарплата генеральных директоров очень сильно варьирует, также как и количество автомобилей в домохозяйстве. А там, где большая вариация значений, там частотные таблицы получатся очень громоздкими.
2.2. Для каких из указанных ниже переменных можно интерпретировать значение кумулятивных процентов?
Количество взрослых членов домохозяйства
Марка машины
Специальность, полученная в вузе
Количество заболеваний за последний год
Ответ: a, d.
То есть мы сможем сказать, что например, 80% домохозяйств состоят из 4 и менее человек (или сколько раз переболели за год), но не сможем сказать, что , например, половина всех домохозяйств имеет марки автомобилей … какие? их ведь там будет несколько.
Для выполнения данного задания откройте файл данных Gss91Small.sav. Создайте частотную таблицу по переменной Количество часов в день, проводимых у телевизора [tvhours]. (Вставьте в данный документ полученную частотную таблицу с помощью пункта меню Правка..Вставить. Для этого в окне Вывода необходимо щелкнуть по таблице левой кнопкой мыши и скопировать ее, затем вставить таблицу в данный документ).
Вставка таблицы Частоты:
ЧИСЛО ЧАСОВ В ДЕНЬ, ПРОВОДИМЫХ У ТЕЛЕВИЗОРА
|
Частота |
Процент |
Валидный процент |
Кумулятивный процент | |
Валидные |
0 |
13 |
2.6 |
3.9 |
3.9 |
1 |
58 |
11.6 |
17.3 |
21.1 | |
2 |
81 |
16.2 |
24.1 |
45.2 | |
3 |
86 |
17.2 |
25.6 |
70.8 | |
4 |
45 |
9.0 |
13.4 |
84.2 | |
5 |
18 |
3.6 |
5.4 |
89.6 | |
6 |
16 |
3.2 |
4.8 |
94.3 | |
7 |
2 |
.4 |
.6 |
94.9 | |
8 |
6 |
1.2 |
1.8 |
96.7 | |
9 |
1 |
.2 |
.3 |
97.0 | |
10 |
6 |
1.2 |
1.8 |
98.8 | |
12 |
3 |
.6 |
.9 |
99.7 | |
16 |
1 |
.2 |
.3 |
100.0 | |
Итого |
336 |
67.2 |
100.0 |
| |
Пропущенные |
ВОПРОС НЕПРИМЕНИМ |
161 |
32.2 |
|
|
НЕТ ОТВЕТА |
3 |
.6 |
|
| |
Итого |
164 |
32.8 |
|
| |
Итого |
500 |
100.0 |
|
|
Какой процент респондентов, отвечавших на вопрос, не смотрит телевизор вообще?
Ответ: 3,9%.
Какой процент респондентов затрачивает на просмотр телевизора два и меньше часов времени?
Ответ: 45,2%.
Какой процент респондентов затрачивает на просмотр телевизора пять и более часов?
Ответ: 15,8%.
Какой процент респондентов, смотрящих телевизор, затрачивает на просмотр один час?
Ответ: 17,3%.
Чему равно значение медианы?
Ответ: 3,0 часов.
Чему равно значение моды?
Ответ: 3,0 часов.
Постройте столбиковую диаграмму по переменной Количество часов в день, проводимых у телевизора [tvhours]. В чем Вы видите сложность использования данной диаграммы? (Вставьте в данный документ полученную столбиковую диаграмму с помощью пункта меню Правка..Вставить).
Вставка столбиковой диаграммы:
Сложности использования этой диаграммы: очень много столбиков (каждый столбик характеризует конкретное значение числа часов у телевизора. Если сначала значения идут по порядку, с интервалом в один час, то в конце сразу после 10 идет значение 12 часов, а потом сразу 16. Хотя по идее шкала у нас должна быть равномерной, и после 10 должно было бы быть несколько следующих значений, у которых нет частот. Тогда график бы еще больше растянулся и был еще более неудобным. А так визуально мы не можем сразу увидеть эту особенность.
Постройте гистограмму по переменной Количество часов в день, проводимых у телевизора [tvhours]. Отредактируйте гистограмму, задав в качестве минимального значения 0 часов, в качестве максимального значения – 24 часа и размер интервала, равный одному часу. (Вставьте в данный документ полученную гистограмму с помощью пункта меню Правка..Вставить).
Вставка гистограммы:
Сравните полученную гистограмму со столбиковой диаграммой, построенной в вопросе 2.4. Какая из диаграмм, по Вашему мнению, лучше отображает данные?
Ответ:
Гистограмма для восприятия данных гораздо удобнее. На ней отображается не каждое отдельное значение, а интервалы (правда у нас конкретно на этой гистограмме эти отличия не видны, поскольку у нас каждый столбик гистограммы тоже интервалом в один час). Шкала у гистограммы равномерная, то есть здесь визуально мы все воспринимаем правильно: то есть мы видим, что нет частот для значений 11, 13, 14, 15 и более часов.