Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчёты по лабораторным Ларионова.docx
Скачиваний:
36
Добавлен:
28.09.2019
Размер:
1.12 Mб
Скачать

Задание 2. Медиана для концентрированных данных

Цель: Определить медиану для концентрированных переменных.

На примере стоматологических данных определим медиану. Для этого загрузим файл cpitn.sav, содержащий результаты стоматологического исследования.

Кроме переменных schule и mhfreq, которые определяют уровень образования и то, сколько раз в день обследуемый чистит зубы, этот файл содержит шесть переменных cpitnl—cpitn6, которые указывают степень пародонтального заболевания каждой из шести частей челюсти — так называемый параметр CPITN, задаваемый с помощью следующей кодировочной таблицы:

0

0 - Здоровый пародонт

1

1 - Кровоточивость

2

2 - Зубные отложения

3

3 - Глубина десенных карманов 3,5-5,5мм

5

4 - Глубина десенных карманов 6 мм и более

С помощью команд меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies (Частоты) создаем частотную таблицу для переменной cpitnl. Если задать вычисление среднего медианы, мы получим следующий результат (таблица 5.5):

Таблица 5.5 – Результаты расчета медианы для стоматологического исследования

Таким образом, медиана или точка на шкале измеренных значений, выше и ниже которой лежит по половине всех измеренных значений составила 2.

Для данных анкет о “Савушкин продукт” рассчитаем также показатель медианы по критерию “Количество членов семьи”, предполагающим следующие варианты ответов:

1 – 2;

2 – 3;

3 – 4;

4 – 5;

5 – более 5.

Результаты показаны в таблице 5.6, согласно которой мы можем отметить значение медианы – 2 (т.е. 3 члена семьи), а также отметить преобладание семей респондентов, состоящих из двух(15,1%) и из 4(12,6%) человек.

Таблица 5.6 – Результаты расчета медианы для исследования “Савушкин продукт”

Лабораторная работа № 6

Тема “Создание таблиц сопряженности при анализе результатов маркетинговых исследований”

Задание 1. Создание таблиц сопряженности

Цель: Построить и проанализировать таблицы сопряженности.

На основе данных проведенного анкетирования респондентов о продукции “Савушкин продукт” были построены таблицы сопряженности. Для построения первой были выбраны критерии “Возраст респондента” и “Время суток, в которое покупатели предпочитают совершать покупки”.

По первому критерию предлагались следующие варианты ответов:

1 – до 25;

2 – 26-35;

3 – 36-45;

4 – 46-55;

5 – более 56.

По второму – время суток, в которое совершаются покупки:

1 – утро;

2 – день;

3 – вечер;

4 – ночь.

Таблица сопряженности имеет следующий вид (таблица 6.1):

Таблица 6.1 – Таблица сопряженности по критериям “Возраст” и “Время суток”

Первая таблица содержит информацию о числе самих наблюдений; 69 наблюдений содержат пропущенные значения, по крайней мере в одной из двух участвующих переменных. Вторая таблица — это собственно таблица сопряженности. Переменная “Время суток” является столбцовой переменной, так как каждое ее значение (утро, день, ...) отображается в отдельном столбце. Переменная “Возраст” — это переменная строк, так как каждое ее значение отображается в отдельной строке таблицы. Значение в каждой ячейке таблицы — количество наблюдений (частота). Так, например, здесь видно, что наибольшее количество покупок утром совершают респонденты в возрасте 46 – 55 лет, а наибольшее количество покупок вечером совершают респонденты в возрасте до 25 лет. Респонденты в возрасте от 26 до 35 лет также наиболее часто совершают покупки именно вечером, после работы; как вечером, так в значительной мере и днем покупки совершают респонденты в возрасте от 36 до 45 лет. Респонденты же, которые старше 56 лет чаще совершают покупки утром или днем.

Таким образом, можно заметить, что существует связь между возрастом респондентов и временем совершения ими покупок, т.к. у различных возрастных групп отличаются образы жизни, распорядок дня и модели поведения.

Исследуем эту зависимость чуть более детально. Для этого в группе Частоты выберем вариант отображения Наблюдаемые. Как мы видим из таблицы 6.2, под наблюдаемыми частотами появились ожидаемые. Эти данные мы можем интерпретировать так:

Наблюдаемая частота посещения респондентами в возрасте до 25 лет совпала с ожидаемой – 5. Наблюдаемая частота совершения покупок респондентами старше 36 лет оказалась ниже ожидаемой, это говорит о том, что в среднем потребители старше этого возраста чаще совершают покупки утром или днем (что все-таки больше относится к потребителям старше 50 лет). Что касается покупок утром, то здесь наблюдаемая частота покупок оказалась ниже ожидаемой для потребителей в возрасте до 45 лет, что говорит о том, что эти респонденты больше совершают покупки все-таки в другое время суток, особенно вечером и днем.

Таблица 6.2 – Таблица сопряженности по критериям “Возраст” и “Время суток” с отображением ожидаемых частот

Еще одну возможность выявления существования зависимости между переменными дает вычисление остатков. Эти остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга. Для их исчисления в группе Остатки выберем способ отображения Ненормированные (то есть разность наблюдаемых и ожидаемых частот). Получим следующую таблицу сопряженности (таблица 6.3).

Т аблица 6.3 - Таблица сопряженности по критериям “Возраст” и “Время суток” с отображением ненормированных остатков

Можно заметить, что каждый остаток равен разности наблюдаемой и теоретически ожидаемой частот в данной ячейке (например, в первой ячейке 2 – 3,4 = -1,4). Остатки делают еще более заметной тенденцию зависимости времени совершения покупок от возраста потребителей.

Таблицы сопряженности, которые мы рассмотрели выше, имеют тот недостаток, что в них приводятся только абсолютные значения. Чтобы узнать, насколько эти значения важны по отношению к общему количеству, надо определить их процентную долю. Для вычисления процентных значений выполним следующие действия: в группе Проценты выберем варианты отображения По строкам, По столбцам, Полные. В результате получим приведенную ниже таблицу сопряженности.

Таблица 6.4 - Таблица сопряженности по критериям “Возраст” и “Время суток” с отображением процентных значений

В данной таблице дополнительно отображаются процентные значения частот по отношению к суммам строк, столбцов и общей сумме.

Возьмем для примера первую ячейку. Значения, содержащиеся в ней можно интерпретировать следующим образом:

  • Из 14 респондентов, совершающих покупки утром, 2 – в возрасте до 25 лет;

  • Из всех респондентов 14,3% в возрасте до 25 лет осуществляют покупки утром;

  • Из всех респондентов, осуществляющих покупки утром, 16,7% в возрасте до 25 лет;

  • Из общего количества респонденты в возрасте до 25 лет, совершающие покупки утром, составили 4%.