Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мхитарян С.В. Маркетинговые исследования рынка...docx
Скачиваний:
4
Добавлен:
01.07.2025
Размер:
608.84 Кб
Скачать

6. Сегментирование в маркетинге (с откликом)

Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом.

Дискриминантный анализ – это прогностическа модели, в которых результирующий показатель (отклик) является категориальным (купил/не купил), а независимые переменные измерены в интервальной (числовой) шкале. Как и в регрессионном анализе, основная идея – построить прогностическую модель, оценить ее и в случае успеха создать соответствующее уравнение.

В переключателе модулей выберите модуль Discriminant Analysis – Дискриминантный анализ.

Откройте в стартовой панели модуля файл Irisdat.sta, выберите группирующей переменной – Grouping variable – переменную iristype, все остальные переменные – независимыми – Independent variable. Mising data – пропущенные данные – позволяет выбрать метод заполнения пустых значений. Нажмите OK.

Выберите метод пошагового анализа Method: Forward stepwise. Нажмите OK.

В информационной части окна результатов Wilks' Lambda – Значение лямбды Уилкса. Значение лямбды Уилкса лежит в интервал [0, 1]. Значение близкое к 0 говорит о хорошей дискриминации (как в нашем примере).

Кнопка Variables in the model показывает переменные, включенные в модель и их характеристики.

Разделение групп на графике можно посмотреть с помощью кнопки Canonical analysis & graph – Канонический анализ и графики.

В появившемся окне нажмите кнопку Scatterplot of canonical scores – Диаграмма рассеяния канонических значений.

Нажмите кнопку в окне результатов дискриминантного анализа Classification functions – Функции классификации.

С помощью этих функций можно вычислить классификационные значения для вновь наблюдаемых объектов по формулам:

SETOSA = -16,43 * PETALLEN + 23,69 * SEPALWID – 17,40 * PETALWID + 23,54 * SEPALLEN – 86,31 (данные округлены до 2-го знака после запятой).

Аналогичные формулы для классов VERICOL, VIRGINIC. Новый объект относится к тому классу, для которого классификационное значение максимально.

В окне результатов анализа нажмите кнопку Squared Mahalanobis distance – Квадрат расстояния Махаланобиса.

Таблица с квадратами расстояния Махаланобиса от точек до центров групп позволяет определить к какой группе относится случай. Случай относится к группе, в до которой расстояние Махаланобиса минимально. Звездочками помечены случаи, классификация которых неверна.

Для классификации новых случаев необходимо добавить в таблицу исходных данных, не закрывая окно результатов дискриминантного анализа, новый случай. Например, такой:

Далее еще раз рассчитайте расстояния Махаланобиса.

Новое наблюдение относится к классу VERSICOL (расстояние Махаланобиса минимально = 31,1716).

7. Задачи для самостоятельной работы

Для работы с задачами необходимо файл Marketing_Ex.stw скопировать в директорию данных системы Statistica.

В каждой задаче указывается закладка файла данных и модуль статистической обработки.

Задача 1.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы с 1995 по 2000 год в условных денежных единицах (Ex001).

Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели Авторегрессии и проинтегрированного скользящего среднего - АРПСС (ARIMA & autocorrelations functions) построить модель АРПСС и прогноз товарооборота на 2001 год.

Варианты ответов:

А. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=1, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;

Б. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;

В. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;

Г. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=1, P=0, q=1, Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;

Д. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=0, P=1, q=0, Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis.

Задача 2.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы с 1995 по 2000 год в условных денежных единицах (Ex001). На динамике товарооборота сказался дефолт августа 1998 года.

Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели прерванной АРПСС – АРПСС с интервенцией (Interrupted ARIMA) построить модель прерванной АРПСС и прогноз товарооборота на 2001 год.

Варианты ответов:

А. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=0, P=1, q=0, Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis,

- интервенция 1 (Intervension) с наблюдения 34 (At case number),

тип (Type of intervention) – скачкообразная, устойчивая (Abrupt, Permanent);

Б. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=1, P=0, q=1, Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 24 (At case number),

тип (Type of intervention) – скачкообразная, устойчивая (Abrupt, Permanent);

В. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 64 (At case number),

тип (Type of intervention) – скачкообразная, временная (Abrupt, Temporary);

Г. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 54 (At case number),

тип (Type of intervention) – постепенная, устойчивая (Gradual, Permanent);

Д. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=1, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis,

- интервенция 1 (Intervension) с наблюдения 44 (At case number),

тип (Type of intervention) – постепенная, устойчивая (Gradual, Permanent).

Задача 3.

По данным внутренней отчетности предприятия была сделана выборка, представляющая понедельные суммы выписки и оплаты заказов фирмы за отчетный период в условных денежных единицах (Ex002).

Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели анализа распределенных лагов (Distributed Lags Analysis), опции Обычные лаги (Unconstrained polynomial lags) построить авторегрессионную модель по значимым лагам и прогноз оплат на несколько недель вперед по смещенным суммам выписки заказов.

Варианты ответов:

А. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 2 и 3;

Б. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 6;

В. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 4 и 5;

Г. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 4;

Д. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 5.

Задача 4.

По данным внутренней отчетности предприятия была сделана выборка, представляющая понедельные данные работы предприятия: количество и сумма выписанных заказов, количества наличных заказов, оплаченных сумм, оплаченных сумм наличными, отношения количества и сумм оплаченных заказов к выписанным, наличных заказов к выписанным, наличных заказов к оплаченным (Ex003).

Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели множественного регрессионного анализа (Multiple Regression) построить регрессионную модель значений оплаченных сумм (S_OPL) по значимым параметрам предприятия.

Варианты ответов:

А. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, K_OPL, K_NAL, S_OPL, S_NAL, K_OPL_VI, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP, S_NAL_OP;

Б. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_NAL, K_OPL_VI, S_OPL_VI, K_NAL_VI, K_NAL_OP, S_NAL_OP;

В. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, S_OPL, S_NAL, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP;

Г. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, K_OPL, S_NAL_VI, K_NAL_OP, S_NAL_OP;

Д. Регрессионные коэфф-ты модели значимы для следующих переменных:

K_OPL_VI, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP, S_NAL_OP.

Задача 5.

За отчетный период представлены данные по региональным филиалам фирмы: количество оплат, количество клиентов, оплаченная сумма (у.е.), процент наличных в оплаченной сумме, процент клиентов, оплативших наличными (Ex006).

Задание:

С помощью программного статистического пакета Statistica, модуля факторного анализа (Factor Analysis), метода Главных компонт (Principal components) выделить главные компоненты, определяющие характеристики филиалов предприятия для последующего их сравнительного анализа.

Варианты ответов:

А. Количество главных компонент – 1, форма вращения факторов – отсутствует;

Б. Количество главных компонент – 2, форма вращения факторов – Varimax;

В. Количество главных компонент – 3, форма вращения факторов – Varimax normalized;

Г. Количество главных компонент – 4, форма вращения факторов – Biquatrimax;

Д. Количество главных компонент – 5, форма вращения факторов – Biquatrimax normalized.

Задача 6.

Предприятие планирует открывать новые региональные филиалы. Для этого по данным Госкомстата РФ были получены сводные данные по областям России: объем производства (млн. руб.), процент промышленного производства к предыдущему году, строительство жилых домов, тыс.кв.м, строительство жилых домов в % к предыдущему году, инвестиции, млн.р., инвестиции в % к предыдущему году (Ex007).

Задание:

С помощью программного статистического пакета Statistica, модуля факторного анализа (Factor Analysis), метода Главных компонент (Principal components) выделить главные компоненты, определяющие характеристики областей России для дальнейшей оценки их привлекательности с точки зрения региональной политики предприятия.

Варианты ответов:

А. Количество главных компонент – 1, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ПРОИЗВ_%, СТРОИТ, СТРОИТ_%, ИНВЕСТ, ИНВЕСТ%;

Б. Количество главных компонент – 2, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ПРОИЗВ_%;

В. Количество главных компонент – 3, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, СТРОИТ, ИНВЕСТ;

Г. Количество главных компонент – 4, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ_%, СТРОИТ_%, ИНВЕСТ%;

Д. Количество главных компонент – 5 В, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ИНВЕСТ.

Задача 7.

Представлены данные по суммарному товарообороту отраслевых сегментов корпоративных клиентов фирмы по отраслям (Ex004).

Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), иерархических агломеративных методов (Joining (tree clustering)) выделить 3 основных класса отраслей потребителей по их доле в товарообороте фирмы, определить отрасли, принадлежащие первым двум, наиболее значимым кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Cases (rows) – наблюдения.

Варианты ответов:

А. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Машиностроение (7);

Б. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Монтажные организации (11);

В. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Транспортные организации (22);

Г. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Пищевая промышленность (14);

Д. В отдельном кластере, значительно отстоящем от остальных (классе) находится отрасль – Строительство(19).

Задача 8.

Представлены данные по суммарному товарообороту отраслевых сегментов корпоративных клиентов фирмы по отраслям (Ex004).

Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), метода К-средних (K-means clustering) выделить 3 основных класса отраслей потребителей по их доле в товарообороте фирмы, определить отрасли, принадлежащие первым двум, наиболее значимым кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Cases (rows) – наблюдения.

Варианты ответов:

А. В первом кластере находятся отрасли: Машиностроение (7), Научные организации (12), Строительство (19);

Б. В первом кластере находятся отрасли: Монтажные организации (11), Полиграфия (15);

В. В первом кластере находятся отрасли: Транспортные организации (22), Монтажные организации (11), Полиграфия (15);

Г. В первом кластере находятся отрасли: Пищевая промышленность (14), Химическая промышленность (23);

Д. В первом кластере находятся отрасли: Строительство(19).

Задача 9.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы за отчетный год в условных денежных единицах по ассортиментным группам (Ex005).

Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), иерархических агломеративных методов (Joining (tree clustering)), метода К-средних (K-means clustering) выделить основные классы ассортиментных групп по их доле в товарообороте фирмы, определить ассортиментные группы, принадлежащие различным кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Variables (columns) – переменные.

Варианты ответов:

А. Ассортиментные группы необходимо разбить на 1 кластер, в первом кластере находится ассортиментная группа А;

Б. Ассортиментные группы необходимо разбить на 2 кластера, в первом кластере находится ассортиментная группа З;

В. Ассортиментные группы необходимо разбить на 3 кластера, в первом кластере находится ассортиментная группа К;

Г. Ассортиментные группы необходимо разбить на 4 кластера, в первом кластере находится ассортиментная группа Р;

Д. Ассортиментные группы необходимо разбить на 5 кластеров, в первом кластере находится ассортиментная группа С.

Задача 10.

Представлена выборка товаров фирмы, их характеристик: индекса цен (отношения цены фирмы к среднерыночной), количества оплаченных заказов, количества клиентов, количества конкурентов, процент в товарообороте фирмы. А также характеристика стратегического положения или стратегии каждого товара в товарном ассортименте: «Рыночная ниша», «Имеет конкурентные преимущества», «Уход с рынка», «Занять нишу», «Добиться преимуществ» (Ex009).

Задание:

С помощью программного статистического пакета Statistica, модуля дискриминантного анализа (Discriminant Analysis), Пошагового анализа дискриминантных функций (Stepwise Discriminant Function) создать обучающую выборку, оценить корректность данной классификации товаров по стратегиям; определить, какую характеристику можно применить к товару со следующими характеристиками:

Пример 1

ИНД_ЦЕН

КОЛ_ОПЛ

КОЛ_КЛ

КОЛ_КОНК

ПРОЦ_ОБ

120

2

7

6

0,3

Примечание: в окне настроек стартовой панели дискриминантного анализа в окне Mising Data нужно выбрать Substituted by means – замена пустых значений средними значениями, в следующем окне выбрать метод пошагового анализа Forvard Stepwise.

Варианты ответов:

А. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Рыночная ниша»;

Б. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Имеет конкурентные преимущества»;

В. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Уход с рынка»;

Г. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Занять нишу»;

Д. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Добиться преимуществ».