Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / mu_markissl_2009 / МУ_Маркетинговые исследования_2009_05.doc
Скачиваний:
56
Добавлен:
23.05.2015
Размер:
2.45 Mб
Скачать

Исследование зависимости частоты посещения ресторана от размера семьи и дохода

Постройте кросс-таблицу переменных Размер семьииЧастота посещения ресторана. Данные находятся на листеРестораныфайлаCrossTab.xls. При отсутствии файлаCrossTab.xlsвоспользуйтесь табл.П.3.

Выполните задания 2…5предыдущего пункта, взяв в качестве третьей переменной доход.

Исследование зависимости готовности совершить туристическую поездку от возраста и пола

Постройте кросс-таблицу переменных ВозрастиТурпоездка. Данные находятся на листеТурпоездкифайлаCrossTab.xls. При отсутствии файлаCrossTab.xlsвоспользуйтесь табл.П.4.

Выполните задания 2…5предыдущего пункта, взяв в качестве третьей переменной пол.

  1. Кластерный анализ

    1. Общие сведения

Кластерный анализ – метод обработки данных маркетинговых исследований, позволяющий выявить в данных группы. В отличие от классификации, при которой группировка производится по значениям заранее заданных признаков, кластеризация проводится по комбинации признаков.

Роль кластерного анализа велика потому, что он дает основу для сегментирования.

Применение данного вида анализа, как, впрочем, и других математических методов, дает лишь основу для принятия решений, позволяет по-новому взглянуть на имеющиеся данные, найти в них не всегда очевидные закономерности.

Для примера следует взять данные об Интернет-провайдерах (табл. П.5 или файл Internet.sav.) Кластерный анализ будет проводиться с помощью пакета SPSS.

  1. Введите данные в пакет SPSS. Для этого просто откройте файл Internet.sav.

  2. Если Вы не располагаете вышеупомянутым файлом, вводите данные из табл. П.5 вручную:

  • запустите SPSS (Пуск  Программы SPSS for Windows SPSS 11.5 for Windows);

  • если откроется окно начального диалога с рамкой What would you like to do? (что Вы собираетесь делать), выберите опцию Type in data (вводить данные);

  • начинайте ввод данных.

Вид окна ввода приведен на рис.4. В организации диалога много общего с программой Excel. Собранные в результате исследования данные хранятся в таблице Data view (просмотр данных). Именно она показана на рис.4. Столбцы этой таблицы называютсяVariables(переменные), а строки –Cases(наблюдения).

Рис. 4. Вид окна ввода данныхпакета SPSS

Для описания характеристик таблицы данных, в первую очередь – ее формата служит таблица Variable view (просмотр переменных),расположенная в том же окне. Для перехода от одной таблице к другой используются ярлыки, подобные ярлыкам рабочих листов вExcel.

Число строк таблицы Variable viewсоответствует числу переменных (столбцов таблицы на листеData view), а имена столбцов фиксированы. Первый столбец таблицыVariable viewназываетсяName(имя [переменной]). Это имя помещается в заголовок столбца первой таблицы аналогично заголовку столбцаExcel, и должно начинаться с буквы. Для обеспечения возможности ввода русских букв надо выбратьView  Fonts  Набор символов  Кириллица. Здесь же можно изменить шрифт, его размер и написание букв (не рекомендуется). Второй столбец, имеющий названиеType, содержит тип данных. В примерах будут использованы типыNumeric(числовой),String(строковый). Третий столбец, под заголовкомWidth(количество символов), предназначен для задания количества символов в столбце данных. Обычно его значение остается тем, которое задано по умолчанию. То же относится и к остальным столбцам.

На листе Variable viewпеременных напечатайте в левом столбце названия переменных. Для рассматриваемого примера они даны во второй строке таблицы П.5. Первая переменная,Company,имеет типString(строковая) и длину (Width), равную15. Тип других столбцов –Numeric (числовые). Параметры остальных столбцов оставьте без изменений.

На лист Data viewвведите данные из табл. П.5.

  1. Постройте диаграмму, отражающую расположение элементов исследования (организаций) в пространстве признаков {Price, Nawed}. Для этого:

  • выберите в GraphsScatter… (графикидиаграмма рассеяния). Выберите рисунокSimple (простой) и нажмите кнопкуDefine (задать [параметры]);

  • задайте данные, отображаемые по оси Y. Для этого выделите в списке переменных в левом полеPriceи, нажав кнопку со стрелкой около текстового поляY axis, переместите названиеPrice в это поле.

Выбор переменных – типовая операция, с которой начинается практически всякая задача анализа данных. Работа с переменными в поле переменных основывается на тех же принципах, что и работа с файлами и папками в Проводнике: одна переменная выделяется щелчком мыши, несколько – последовательными щелчками при нажатой клавише Ctrlили щелчком по первой из выделяемых переменных, а затем – по последней при нажатой клавишеShift.

Для перемещения выбранных переменных в другое поле служат кнопки со стрелкой.

  • аналогично укажите, что по оси Х будут откладываться значения переменной Nawed;

  • укажите, что метками точек должны стать организации. Выделив название столбца Company, щелкните по кнопке со стрелкой, расположенной около текстового поля Label cases by: (пометить наблюдения как);

  • задайте режим вывода меток на диаграмме: нажав кнопку Options… (опции) откройте окно опций и установите флажок Display chart with case labels (отображать диаграмму с метками наблюдений). После этого выйдите из окна режимов, нажав кнопку Continue (продолжить);

Для выхода из окон задания режима используется кнопка Continue(продолжить). Для запуска вычислений после задания всех параметров – кнопкаOK.

Для отмены изменений, введенных в окно, или отказа от анализа – кнопка Cancel(отменить).

В ряде случаев для продолжения следует нажать кнопку Define(задать [параметры]).

  • получите результат, нажав кнопку OK.

Окно результатов открывается автоматически и служит для последовательного вывода всех получаемых при работе результатов. Если Вы хотите начать вывод заново, можно закрыть это окно. Его можно также сохранить как файл специального типа. Но рекомендуемый способ работы с окном результатов – сразу же копировать полученные объекты в файл Word.

Для сохранения полученных результатов выполните следующие действия.

  1. Выделите щелчком мыши диаграмму, таблицу или график.

  2. Для копирования в буфер обмена пользуйтесь опцией Copyконтекстного меню.

  3. Вставку в Word производите через Правка  Специальная вставка:

  • если доступен режим вставки Объект или Графический объект, воспользуйтесь им;

  • если доступен только текстовый режим,

  • выполните в Word действие Вставка ОбъектРисунок Microsoft Word;

  • вставьте содержимое буфера в этот рисунок как текст;

  • откорректируйте рамки рисунка таким образом, чтобы всё скопированное размещалось на одном листе, а расстояние между границами рисунка и текстом не превышало 1 см;

  • проверьте шрифт псевдографических изображений (например, дендрограммы кластерного анализа). Эти изображения будут корректными только при использовании моноширинных шрифтов, примером которых является установленный по умолчанию для таких объектов шрифт Courier.

  • закройте рисунок и вернитесь в Word.

  1. Найдите в полученной диаграмме (она представлена на рис. 5) группы провайдеров в нижней левой части, в нижней правой части и вверху.

Рис. 5. Диаграмма рассеяния для Интернет-провайдеров

Поиск их формальными методами и есть сущность кластерного анализа. Таким образом, программа ищет такие группы элементов исследования, внутри которых эти элементы схожи, а между группами различаются в большей степени.

Ситуации, подобные приведенной в примере, когда группы видны «невооруженным глазом», достаточно редки. Чаще границы кластеров размыты. Количество переменных обычно значительно превышает 2, что не позволяет строить наглядные диаграммы. Поэтому приходится применять математические формулы.

Эти формулы основаны на оценке расстояния между точками, соответствующими элементам исследования. В качестве меры расстояния d(A,В) между точками А и В чаще всего применяется евклидово расстояние:

,

где AiиBi–i-е координаты точекАиВсоответственно,m– число координат.

К другим мерам расстояния между элементами исследования относятся:

  • квадрат евклидова расстояния между точками;

  • корреляция между наборами наблюдений за парой элементов исследования.

Все вышеприведенные меры имеют следующий недостаток: расстояние, вычисляемое по ним, зависит от шкалы измерения переменных. Например, если бы цена измерялась не в рублях, а в условных единицах, расстояния были бы другими. Для решения данной проблемы используют так называемые z-шкалы, в которых из значений переменных вычитают их среднее значение и делят на стандартное отклонение. Иногда путем линейных преобразований добиваются того, чтобы все измеренные значения находились в диапазоне от-1до1. Существуют и другие методы стандартизации значений переменных различной природы.