Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МИ 2 семестр. Карпов Иван Алексеевич.docx
Скачиваний:
19
Добавлен:
20.11.2018
Размер:
62.5 Кб
Скачать

Анализ маркетинговой информации

Предварительными аналитическими этапами исследования являются редактирование, кодирование и табулирование (в т.ч. преобразование из бумажных носителей в электронные).

  • РЕДАКТИРОВАНИЕ делится на

  • полевое, т.е. предварительное редактирование, проводимое руководителем полевых исследований, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза пропуски и неточности в сборе данных. Контроль полевого персонала - супервайзер.

  • централизованное офисное редактирование – всеобъемлющая проверка и коррекция заполненных форм сбора данных, включает принятие решения о том, что с этими данными делать. На этапе редактирование – использовать ли в принципе анкету, заполненную не полностью или исключить из обрабатываемого массива.

Считается, что в правильно заполненной анкете вариантом «другое», «затрудняюсь ответить» и т.д. отводится не более 10% от общего числа ответов.

  • КОДИРОВАНИЕ. Посредством кодирования «сырые» данные превращаются в символы, которые можно табулировать (внесение в таблицу) и подсчитывать.

Обычно кодирование открытых вопросов устанавливается при конструировании носителя собираемых данных. (Например, в анкете 1. Да, 2. Нет.)

При кодировании неструктурированных вопросов первоначально анализируют все заполненные анкеты для составления от 50 до 100 наиболее частых вариантов ответа и определяются категории, подлежащие кодированию. Коды категорий должны быть взаимо исключаемыми и взаимно исчерпывающими. По наиболее важным вопросам коды категорий должны присваиваться даже в том случае, если они не упоминались ни одним респондентом.

Так как при кодировании могут использоваться несколько кодировщиков, то для соблюдения логической последовательности обработки данных эту работу необходимо разделять по задачам, а не в равной степени между людьми.

Поскольку при кодировании ответов и создании электронной таблицы существует большая вероятность ошибки, поэтому кроме периодической проверки рекомендуется выборочная проверка до 25% анкет.

Если на вопрос не ответили, то это рекомендуется отмечать резко выделяющимся числом одинаковым для всех вопросов (ноль).

Для расшифровки полученных данных создается кодировочная таблица, в которой указывается соответствие исходных данных используемым кодам.

Работа с пропущенными значениями. Существует несколько методов работы с пропущенными ответами.

I метод: Замена пропущенного значения нейтральна. Обычно берется среднее значение по данной переменной.

Вопрос №1

Вопрос №2

Анкета 1

Значение. (Кодировка 3)

Значение. (Кодировка 5)

Анкета 2

… (среднее значение)

Значение (Кодировка 6)

II метод: Замена пропущенного значения условным. Для этого используют структуру ответов респондентов по другим вопросам.

III метод: Исключение объекта целиком, т.е. всей анкеты.

IV метод: Попарное исключение переменных. В данном случае исследователь во всех своих вычислениях рассматривает только наблюдение, по которым есть ответ.

V метод: Взвешивание. Каждому респонденту присваивается весовой коэффициент, отображающий степень его значимости. (Например, веса распределяются по количеству покупок, которые совершил респондент при оценке характеристик торговой марки). Этот метод разрушает природу само взвешенности любого выборочного исследования. (Пропорции уже соблюдены в ходе выборки и исследователь не может их менять).

VI метод: Переопределение переменной. Цель состоит в создании переменных, максимально отвечающих задачам исследования. Например, первоначально был «показатель частоты использования продукции» по 10 категориям. В результате переопределения их сокращают до 4 категорий: «пользуюсь часто», «средне», «редко» или «никогда».

VII метод: Преобразование шкалы. Необходимо для получения возможности сравнения с другими шкалами.

Статистическая обработка значений. Общей процедурой преобразования шкал является нормализация (нормирование). Рассчитывается по следующей формуле:

Zi= (xi-xср)/ S

Zi – нормированное значение

xi -Значение i-го признака

S – стандартное отклонение (среднее квадратичное отклонение)

  • ТАБУЛИРОВАНИЕ заключается в подсчете количества событий, которые попадают в различные категории. Выделяют следующие виды табуляции:

  • простая табуляция подразумевает подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной (подсчет вариантов ответов на конкретный вопрос).

В итоговую таблицу выводятся процентные значения ответов респондентов с обязательным указанием общего числа событий, на котором базируется процентное представление.

  • перекрестная табуляция – подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на 2 или более переменных, рассматриваемых одновременно. В результате получают перекрестные таблицы кросс-табуляции или таблицы сопряженности признаков.

При расчете процентного выражения значений переменных необходимо следовать правилу «частости» - всегда рассчитывайте проценты направлении причинного фактора, либо поперек результирующего. (см. таблицы)

Существуют результаты МИ, полученные в результате опроса. В них 37500 долларов – медиана доходов всей совокупности. Эту цифру использовали для разделения семей выборки на две группы – группу, имеющую доходы ниже среднего, и группу, в которой они выше среднего. Результаты можно представить в следующих видов.

Количество легковых автомобилей по отношению к семейному доходу.

Доход

1 (нет)

2 или более

Всего

Число событий

Менее 37

89%

11%

100%

54

Более 37

59%

41%

100%

46

Для уточнения природы взаимосвязей между 2мя переменными в анализ вводят третью переменную. Результатом введения 3-ей переменной может быть

  • уточнение связи, наблюдаемой между двумя переменными;

  • указание на отсутствие связи между 2мя переменными, хотя первоначально связь наблюдалась;

  • демонстрация некоторой связи между 2мя переменными, хотя первоначально она не наблюдалась (скрытая взаимосвязь);

  • указание на отсутствие первоначальной связи.

Размер семьи

1 (нет)

2 или более

Всего

Число машин

4 или менее

90%

10%

100%

78

5 или более

23%

77%

100%

22

Для определения фактора, оказывающего наибольшее влияние необходимо рассчитать разность долей как функции уровня переменной. При этом, если имеет место статистическое взаимодействие между независимыми переменными, необходимо рассчитать среднее отдельных эффектов по формуле средней взвешенной.