Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕМА 10 ОПИСАТ.АН..doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
468.48 Кб
Скачать

Тема 10: описательный анализ. Базовые методы анализа маркетинговой информации

  1. Вариационный ряд: характеристика распределения данных.

  2. Гистограмма. Нормальное распределение. Выбросы данных.

  3. Обобщающие показатели: интерпретация типических значений.

  4. Среднее. Медиана. Мода. Перцентили. Квартили.

  5. Блочная диаграмма.

  6. Показатели вариации. Размах вариации.

  7. Межквартильный размах. Стандартное отклонение. Коэффициент вариации.

  8. Понятие статистической гипотезы. Параметрическая и непараметрическая гипотезы.

  9. Общая схема проверки гипотез. Нулевая гипотеза. Альтернативная гипотеза.

  10. Ошибки первого и второго рода. Возможные результаты проверки гипотез.

  11. Уровень значимости. Критическая область.

  12. Построение таблиц сопряженности признаков как метод, характеризующий совместное распределение двух или более переменных.

  13. Статистический критерий χ2. Коэффициент сопряженности признаков.

Вопрос № 1: Вариационный ряд: характеристика распределения данных.

При проведении маркетинговых исследований часто необходимо получить информацию об одной переменной. Например;

  • Какое количество потребителей определенной марки товара можно считать лояльными ей?

  • Каково соотношение между разными группами потребителей товара: много использующими, средне, слабо и не пользователями?

  • Какое количество потребителей хорошо осведомлены о предлагаемом новом товаре?

  • Сколько потребителей поверхностно знакомы, сколько что-то слышали, а сколько вообще ничего не знают о данной торговой марке? Какова средняя степень осведомленности о товаре? Сильно ли различается степень осведомленность потребителей о новом товаре?

  • Что представляет собой кривая распределения дохода для приверженцев данной марки товара? Смещено ли данное распределение в сторону группы потребителей с низкими доходами?

Ответы на подобные вопросы можно получить, изучив распределение частот значений переменной, или вариационный ряд. При таком анализе рассматривается одна переменная.

Ряды распределения, построенные по количественному признаку (возраст, стаж, сроки расследования или рассмотрения дел, число судимостей и т.д.), называются вариационными рядами.

Различия единиц совокупности (до 20 лет, 20-24 года, 25-29 лет и т.д.) количественного признака называется вариацией, а сам конкретный признак – вариантой. Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).

Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака. Вариационные ряды бывают двух типов: интервальные и безинтервальными.

В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно (разрывно, целочисленно) варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.

В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.

Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным.

Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.

Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами. В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.

ВОПРОС № 2: Гистограмма. Нормальное распределение. Выбросы данных.

Гистограмма представляет собой столбиковую диаграмму частот. По горизонтальной оси диаграммы откладывают измеренные значения из набора данных, по вертикальной – частоту встречаемости этих значений. Высота каждого столбца показывает частоту (количество) значений из набора данных, принадлежащих соответствующему интервалу, равному ширине этого столбца.

Различают следующие модификации формы гистограммы.

  1. Гистограмма с двусторонней симметрией (нормальное распределение). Гистограмма с таким распределением встречается чаще всего. Она указывает на стабильность процесса.

  1. Гистограмма, вытянутая вправо. Такую форму с плавно вытянутым вправо основанием гистограмма принимает в случае, когда невозможно получить значения ниже определенного - например для процента содержания микросоставляющих, для диаметра деталей и т.д.

3. Гистограмма, вытянутая влево. Такую форму с плавно вытянутым влево основанием гистограмма принимает в случае, когда невозможно получить значения выше определенного - например, для процента содержания составляющих высокой чистоты.

4. Двугорбая гистограмма. Такая гистограмма содержит два возвышения (которые чаще всего имеют разную высоту) с провалом между ними и отражает случаи объединения двух распределений с разными средними значениями, например в случае наличия разницы между двумя станками, между двумя видами материалов (или комплектующих), между двумя операторами и т. д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения.

5. Гистограмма в форме обрыва, у которой как бы обрезан один край (или оба). Такая гистограмма представляет случаи, когда, например, отобраны и исключены из партии все изделия параметрами ниже контрольного норматива (или выше контрольного норматива, или и те и другие). После исследования причин отклонения значений параметров от нормы и стабилизации процесса можно прекратить отбор всех изделий с параметрами, отличающимися от нормальных.

6. Гистограмма с ненормально высоким краем (в форме обрыва). Такая гистограмма отражает случаи, когда, например, требуется исправление параметра, имеющего отклонение от нормы, или при искажении информации о данных и т. д. После стабилизации процесса операции по исправлению могут быть прекращены. При этом необходимо уделить внимание случаю грубого искажения данных при измерениях и принять меры к тому, чтобы такие случаи не повторялись.

7. Гистограмма с отделенным островком. Такой гистограммой выражаются случаи, когда была допущена ошибка при измерениях, когда наблюдались отклонения от нормы в ходе процесса и т. д. По результатам анализа гистограммы делают заключение о необходимости настройки измерительного прибора или срочного осуществления контроля параметров процесса и применяют соответствующие меры.

8. Гистограмма с прогалом (с "вырванным зубом"). Такая гистограмма получается, когда ширина интервала участка не кратна единице измерения (не выражается целым числом в выбранной единице измерения), когда оператор ошибается в считывании показаний шкалы и др.

9. Гистограмма, не имеющая высокой центральной части. Такая гистограмма получается в случаях, когда объединяются несколько распределений, в которых средние значения имеют небольшую разницу между собой. Анализ такой гистограммы целесообразно проводить, используя метод расслоения.

10. Гистограмма с ярко выраженным пиком называется унимодальной

11. Если мы можем различить у гистограммы два ярко выраженных пика, то гистограмма называется бимодальной. Во многих случаях это значит, что выборки происходят из двух разных популяций, так как наличие двух мод в одной популяции маловероятное явление

12. Гистограммы с большим количеством пиков (многомодальные) встречаются крайне редко и, зачастую свидетельствуют о присутствии специальных факторов, влияющих на исследуемую систему или процесс.

13. Если каждый интервал гистограммы содержит примерно равное количество значений, то такая гистограмма называется однородной или гистограммой равномерного распределения.

14. Гистограмма называется симметричной, если она имеет симметричную форму относительно центральной линии (правая и левая стороны одинаковой формы).

15. Ассиметричные гистограммы бывают со скосом влево или вправо от осевой линии.

А) Если левая сторона гистограммы вытянута значительно больше, чем правая (или левый "хвост” значительно длиннее правого), то говорят, что гистограмма имеет отрицательную асимметрию

Б) У гистограммы с положительной асимметрией больше в сторону выдаётся правая сторона (или правый "хвост” значительно длиннее левого):

Если наблюдаемая величина подчиняется нормальному закону распределения, гистограмма числового ряда будет иметь унимодальную симметрическую форму.

Порядок построения гистограммы

  1. Собрать данные, выявить максимальное и минимальное значения и определить диапазон (размах) гистограммы.

  2. Полученный диапазон разделить на интервалы, предварительно определив их число (обычно 5-20 в зависимости от числа показателей) и определить ширину интервала.

  3. Все данные распределить по интервалам в порядке возрастания: левая граница первого интервала должна быть меньше наименьшего из имеющихся значений.

  4. Подсчитать частоту каждого интервала.

  5. Вычислить относительную частоту попадания данных в каждый из интервалов.

  6. По полученным данным построить гистограмму - столбчатую диаграмму, высота столбиков которой соответствует частоте или относительной частоте попадания данных в каждый из интервалов:

А) наносится горизонтальная ось, выбирается масштаб и откладываются соответствующие интервалы;

Б) затем строится вертикальная ось, на которой также выбирается масштаб в соответствии с максимальным значением частот.