Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Каменева Поляков МИ.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.75 Mб
Скачать

7.7. Методы корреляционного и регрессионного анализа

Анализ и обобщение данных маркетинговых исследований осуществляются методами ручной или компьютерной обработ­ки. Для обработки используются как описательные, так и ана­литические методы. Из аналитических методов в маркетинге часто применяются: анализ трендов, методы нелинейной регрессии и коррекции, дискриминантный анализ, кластерный анализ, фак­торный анализ и др. Возможные направления применения от­дельных аналитических методов показаны в табл. 7.34.

Маркетинговые исследования показывают, что вариация каж­дого изучаемого признака находится в теснейшей связи и взаи­модействии с вариацией других признаков, характеризующих

276

Таблица 7.34

Примерь! использования аналитических методов

Метод

Вопросы

Регрессионный ана­лиз

Как изменится объем сбыта, если объем рекламных меро­приятий сократить на 10%? Как оценить цену на доллары в последующие шесть меся­цев? Имеет ли влияние объем инвестиций в нефтяную отрасль на благосостояние россиян?

Дисперсионный ана­лиз

Влияет ли упаковка на уровень объема сбыта? Влияет ли цвет объявления на число лиц, которые вспоми­нают о рекламе? Имеет ли влияние выбор каналов сбыта на объем сбыта?

Дискриминантный анализ

Чем различаются курящий и некурящий? Разработайте классификацию кредитоспособности покупа­телей кредита по признакам: «заработная плата», «образо­вание», «возраст».

Факторный анализ

Как установить зависимость многочисленных операций, к которым особо чувствительны покупатели автомобилей, от нескольких комплексных факторов? Как описать влияние этих факторов на различные марки строящихся автомобилей?

Кластерный анализ

Распределить на группы покупателей крупного торгового центра в соответствии с их потребностями. Как определить тип читателей известного журнала? Можно ли классифицировать покупки в соответствии с Ва­шими интересами в политических процессах?

Многоразмерное шкалирование

В какой мере соответствует продукт Вашей фирмы идеаль­ному представлению покупателей? Какой имидж имеет Ваша фирма? Изменится ли позиция покупателей к приобретению в тече­ние пяти лет?

исследуемую совокупность единиц. Исследования служат выяс­нению того, каковы связь между двумя переменными и степень этой связи. Например, связь между рекламным бюджетом и объе­мом продаж, ценой и сбытом и т.д. При изучении конкретных зависимостей одни признаки выступают в качестве факторов (фак­торные признаки), а другие — являются результативными при­знаками.

Рассматривая зависимости между признаками, необходимо выделить прежде всего две категории связи: 1) функциональную и 2) корреляционную.

Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением резуль­тативной величины, и каждому значению признака-фактора со-

277

ответствуют вполне определенные значения) результативного признака. В корреляционных связях между изменением фактор­ного и результативного признаков нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. В простейшем случае применения корреляционной зависимости величина ре­зультативного признака рассматривается как следствие измене­ния только одного фактора (например, рекламный бюджет рассматривается как причина роста объема продаж). Выделенный в данном примере в качестве основного признак-фактор не яв­ляется единственной причиной изменения результативного при­знака, а наряду с ним на величину результативного признака влияет множество других причин, например, качество товара, низкая цена, продажный сервис, кадры, экономическая ситуа­ция в данный момент и др.

Кроме того, сам признак-фактор, в свою очередь, может зави­сеть от изменения ряда обстоятельств. В сложном взаимодействии находится результативный признак — в более общем виде он вы­ступает как фактор изменения других признаков. Одновремен­ное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распре­деление значений результативного признака, поскольку в каж­дом конкретном случае прочие факторные признаки могут из­менять силу и направленность своего воздействия.

При сравнении функциональных и корреляционных зависи­мостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину фактор­ного признака, точно определить величину результативного при­знака. При наличии же корреляционной зависимости устанавли­вается лишь тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жест­кости функциональной связи, корреляционные связи характери­зуются множеством причин и следствий, и устанавливаются лишь их тенденции.

С помощью статистических методов изучения зависимостей можно установить, как проявляется теоретически возможная связь в данных конкретных условиях и какова количественная харак­теристика этой зависимости. Зная характер зависимости одного явления от других, можно объяснить причины и размер изме­нений в явлении, а также планировать необходимые мероприя­тия для дальнейшего его изменения.

278

При исследовании корреляционных зависимостей между при­знаками решению подлежит широкий круг вопросов, к которым следует отнести: 1) предварительный анализ свойств моделируе­мой совокупности единиц; 2) установление факта наличия свя­зи, определение ее направления и формы; 3) измерение степе­ни тесноты связи между признаками; 4) построение регресси­онной модели, т.е. нахождение аналитического выражения связи; 5) оценку адекватности модели, ее экономическую интерпрета­цию и практическое использование.

Простейшим приемом обнаружения связи является сопостав­ление двух параллельных рядов — ряда значений факторного признака и соответствующих ему значений результативного при­знака. Результативный признак обозначается через у, а фактор­ный — через х. Например, маркетинговые исследования сети из 20 сбытовых предприятий показали затраты на рекламу и объем сбыта (табл. 7.35).

Из общего анализа видно, что увеличение рекламы способ­ствует увеличению объема продаж.

Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Для резуль­тативного признака необходимо определить величину интерва­ла. Для этого воспользуемся формулой Стерджера:

h = (Утах ~ Ут,п>

= 110 тыс. руб.

3'322 18") = (1200 - 65°) / 5 =

Таблица 7.35

Зависимость объема сбыта от затрат на рекламу

Номер дочернего предпри­ятия

Затраты на рекламу, тыс. руб.

Объем сбыта, тыс. руб.

Номер дочернего предприятия

Затраты на рекламу, тыс. руб.

Объем сбыта, тыс. руб.

1

20

700

11

22

900

2

20

750

12

22

950

3

20

650

13

22

1000

4

21

750

14

23

900

5

21

700

15

23

900

6

21

780

16

23

950

7

21

800

17

23

1000

8

21

900

18

24

1100

9

22

850

19

24

1200

10

22

950

20

24

1100

279

При формировании первого интервала от минимального зна­чения следует отступить на половину длины интервала и далее формировать интервалы.

В корреляционной таблице факторный признак х располага­ется в строках, а результативный у — в столбцах. Числа, распо­ложенные на пересечении строк и столбцов, означают частоту повторения данного сочетания значения х и у (табл. 7.36).

При этом fx — частота повторения данного варианта значе­ния факторного признака во всей совокупности; f — частота по­вторения результативного признака во всей совокупности. Ве­личина yt, например для группы х = 21, определится как:

у21 = (2 х 750 + 2 х 816 + 1 х 927)/5 = 973,8.

Корреляционная таблица дает возможность выдвинуть пред­положение о наличии или отсутствии связи, а также выяснить ее направление. Если частоты в корреляционной таблице распо­ложены на диагонали из левого верхнего угла в правый нижний угол (т.е. большим значениям фактора соответствуют большие значения функции), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же час­тоты расположены по диагонали справа налево, то предполага­ют наличие обратной связи между признаками.

По данным табл. 7.35 построим поле корреляции рассматри­ваемых факторов (рис. 7.5).

Характер распределения случайных величин на поле корре­ляции свидетельствует о наличии рассматриваемых связей. Итак, увеличение средних значений результативного признака с уве­личением значений факторного признака еще раз свидетельствует

Таблица 7.36

Центральное значение интервала, у

705

816

927

1038

1149

f*

У

\. Группы

>v ПО у

пох ^\

650-760

761-871

872-982

983-1093

1094-1204

20 21 22 23 24

со см

2

1

1 3 3

1 1

3

3 5 5 4 3

705 793,8 927 954,75 1149

fy

5

3

7

2

3

20

280

1400

1200

1000

800

Точечная 1

600

400

200

1 9 20 21 22 23

Рекламный бюджет

24

25

Рис. 7.5. Поле корреляции

о возможном наличии прямой корреляционной зависимости объема сбыта от величины рекламы.

Другим приемом обнаружения связи является построение групповой таблицы. Все наблюдения разбиваются на группы в зависимости от величины признака, и по каждой группе вычис­ляются средние значения результативного признака (табл. 7.37).

Величина у. определяется как среднеарифметическое зна­чение объемов сбыта в группе рекламного бюджета, например, у20 = (700 + 750 + 650)/3 = 700.

Сравнив значения результативного признака по группам, можно сделать вывод, что увеличение рекламного бюджета спо­собствует сбыту, что подтверждается прямой корреляционной зависимостью между признаками.

Таблица 7.37

Группы дочерних фирм по рекламному бюджету, тыс. руб.

Число фирм в группе

Средний объем сбыта в группе фирм, тыс. руб., у/ср

20

3

700

21

5

786

22

5

930

23

4

937

24

3

1133

Итого

20

281

Для выявления связи и ее характера используют графический метод. На основе данных таблиц строится в прямоугольных ко­ординатах точечный график, который называют «полем корре­ляции» (рис. 7.6).

Положение каждой точки на графике определяется величи­ной двух признаков: величиной рекламного бюджета и соответствующим ему объемом сбыта. Точки корреляционного поля не лежат на одной линии, они вытянуты определенной полосой слева направо. Имеющийся статистический материал был сгруппирован (табл. 7.34), и по каждому значению реклам­ного бюджета определены значения среднего объема сбыта. На­неся эти средние на график и соединяя последовательно отрез­ками прямых соответствующие им точки, получают так называ­емую эмпирическую линию связи.

Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи между признаками. Если же имеется тен­денция неравномерного изменения значений результативного признака и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием кри­волинейной корреляционной связи.

Эмпирическая кривая

_Теоретическая линия у =100,35*-1311

24

у„ тыс. руб 1200'

1100 1000 900 800 700 600

20 21 22 23

х„ тыс. руб

Рис. 7.6. Графическая зависимость величины рекламного бюджета — х,

и объема сбыта — у(

282

Показатели тесноты связи между признаками называют ко­эффициентами корреляции. Их выбор зависит от того, в каких шка­лах измерены признаки. Напомним, что основными шкалами являются следующие.

  1. Номинальная шкала (наименований) — предназначена для описания принадлежности объектов к определенным социальным группам. Эти наименования могут быть как смысловыми (ИТР, рабочий), так и кодовыми (цифровыми, буквенными). При этом числа в них имеют только два отношения: = и *.

  2. Шкала порядка (ординальная) — применяется для измере­ ния упорядоченности объектов по одному или нескольким при­ знакам. Типичным примером признаков, измеренных в поряд­ ковых шкалах, являются экзаменационные оценки, тестовые бал­ лы при изучении социальных и психофизических параметров человека. Отношения между признаками, измеренными в поряд­ ковых шкалах: <;>;=.

  3. Количественная шкала — используется для описания ко­ личественных показателей (заработная плата, численность группы, демографические характеристики, стоимость потребительской корзины и т.п.).

Выявление связи между признаками осуществляется следую­щим образом: выдвигается нулевая статистическая гипотеза об отсутствии связи между признаками; рассчитывается соответству­ющий коэффициент корреляции к; проверяется, превосходит ли он некоторое критическое значение к т. Если к > к т , то ги­потеза об отсутствии связи отвергается.

Расчет линейного коэффициента корреляции для несгруппиро-ванных данных можно производить по формулам:

г де jc и у — значения признаков, а х и у — их средние значе­ния (х = ]Гх,/ п, у=^у,/п);

2) r^

где хну — значения признаков, между которыми определя­ется коэффициент корреляции; п — объем выборки;

3) К^

Линейный коэффициент корреляции \R\ < 1. Знак коэффици­ента характеризует направление взаимосвязи. Абсолютная вели­чина R характеризует степень тесноты рассматриваемой взаимо­связи.

Значимость линейного коэффициента корреляции определя­ется по таблицам критических значений Ran, где а — уровень значимости (чаще всего 0,05), N — объем выборки. Линейный коэффициент корреляции может принимать значения от —1 до + 1. Чем ближе коэффициент корреляции по абсолютной вели­чине к 1, тем теснее связь между признаками. Можно восполь­зоваться упрощенным правилом: если \R\ < 0,3, то связь практи­чески отсутствует; если 0,3 < |i?| < 0,5, то связь слабая; если 0,5 < \R\ < 0,7, то связь достаточно сильная; если \R\ > 0,7, то имеется высокая степень зависимости между признаками.

Например, используя данные табл. 7.33, проведем расчет ли­нейного коэффициента корреляции.

Для I = 20 величины у у = 178300, £*, = 439, £х, у( = = 394680,

(1><)2 = 192721, (Y,y,)2 = 317908900, £*,■ 2 =9669,

^у,2 = 16 305 900. Подставляя эти значения в выражение (2),

получим R = 0,9.

Полученная величина линейного коэффициента корреляции свидетельствует о наличии тесной прямой связи между рассмат­риваемыми признаками.

Знак при линейном коэффициенте корреляции указывает на направление связи: прямой зависимости соответствует знак плюс, обратной зависимости знак минус.

Квадрат коэффициента корреляции носит название коэффи­циента детерминации. Коэффициент детерминации можно счи­тать определенным равенством:

„г Объясненная вариация

л = .

Суммарная вариация

284

Для примера с рекламным бюджетом величина R2 = 0,81, что означает: 81% вариации успешного сбыта объясняется затрата­ми на рекламный бюджет.

Рассмотрим ситуацию использования частного коэффициен­та корреляции. Этот коэффициент выявляет степень «чистого» влияния факторного признака на результативный признак.

Например, маркетологи обнаружили, что отношение покупа­теля к рекламе служит промежуточным звеном между распозна­ванием торговой марки и отношением к ней. Чтобы установить степень связи отношения к рекламе с отнршением к торговой марке и доверием к ней, следовало вычислить частный коэффи­циент корреляции с одновременным исключением влияния от­ношения к рекламе.

Предположим, что в ситуациях, когда маркетолог желает ус­тановить связь между рекламным бюджетом х и объемом про­даж у через имидж торговой марки z (рис. 7.7), следует исполь­зовать коэффициент парной корреляции i?vr между хиги вы-

Имидж торговой марки

' Рекламный бюджет

Рис. 7.7. Гипотетическая взаимосвязь между величиной рекламного бюджета и объемом продаж через имидж торговой марки

285

числить значения х, исходя из информации о z- Затем получен­ное значение х вычитают из фактического значения х, получая скорректированное значение х. Аналогично корректируют зна­чение у. Частный коэффициент корреляции вычисляется через простые парные коэффициенты корреляции, т.е.:

1) частный коэффициент корреляции R z между результатив­ным признаком х при исключении z-

2 ) частный коэффициент корреляции R^ характеризует за­висимость результативного признака от фактора z при исключении влияния фактора х:

_

Величина совокупного коэффициента корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем лю­бой из образующих его парных коэффициентов корреляции. Чем ближе совокупный коэффициент корреляции к 1, тем меньше роль неучтенных при анализе факторов и тем больше оснований счи­тать, что параметры регрессионной модели отражают степень эффективности включенных в нее факторов.

В нашем примере, если отношение к рекламе значимое, част­ный коэффициент корреляции должен быть значительно мень­ше, чем парный коэффициент корреляции между доверием к тор­говой марке и отношением к рекламе.

Частный коэффициент корреляции характеризуется порядком, который указывает количество переменных, на которые необхо­димо внести поправку или которые следует исключить. Простой коэффициент корреляции имеет нулевой порядок. Частный ко­эффициент R^ z имеет порядок, равный 1, так как он контроли­рует эффект одной переменной z- Частные коэффициенты бо­лее высокого порядка вычисляют аналогично.

Регрессионный анализ используется для изучения связей меж­ду зависимой переменной и одной или несколькими независи­мыми переменными. Ранее приведенные примеры простой кор­реляции рекламного бюджета и объема сбыта рассмотрим на

286

примере регрессии. Регрессионный анализ применяют в следу­ющих случаях.

  1. Для установления взаимозависимости переменных.

  2. Для определения тесноты связи между зависимой и неза­ висимыми переменными.

  3. Для определения математической зависимости между пе­ ременными.

  4. Для предсказания значения зависимой переменной.

5. Для определения значимости переменной. Простейшей системой корреляции связи является линейная

связь между двумя признаками, или парная линейная корреля­ция. Уравнение парной линейной корреляционной связи назы­вается уравнением парной регрессии и имеет вид:

у = а + Ьх,

где у — среднее значение результативного признака у при

определенном значении факторного признака х; а — свободный член уравнения;

Ъ — коэффициент регрессии, измеряющий среднее отноше­ние отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения — вариация у, приходящаяся на единицу вариации х. Параметры а и b находятся следующим образом: 1. Решая уравнения

Например, для определения коэффициентов влияния величины рекламного бюджета на объем сбыта из табл. 7.34 составим урав­нения:

Г20а + 439Z» = 17 830

[439а+ 96696 = 394 680.

Решая представленные уравнения совместно, получим: а = -1311; b = 100,35. Уравнение линейной регрессии примет вид у = 100,35а:- 1311.

287

2. Исходя из преобразований данных корреляционной таблицы:

[a = y-bx.

Параметр b в уравнении называют коэффициентом регрессии. Коэффициент регрессии показывает, на сколько в среднем из­меняется величина результативного признака у при изменении факторного признака х на единицу. При наличии прямой кор­реляционной зависимости коэффициент регрессии имеет поло­жительное значение, а в случае обратной зависимости — отри­цательное. Так, например, по данным таблицы при отклонении рекламного бюджета на 1 тыс. руб. от средней величины вели­чина сбыта отклоняется от своего среднего значения на 100,35 тыс. руб. в среднем по совокупности.

Геометрический коэффициент регрессии представляет собой наклон прямой линии, изображающей уравнение корреляцион­ной зависимости, относительно оси х.

Если результативный признак с увеличением факторного признака возрастает (или убывает) не бесконечно, а стремится к конечному пределу, то для анализа такого признака применя­ется уравнение гиперболы вида:

i-, где al=

Например, по 10 магазинам получены данные по товарообо­роту (табл. 7.38).

Тогда а;= 23,7 ао= 7,448, уравнение гиперболы примет вид у = 7,448 + 23,7/jc.

Коэффициент регрессии применяют для определения коэф­фициента эластичности Э, который показывает, на сколько про­центов изменится величина результативного признака у при из­менении фактора х на 1%.

,3с

288

Таблица 7 38

Номер магазина

Товарообо­рот (х), тыс. руб.

Товарные запасы (у), дней

1/х=х,

х2

1 2 3 4 5 6 7 8 9 10

5 3 24 35 44 55 63 74 82 95

18 12 8 8 8 8 7 6 8 8

0,20 0,333 0,0417 0,0008 0,0227 0,0182 0,0159 0,0135 0,0122 0,0105

0,040 0,1111 0,0017 0,0008 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001

3,60 3,9996 0,3336 0,2288 0,1816 0,1456 0,1113 0,0810 0,0976 0,0840

Итого

480

91

0,6996

0,1550

8,8631

Для рассматриваемого примера коэффициент эластичности будет равен:

Эх = 100,35 х 21,95 / 891,5 = 2,47,

где х = 5>,/« = 21,95, }; = £>,/« = 891,5.

Это означает в терминах динамики, что при росте рекламно­го бюджета на 1% средний объем сбыта возрастет на 2,47%.

Рассмотрим пример. Имеются следующие данные об объеме R выполненной имиджевой рекламы и непосредственно имидже — Я фирмы, полученном в результате рекламной ак­ции (табл. 7.39).

Предполагая, что между переменными R и И существует ли­нейная зависимость, найдем эмпирическую формулу вида R = aH + b методом наименьших квадратов. Решение оформля­ется в виде таблицы (табл. 7.40).

Система нормальных уравнений в общем случае имеет вид:

В нашем случае система уравнений примет вид:

988,52а+ 109,136 = 59847,06

109,13л + 66 = 3288 Ее решение а =12,078 , Ъ =328,32 дает искомую зависи-

мость:

289

Таблица 7.39