Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Количественные методы анализа хозяйственной деятельности - Ричард Томас

.pdf
Скачиваний:
317
Добавлен:
24.05.2014
Размер:
7.39 Mб
Скачать

 

 

 

 

 

 

 

 

СООТНОШЕНИЯ

103

 

 

 

 

 

 

 

 

 

Год:

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

Объем

 

 

 

 

 

 

 

 

 

 

продаж:

19

22

27

26

30

32

36

37

39

42

Рис. 3.3. График объема продаж

На рис. 3.3 эти данные представлены в виде фафика разброса. По горизон­ тальной оси указан год, а по вертикальной оси — объем продаж в млн. упаковок.

Из фафика видно, что между годом и объемом продаж, похоже, существу­ ет некая зависимость. В принципе, объем продаж увеличивается с каждым го­ дом. Зависимость не идеальна, хотя точки лежат очень близко к прямой линии, что видно на графике. Таким образом, зависимость между годом и объемом продаж, скорее всего, линейная.

Пример 2

А теперь рассмотрим не количественный объем продаж, а выручку от реали­ зации компании «Петлокс». В таблице приведена годовая выручка от реализации «Barley Krisps» за аналогичный десятилетний период. (Цифры обозначают млн. долл. США):

Год:

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

Выручка

 

 

 

 

 

 

 

 

 

 

от реа­

 

 

 

 

 

 

 

 

 

 

лизации:

14

15

17

20

24

30

48

49

59

67

Эти данные представлены на рис. 3.4. И снова, похоже, фафик разброса показывает на существование зависимости между годом и объемом выручки. Точки, нанесенные на графике, больше соответствуют кривой, а не прямой линии, как это показано на графике. Такой тип нелинейной зависимости часто возникает при отображении данных экономического характера, где инфляционные процессы искажают исходные цифры. Возможно, если дан­

ные, представленные

в

нашем примере, сравнить в реальном выражении,

без учета инфляции,

то

полученный в результате график представит

линей­

ную зависимость. Для

подтверждения этого необходим дальнейший

анализ

фактических данных.

 

 

 

104

ГЛАВА 3

'92 93 Годы

Рис. 3.4. График выручки от реализации

3.3. Линейный коэффициент корреляции

Как это уже было показано в предыдущих разделах, график разброса можно использовать для иллюстрации того, имеется или нет зависимость между двумя переменными. Однако полученный фафик может оказаться достаточно субъектив­ ным. При использовании фафика наличие или отсутствие зависимости между дан­ ными все же зачастую определяется исходя из личного мнения. Рассмотрим, на­ пример, фафик на рис. 3.1. Точки разбросаны в достаточно широком диапазоне. Похоже, что большие значения одной переменной соответствуют большим значе­ ниям другой и, наоборот, малые значения двух переменных соответствуют друг другу. Однако зависимость не является идеальной, и, возможно, если нанести еще несколько точек, мы, вероятно, получим еще больший их разброс. И наоборот, дополнительные точки на фафике могут указать на более сильную зависимость. Таким образом, мы видим, что фафик не может дать определенного ответа отно­ сительно того, есть или нет зависимость между переменными. График разброса — это субъективный аналитический инструмент, и здесь требуется более объектив­ ный подход. Такой подход может заключаться в вычислении коэффициента корре­ ляции, о чем мы будем говорить в этом разделе.

Степень «прямолинейной» зависимости можно измерить с помощью Пирсоновского коэффициента корреляции. Это значение, обычно просто называемое линейным коэффициентом корреляции, измеряет степень линейной зависимости между двумя переменными хиуи рассчитывается по следующей формуле:

Y,xy-nxy

 

г = ^(Zx'-nxl^y'

пу')

Значение линейного коэффициента корреляции, обозначаемое как г, ле­ жит между —1 и +1. Значения, близкие к +1 или —1, указывают на хорошую корреляцию между двумя переменными. Графики разброса, представленные на рис. 3.5, иллюстрируют различные коэффициенты корреляции для различных наборов данных. Эти фафики должны помочь нам понять и интерпретировать диапазон вероятных значений г

СООТНОШЕНИЯ

105

На рис. 3.5 (i) представлена ситуация, когда имеется идеальная корреляция между двумя переменными. Все точки фафика лежат точно на прямой линии. Имеется прямая (или положительная) корреляция между двумя переменными, так как увеличение значения одной переменной всегда соответствует увеличе­ нию значения другой переменной. Это можно отобразить прямой линией с положительной крутизной. Линейный коэффициент корреляции в данной ситу­ ации будет равен +1.

График разброса на рис. 3.5 (ii) показывает ситуацию, когда имеется неко­ торая степень положительной корреляции. Точки лежат в узкой полосе, направ­

ленной слева направо и вверх. Данный фафик схож с фафиком

на рис. 3.1.

30

(I) Идеальная корреляция

30 (li) Некоторая положительная корреляция

25

 

 

 

 

 

25

 

 

 

 

 

 

 

20

 

 

 

 

 

20

 

 

 

 

 

 

 

15

 

 

 

 

 

15

 

 

 

 

 

 

 

10

 

 

 

 

 

10

 

 

 

 

 

 

 

5

 

 

 

 

 

5

 

 

 

 

 

 

 

О

4

6

8

10

12

О

2

4

6

8

10

12

14

 

0

30

(III) Отсутствие

корреляции

30 (IV) Некоторая отрицательная корреляция

25

 

 

 

 

 

25

 

 

 

 

 

 

 

20

 

 

 

 

 

20

 

 

 

 

 

 

 

15

 

 

 

 

 

15

 

 

 

 

 

 

 

10

 

 

 

 

 

10

 

 

 

 

 

 

 

5

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

О

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

10

12 14

О

 

 

 

 

10

12

14

 

 

 

 

 

 

 

 

(V) Идеальная обратная корреляция

Рис. 3.5. Сравнение коэффициентов корреляции

График на рис. 3.5 (ii) показывает, что увеличение значений одной пере­ менной соответствует увеличению значений второй переменной. В этом случае значение коэффициента корреляции будет близко к +1, например, значения порядка 0.8 или 0.9 вполне вероятны. Линейный коэффициент корреляции тем ближе к +!, чем точки ближе к прямой линии.

На рис. 3.5 (iii) представлена ситуация, при которой между двумя перемен­ ными нет зависимости. Точки разбросаны по всему фафику, так что невозмож­ но проследить какой бы то ни было логики. В этом примере коэффициент корреляции будет близок или равен нулю.

На рис. 3.5 (iv) показана определенная степень отрицательной (или обрат­ ной) зависимости. Точки лежат вразброс в узкой полосе, направленной слева направо и вниз. Это указывает на то, что увеличение значений одной перемен­ ной соответствует уменьшению значений другой переменной В этом случае значение коэффициента корреляции будет офицательным и стремиться к —1, т.е., например, могут быть получены значения порядка —0.7, —0.8.

106

ГЛАВА 3

На последнем графике, рис. 3.5 (v), показана идеальная обратная корреля­ ция между лв>мя переменными. Все точки лежат на прямой линии с отрица­ тельной крутизной. Это указывает на то, что когда значения одной переменной увеличиваются, мы можем быть уверены, что значения другой переменной буду1 уменьшаться. Такие данные дадут коэффициент корреляции, равный —1

Т Определение. Коэффициент корреляции является инструментом измерения тесноты линейной зависимости между двумя переменными. Значение коэффициеь та корреляции находится в пределах от — / до +7. А

С тем, чтобы лучше уяснить сущность коэффициента корреляции, целесооб­ разно рассмотреть еще один фафик разброса. Нельзя не обратить внимание на тот факт, что значение г только определяет степень корреляции между двумя пере­ менными. Это просто показатель «прямолинейной» зависимости переменных.

Таким образом, мы можем получить нулевое значение коэффициента кор­ реляции даже в том случае, если между двумя переменными существует опре­ деленная зависимость. Такая ситуация представлена на рис. 3.6. Значение г на основании лих данных, скорее всего, близко к нулю, хотя со всей очевидно­ стью ясно, 410 между переменными существует идеальная зависимость.

О

2

4

6

8

10

12

14

Рис. 3.6. Отсутствие прямолинейной зависимости

Одгоко данную зависимость можно рассматривать как нели1(ейную; можно соединить все точки фафика разброса плавной кривой. Отсюда, хотя между переменными и существует определенная зависимость, эта зависимость — не пря.молинейная, и потому корреляция равна нулю.

Пример 1

Рассмотрим значения х тл у, приведенные в таблице:

х-

1

2

3

4

5

у

3

5

7

9

11

Мы предоставляем вам возможность самостоятельно нарисовать фафик разброса, чтобы отобразить пары значений х я у. Видно, что между двумя пе­ ременными существует прямая зависимость. Все точки лежат на прямой линии, показывая идеальную корреляцию. Таким образом, как нам уже известно, ко­ эффициент корреляции должен быть равен +1. Данный пример будет использо­ ваться Д;'1я иллюстрации методов вычисления коэффициента корреляции. Коэф­ фициент корреляции рассчитывается путем нахождения соответствующих сумм

СООТНОШЕНИЯ 107

Z^^ • ИУ'^ ^ Ц^У • Кроме того, для расчета средних, х и у, будут использо-

ва1ься суммы Х-^ и ИУ •

Нижеприведенная таблица используется для расчета искомых сумм. Значе­ ния X и у приведены в первых двух колонках, а остальные колонки использу­ ются для вычисления искомых значений.

 

 

 

 

у2

ху

 

1

3

1

9

3

 

2

5

4

25

10

 

3

7

9

49

21

 

4

9

16

81

36

 

5

11

25

121

55

Итого:

15

35

55

285

125

Суммы, полученные из данной таблицы, таковы:

1х= 15; Х У = 35; ^х^ = 55; ^.У^ = 285; 1ху= 125.

Таким образом, средние значений х и у могут быть вычислены следующим образом:

_ 1х 15 -

х = ^ ^ = — = 3;

п

5

п

5

Теперь мы можем вычислить линейный коэффициент корреляции:

J^xy-nxy

 

125-5-37

'(Tx'-nx'lZy'-nf)

^(55-5.32)(285-5-72)

125-105

20

20

20

^(55-45)(285-245)

^(10)(40)

V400

20

Следовательно, как и ожидалось, значение г равно +1. Это указывает на идеальную корреляцию между двумя переменными.

Пример 2

Рассмотрим вновь количество баллов, полученных кандидатами при про­ хождении ими двух оценочных тестов. Итак, результаты таковы:

 

 

 

 

Кандидат

Е

Ж

 

 

А

Б

В

Г

Д

3

Математика (х)

12

14

15

15

18

19

20

23

Логика речи (у)

16

19

21

15

22

17

13

21

Степень корреляции можно вычислить с помощью уже описанного коэф­ фициента корреляции. Мы имеем два набора данных: баллы за математику и

108

ГЛАВА 3

логику речи. Их можно обозначить двумя переменными х и у, как это показано в таблице Теперь с помощью таблицы можно вычислить линейный коэффици­ ент корреляции

Итак, согласно таблице мы имеем следующие суммы:

Хх= 136; Zy= 144; ^х^ = 2404; Х>'^ = 2666; ^ху= 2460.

Таким образом, средние значений х и у определяются следующим образом

 

144

 

 

 

 

 

 

п

8

 

 

 

 

 

 

 

 

12

16

144

256

 

ху

 

 

 

192

 

 

14

19

196

361

 

266

 

 

15

21

225

441

 

315

 

 

15

15

225

225

 

225

 

 

18

22

324

484

 

396

 

 

19

17

361

289

 

323

 

 

20

13

400

169

 

260

 

 

23

21

529

441

 

483

 

Итого:

136

144

2404

2666

2460

Значение коэффициента корреляции составляет:

 

 

 

Y^xy-nxy

 

_

2460-817-18

 

 

г- ^{Т.х^-пх^^у^

-пу^)

^(2405-8172)(2666-818^)

 

 

2460 - 2448

 

12

12

12

 

 

\/(2404-2312X2666-2592) л/9274 л/бШ 82.511

 

 

Следовательно, г =

0.145.

 

 

 

 

на то, что корреля

Таким образом, значение г близко к нулю, указывая

ция между двумя наборами результатов тестов маловероятна. Это может приве­ сти к пересмотру перечня тестов для использования при отборе кандидатов н; должности, предлагаемые «КТК». Более глубокая интерпретация фактического значения коэффициента корреляции будет рассмотрена далее в тексте это? главы. В частности, для точности определения коэффициента корреляции необ­ ходимо учитывать объем выборки.

3.4. Упражнения: корреляция

1. (Е) Наборы данных отражают результаты группы кандидатов при про­ хождении ими тестов. С помощью фафика разброса проиллюстрируйте пол)- ченные результаты, а также вычислите коэффициент корреляции для каждок случая. Прокомментируйте зависимость между результатами двух тестов в каж дом из примеров:

СООТНОШЕНИЯ 1 0 9

(i)

Кандидат

А

Б

В

Г

д

 

Тест X

2

3

5

6

9

 

Тест

Y

3

5

9

il

17

(п)

Кандидат-

А

Б

В

г

д

 

Тест

L

2

2

4

5

7

 

Тест М

8

7

6

5

4

(ill)

Кандидат:

А

Б

В

Г

д

 

Тест

S

2

3

5

7

8

 

Тест

7'

1

1

3

4

6

2 (I) Начальник отдела маркетинга компании «Петлокс» запросил прове­ сти анализ месячных расходов на рекламу и соответствующих объемов продаж всей выпускаемой продукции В таблице приведены данные по месячным объе­ мам выручки от реализации Barley Knsps, а также суммам расходов на рекламу данного продукта:

 

 

 

Месяц

 

 

 

 

Выручка

Янв

Февр

Март

Апр

Май

Июнь Июль Авг

 

 

38

41

39

44

45

49

(млн долл США)'

3.0

34

Реклама

 

 

21

27

26

29

2.6

24

(100 тыс долл США)

22

25

Вычислите степень корреляции между двумя наборами значений и про­ комментируйте зависимость между расходами на рекламу и объемом выручки от реализации Barley Krisps.

3.5. Ранговая корреляция

Ранее представленная формула коэффициента корреляции предполагает, что две переменные могут быть измерены точно. Затем показатели измерений исполь­ зуются в качестве значений хиув формуле корреляции Во многих случаях суще­ ствует вероятность того, что некоторые переменные нельзя точно измерить Более того, даже если такие измерения и получены, есть вероятность того, что получен­ ные значения окажутся в ряде случаев недостоверными. Рассмотрим, например, результаты фуппы кандидатов на рабочую вакансию при прохождении ими двух оценочных тестов. Один из кандидатов получил 19 по математике и 17 по логике речи Означает ли это на самом деле, что этот кандидат более силен в математике, чем Б логике'' Сравнимы ли эти результаты напрямую'' Теперь рассмотрим резуль­ таты теста по математике. Кандидат А получил 12 баллов, а кандидат Д — 18 бал­ лов Другими словами, кандидат Д получил на 50% баллов больше, чем кандидат А Говорит ли это о том, что Д на 50% лучше А? Вряд ли. Скорее всего, единствен­ ное, что мы можем вывести из полученных ими баллов, это то, что Д показал себя лучше, чем А Фактическая разница между полученными баллами менее значима и может привести к неверному истолкованию. В самом лучшем случае результаты тестов могут указать на относительные различия между кандидатами. Эти результа­ ты тестов позволяют нанимателю расположить кандидатов в порядке их показате­ лей Так, например, в тесте по математике лучшим был кандидат 3, вторым — Ж и в конце списка — кандидат А. То есть результаты позволяют нам разнести канди­ датов в порядке их показателей Таким образом, мы можем проранжировать кан­ дидатов на основании их показателей в тесте по математике и проделать то же

1 1 0

ГЛАВА 3

самое в юм, что касается теста по логике речи. Зависимость между этими двумя последовагельностями может быть определена путем вычисления Спирмановского коэффициента ранговой корреляции по следующей формуле:

«(/7^ - I) •

В этой формуле п — количеству значений и J — разница между парами рангов. Она дает такое же значение, что и коэффициент корреляции производ­ ного момента, рассчитанный на основе рангов. Как мы видим, эта формула гораздо проще и одновременно дает объективный показатель корреляции меж­ ду двумя наборами данных. На последующих примерах мы рассмотрим вычис­ ление коэффициента ранговой корреляции.

Т Определение. Коэффициент ранговой корреляции является показателем из­ мерения ciLibi линейной зависимости между двумя наборами рангов. Значение коэф­ фициента ранговой корреляции также лежит в пределах от —I до +1. А

Пример 1

Рассмотрим показатели продаж двух торговых представителей за 6 месяцев. (Цифры приведены в тыс. ф. ст.):

Месяц:

Март

Апр.

Май

Июнь

Июль

Авг.

Представитель А:

20

30

17

34

27

25

Представитель Б:

15

20

23

29

19

16

В ряде случаев цифры — всего лишь оценочные показатели, но можно предположить, что они верны с ошибкой в пределах 1000 ф. ст.

Вместо того, чтобы рассматривать фактические значения, давайте проранжируем продажи каждого представителя за каждый месяц указанного периода. Так, представитель А добился наивысшего показателя в июне. Таким образом, для А июню присваивается порядковый номер 1. Аналогично, следующий по величине показатель достигнут в апреле, которому, следовательно, присваивается порядко­ вый номер 2, и т. д. Подобным же образом образом ранжируем показатели предста­ вителя Б. Эти порядковые номера приведены в следующей таблице:

Месяц:

Март

Апр.

Май

Июнь

Июль

Авг.

Представитель А:

5

2

6

1

3

4

Представитель Б:

6

3

2

1

4

5

Мы видим, что оба представителя получили наивысшие показатели в июне. Зависимость между показателями деятельности двух представителей может быть определена с помощью коэффициента ранговой корреляции.

Для вычисления этого коэффициента необходимо получить значения п и d. Очевидно, что для этих данных количество пар значений п составляет 6. Значения d (разница между соответствующими порядковым номерами) приведены ниже:

Месяц:

Март

Апр.

Май

Июнь

Июль

Авг,

Разница (d):

- 1

- 1

4

0

- 1

- 1

СООТНОШЕНИЯ 1 1 1

Значения

сР составляют:

 

 

сР:

\

1

16

О

1

1

Таким образом, сумма сР есть Y^d^ — 20.

И наконец, вычисляем коэффициент ранговой корреляции по формуле

п[п'-\]

6(6^-1)

635

210

Следовательно,

г = 0.429.

 

 

Значение г достаточно мало — похоже, что зависимость между двумя на­ борами рангов отсутствует. Таким образом, корреляция между двумя наборами показателей продаж слабая. Необходимы дополнительные данные, например, объемы продаж за более продолжительный период времени, с тем чтобы про­ вести дальнейший анализ зависимости между рангами, полученными для двух торговых представителей.

Пример 2

Рассмотрим результаты оценочных тестов восьми каш[идатов:

 

 

 

 

Кандидат:

 

 

 

 

А

Б

В

Г

Д

Е

Ж

3

Математика

12

14

15

15

18

19

20

23

Логика речи

16

19

21

15

22

17

13

21

Эти показатели можно использовать для ранжирования кандидатов в по­ рядке полученных ими результатов по каждому из тестов. Так, по математике

кандидат 3

стал

первым и поэтому ему присваивается порядковый номер 1,

Ж - 2, и

Е -

3.

Однако некоторая сложность возникает в случае, когда два кандидата имеют одинаковое количество баллов за какой-нибудь из тестов. Примером этому могут служить результаты по математике, когда два кандидата В и Г получили по 15 баллов. В такой ситуации обоим кандидатам следует присвоить один и тот же порядковый номер. Приведенное ранжирование получено путем определения среднего порядкового номера при условии различимости значений. Так, канди­ датам В и Г могли бы быть присвоены порядковые номера 5 и 6. Таким образом, средний порядковый номер для этих двух кандидатов составляет 5 1/2. Точно так же в случае с тестом по логике речи: кандидаты В и 3 оба получили по 21 баллу, и каждому присвоен порядковый номер 2 1/2. В таблице приведены

порядковые номера

кандидатов по итогам каждого из двух тестов:

 

 

 

 

Кандидат

 

 

 

 

 

А

Б

В

Г

Д

Е

Ж

3

Математика

8

7

5'/2

51/2

4

3

2

1

Логика

6

4

2'/2

7

1

5

8

21/2

Вычисляем разницы между порядковыми значениями:

1 1 2

ГЛАВА 3

 

 

 

 

 

 

 

d:

1

Ъ

Ъ

-11/2

3

- 2

- 6

-11/2

Значения

равны:

 

 

 

 

 

 

сР:

Л

9

9

2.25

 

9

4

36

2.25

Таким образом,

имеем

Y.^'^ ~ 1S.S.

 

 

 

И наконец, вычисляем коэффициент ранговой

корреляции по формуле:

г-\

- ^ 1 ^ - 1

^^^•^)

-1

453

 

453_

 

 

Следовательно,

г = 0.101.

 

 

 

 

 

Это

значение г

показывает,

что

между двумя

наборами значений суще­

ствует крайне незначительная корреляция. То есть кандидат с высоким местом по результатам одного из тестов может оказаться на любом месте по результа­ там другого. Следует отметить, что ранее рассчитанный коэффициент корреля­ ции производного момента для данного набора значений составил 0.145. Таким образом, мы видим, что два коэффициента корреляции могут дать сходные результаты. Однако это происходит не всегда. Возможна ситуация, когда при наличии корреляции между рангами двух наборов данных между фактическими значениями корреляция окажется незначительной. В таком случае результаты трудно анализировать, и поэтому часто необходим сбор дополнительной ин­ формации, с тем чтобы получить более убедительные доказательства.

3.6. Интерпретация линейного коэффициента корреляции

Как мы уже отмечали в предьщущих разделах, если коэффициент корреля­ ции близок к +1 или —1, то это указывает на то, что две рассматриваемые переменные находятся в тесной связи. Вопрос заключается в том, как интер­ претировать эту «тесноту»? Например, многие из нас согласятся, что г = 0.99 указывает на значимую корреляцию между переменными. Аналогично, значе­ ние г = 0.003 близко к нулю, и, следовательно, по нашему мнению, это ука­ зывает на незначительную корреляцию. Промежуточные значения г, как-то +0.5, —0.4 или +0.3 достаточно трудно истолковать, и поэтому требуется дополни­ тельное исследование.

На практике значимость значения г в большой степени зависит от объема выборки. Это можно проиллюстрировать на простом примере. Вспомните, что ко­ эффициент корреляции — это показатель того, насколько близко точки фафика разброса лежат относительно прямой линии. Если все точки находятся на прямой линии, то коэффициент корреляции равен 1. А теперь рассмотрите ситуацию, ког­ да на фафике отмечены только две точки. В таком случае точки должны лежать на прямой линии. Попробуйте-ка на графике разброса поставить две точки, которые нельзя было бы соединить прямой! Следовательно, при наличии только двух точек коэффициент корреляции наверняка равен г— 1 (или —1). Однако очевидно, что это значение г необязательно подразумевает наличие зависимости между этими двумя переменными. Для проведения приемлемого в какой-то степени анализа корреляции необходимо иметь, по крайней мере, три точки на фафике разброса. Таким образом, при небольших по объему выборках даже значения г, близкие к 1, могут не означать наличия значимой корреляции. Например, если на фафике раз­ броса имеется тысяча точек, то значение г = 0.1 достаточно, чтобы показать не­ кую корреляцию между переменными.

Соседние файлы в предмете Экономика