Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

Если x1 , x2 , K, xN , y1 , y2 , K, yN – данные выборки, x, y – их средние значения, S x , S y – оценки стандартных отклонений (см.

Приложение 3), N – объем выборки, то выборочный коэффициент парной корреляции вычисляется по формуле

 

N

 

 

 

 

ryx =

(xi

x)

( yi

y)

i =1

 

 

 

.

N S x

S y

 

 

 

 

При анализе используют следующие свойства коэффициентов парной корреляции.

yКоэффициент корреляции – безразмерная величина.

yrxy = ryx .

yКоэффициент корреляции принимает значение в диапазоне от -1 до +1:

1 r ≤ +1.

yЕсли коэффициент парной корреляции по абсолютной величине равен единице, то между y и x существует линейная функ-

циональная зависимость (связь) – y = a +bx , где a и b постоян-

ные коэффициенты.

y Чем ближе значение коэффициента парной корреляции по абсолютной величине к единице, тем теснее связь – рис. 5.19, 5.20. y При положительных значениях коэффициента парной кор-

реляции ( ryx > 0 ) – связь между

y и x прямо-пропорциональна –

увеличение x приводит к увеличению y – рис. 5.19, 5.20.

 

 

Y

 

 

 

 

 

 

 

Y 12

 

 

 

 

 

 

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r yx≈ −1

 

 

14

 

ryx ≈ +1

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

2

4

6

8

10

12

14

 

 

 

 

 

 

 

0

2

4

6

8

10

12

14

 

 

Рис. 5.19.

 

 

 

 

 

 

Рис. 5.20.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

121

y При отрицательных значениях коэффициента парной корреляции ( ryx < 0 ) – связь между y и x обратно-пропорциональна –

увеличение x приводит к уменьшению y – рис. 5.20, 5.22.

y Если y и x независимы, то их коэффициент корреляции

равен нулю – рис. 5.23.

Величины y и x называют некоррелированными, если коэф-

фициент их корреляции равен нулю. Из независимости случайных величин следует их некоррелированность. Однако обратное утвер-

ждение не всегда верно – рис. 5.24. Из некоррелированности двух случайных величин не обязательно (не всегда) следует их независимость.

Y 1

0

< r yx < 1

 

 

 

Y 1,2

 

1

< r yx

< 0

 

 

0,8

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

0,2

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

0

 

 

 

 

 

 

0

1

2

3

4

5

6

7

 

 

 

 

 

 

 

0

1

2

3

4

5

6

7

 

 

 

 

 

 

 

 

Рис. 5.21. Рис. 5.22.

Y

 

 

 

 

 

 

 

 

 

ryx0

 

 

Y

ryx0

 

 

 

 

 

 

 

 

 

 

 

X

X

Рис. 5.23. Рис. 5.24.

Для вычисления выборочного коэффициента парной корреляции в Excel используется стандартная функция КОРРЕЛ (…) – рис. 5.25, 5.26. Вызов функции: Вставка ¾ Функция ¾ Категория

«Статистические» ¾ КОРРЕЛ (массив X, массив Y).

122

Рис. 5.25.

Рис. 5.26.

Рис. 5.27.

123

При необходимости вычислить одновременно несколько коэффициентов парной корреляции (корреляционную матрицу), например, между зависимой переменной y и факторами (x1 , x2 ,K, xm )

целесообразно использовать инструмент «Корреляция» из «Пакета анализа» Excel: Сервис ¾ Анализ данных ¾ Корреляция

рис. 5.27, 5.28.

Окно «Входной интервал» (рис. 5.28.) предназначено для ввода адресов ячеек, в которых расположены данные выборки (таблица выборочных данных).

Рис. 5.28.

Вывести результаты – коэффициенты парной корреляции (корреляционную матрицу), можно тремя способами.

На тот же рабочий лист, на котором размещены исходные данные. Для этого в окне «Выходной интервал» указывают адрес ячейки для левого верхнего «угла» выводимой таблицы с результатами расчетов.

На новый рабочий лист. В этом случае в окне «Новый рабочий лист» указывают имя листа из той же рабочей книги-файла, в которой производятся вычисления.

В новую рабочую книгу. Для этого в окне «Новая рабочая книга» необходимо указать ее адрес.

Если первая строка таблицы выборочных данных содержит надписи (заголовки), то у надписи «Метки в первой строке» необходимо поставить галочку.

Пример нахождения корреляционной матрицы с помощью инструмента «Корреляция» из «Пакета анализа» Excel показан на рис. 5.29.

124

Рис. 5.29.

Выведенные результаты – ячейки B14:F18, содержат коэффициенты парной корреляции между Y и факторами и коэффициенты парной корреляции факторов между собой. Из таблицы следует, в частности, что, например, ryx1 = 0,843254 , ryx3 = −0,16794 ,

rx1 x2 = 0,721252 , rx2 x3 = −0,25137 .

Пример вычисления коэффициента парной корреляции y и x1

с помощью стандартной функции КОРРЕЛ (…), показан на рис. 5.30.

Рис. 5.30.

125

ОСНОВНЫЕ ТЕРМИНЫ (ГЛОССАРИЙ)

Корреляция – от латинского “correlation” – соотношение, взаимосвязь.

Корреляционный анализ выявление связи между случай-

ными величинами и оценка тесноты этой связи.

Регрессионные модели – модели (математические соотношения), построенные на основе выборочных статистических данных, в которых зависимую переменную y можно представить как

функцию влияющих на нее факторов (x1 , x2 ,K, xm ) .

Коэффициент парной корреляции – мера тесноты линейной

связи между случайными величинами X и Y – безразмерный числовой коэффициент, обозначаемый символом ρyx , принимающий

значения в диапазоне от -1 до +1.

Выборочный коэффициент парной корреляции – оценка коэффициента парной корреляции – rxy , вычисляемая на основе

статистических (выборочных) данных . ryx ρyx .

Аппроксимация – (от лат. approximo приближаюсь), замена одних математических объектов другими, в том или ином смысле, близкими к исходным.

Метод наименьших квадратов (МНК) – метод оценивания параметров уравнения аппроксимирующей кривой, основанный на минимизации суммы квадратов отклонений статистических данных от расчетных.

Критерий R2 (коэффициент детерминации) – показывает

долю разброса зависимой переменной, обусловленную изменением фактора (совокупности факторов), включенного (включенных) в регрессионную модель. Критерий качества подобранной кривой.

126

ПРИМЕРЫ ЗАДАЧ И РЕШЕНИЙ (на основе точечных диаграмм, линий тренда

и коэффициентов парной корреляции)

5.1. Котировки акций в зависимости от цен на нефть

Данные о стоимости нефти на мировых рынках и котировках акций нефтяной компании «Мукойл» на фондовом рынке приведены в таблице.

Цена барреля нефти

Котировки акций компании

(долларов)

«Мукойл» на фондовом рынке

(рублей за 1 акцию)

 

 

 

103

537

102

534

110

549

114

557

115

560

111

553

 

 

Требуется

1.Установить – влияют ли цены на нефть на котировки акций компании.

2.Выявить тип функциональной связи между стоимостью акций и ценой на нефть.

3.Построить математическую модель, связывающую между собой котировки (стоимость) акций на фондовом рынке с ценами на нефть на мировых рынках.

4.Спрогнозировать цену одной акции компании в случае, если цена на нефть составит 107 $ за баррель и 120 $ за баррель.

127

Решение

 

 

 

 

 

565

 

 

 

 

акции

560

y = 1,9337x + 337,24

 

 

 

555

R2 = 0,9941

 

 

 

550

 

 

 

 

Котировки

 

 

 

 

545

 

 

 

 

540

 

 

 

 

 

 

 

 

 

 

535

 

 

 

 

 

530

 

 

 

 

 

100

105

110

115

120

 

 

Стоимость барреля нефти [us$]

 

Выводы

Цены на нефть на мировых рынках влияют на котировки акций компании.

Связь между стоимостью акций и ценой на нефть достаточ-

но тесная. Зависимость котировок акций от уровня мировых цен на нефть – линейная: y расч. =1,9337x + 337,24. Теснота связи высокая –

R2 = 0,9941.

Котировки акций при ценах на нефть 107 $ за баррель и 120 $ за баррель составят

yрасч. =1,9337 107 +337,24 = 544,15долларов, yрсч. =1,9337 120 +337,24 = 569,28 долларов.

5.2. Влияние цены товара на объемы продаж

По результатам работы торгового предприятия накоплена статистика, характеризующая зависимость объемов продаж от цены единицы изделия.

128

Требуется

y Установить, существует ли взаимосвязь между этими показателями.

yПостроить на основе имеющейся статистики математическую модель, количественно характеризующую влияние цены на объемы продаж.

yОценить качество полученной модели для целей дальнейшего использования в целях анализа и прогнозирования.

yОпределить каковы будут объемы продаж при ценах изделия, равных 12 рублям и 7 руб 50коп.

Решение

Цена

Продажи

 

 

9,5

56

4

201

8,5

70

5

130

6,5

89

10,5

48

6

105

5,5

133

7,5

92

8

70

3,5

245

9

72

7

96

10

60

4,5

156

y Наилучшая математическая модель, количественно характеризующая влияние цены товара на объемы продаж – степенная:

y расч. =1269,7 x 1,3587

yКачество полученной модели высокое – R2 = 0,9721.

yОбъемы продаж при ценах изделия, равных 12 рублям и 7 руб 50коп, составят:

y расч. =1269,7 121,3587 = 43 ед.; y расч. =1269,7 7,51,3587 = 82 ед.

Объемы продаж

300

 

250

 

200

y = 1269,7x-1,3587

2

 

R = 0,9721

150

 

100

50

0

2

4

6

8

10

12

 

 

Цена изделия

 

 

129

5.3. Оценка влияния удаленности от центра на величину стоимости офисного помещения

Статистика, собранная по офисам, предлагавшимся к продаже в г. Москве, а именно – стоимость 1 кв. метра офиса в зависимости от его местоположения (удаленности от центра) приведена в таблице.

Цена за

Расстояние от

Цена за

 

Расстояние от

1 кв.м

центра (км)

1 кв.м

 

центра (км)

4189

2,6

1800

 

8

2800

8,6

885

11,7

2150

2,55

4133

5,5

3000

5

1400

2,5

1500

8,8

2000

7,15

3404

3,2

1900

3,2

3100

3,41

3030

1,3

2500

5

1990

12,66

3660

0,96

2200

3,41

2500

6,36

4317

5,3

2600

8,8

2200

2,6

2756

2,6

4150

5,5

1464

12,85

2200

2,6

1333

13,2

4000

2,8

1700

9,9

4000

2,4

1935

5,3

3793

3,7

1154

8,8

3731

2,6

1350

12,66

3488

7

1600

13,4

3416

2,63

1800

9,97

3378

0,45

3600

0,45

2905

1,3

3056

1,8

4153

1,8

1842

8

2600

8,8

1217

6,36

2900

1,74

2350

2,7

3000

2,4

2609

7,7

3000

5,5

2238

3,2

3000

0,6

2300

12

1990

5,52

1258

8,8

1463

12,85

130