Кол. методы МБА 2012 / 1. Статистика / Книга по стат. методам / Книга
.pdfЕсли x1 , x2 , K, xN , y1 , y2 , K, yN – данные выборки, x, y – их средние значения, S x , S y – оценки стандартных отклонений (см.
Приложение 3), N – объем выборки, то выборочный коэффициент парной корреляции вычисляется по формуле
|
N |
|
|
|
|
ryx = |
∑(xi |
− x) |
( yi |
− y) |
|
i =1 |
|
|
|
. |
|
N S x |
S y |
|
|||
|
|
|
При анализе используют следующие свойства коэффициентов парной корреляции.
yКоэффициент корреляции – безразмерная величина.
yrxy = ryx .
yКоэффициент корреляции принимает значение в диапазоне от -1 до +1:
−1 ≤ r ≤ +1.
yЕсли коэффициент парной корреляции по абсолютной величине равен единице, то между y и x существует линейная функ-
циональная зависимость (связь) – y = a +bx , где a и b постоян-
ные коэффициенты.
y Чем ближе значение коэффициента парной корреляции по абсолютной величине к единице, тем теснее связь – рис. 5.19, 5.20. y При положительных значениях коэффициента парной кор-
реляции ( ryx > 0 ) – связь между |
y и x прямо-пропорциональна – |
||||||||||||||
увеличение x приводит к увеличению y – рис. 5.19, 5.20. |
|
|
|||||||||||||
Y |
|
|
|
|
|
|
|
Y 12 |
|
|
|
|
|
|
|
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
r yx≈ −1 |
|
|
||
14 |
|
ryx ≈ +1 |
|
|
|
|
10 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||||
12 |
|
|
|
|
|
|
|
|
|
|
|
||||
10 |
|
|
|
|
|
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0 |
2 |
4 |
6 |
8 |
10 |
12 |
14 |
|
|
|
|
|
|
|
|
0 |
2 |
4 |
6 |
8 |
10 |
12 |
14 |
||||||||
|
|
Рис. 5.19. |
|
|
|
|
|
|
Рис. 5.20. |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
121 |
y При отрицательных значениях коэффициента парной корреляции ( ryx < 0 ) – связь между y и x обратно-пропорциональна –
увеличение x приводит к уменьшению y – рис. 5.20, 5.22.
y Если y и x независимы, то их коэффициент корреляции
равен нулю – рис. 5.23.
Величины y и x называют некоррелированными, если коэф-
фициент их корреляции равен нулю. Из независимости случайных величин следует их некоррелированность. Однако обратное утвер-
ждение не всегда верно – рис. 5.24. Из некоррелированности двух случайных величин не обязательно (не всегда) следует их независимость.
Y 1 |
0 |
< r yx < 1 |
|
|
|
Y 1,2 |
|
− 1 |
< r yx |
< 0 |
|
|
||||
0,8 |
|
|
|
1 |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
0,6 |
|
|
|
|
|
|
|
0,8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0,4 |
|
|
|
|
|
|
|
0,6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
0,4 |
|
|
|
|
|
|
|
|
0,2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
0,2 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
||
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|||
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
|
|
|
|
|
|
||
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|||||||||
|
|
|
|
|
|
|
|
Рис. 5.21. Рис. 5.22.
Y |
|
|
|
|
|
|
|
|
|
ryx≈0 |
|
|
Y |
ryx≈0 |
|
|
|
|
|
|
|||
|
|
|
|
|
|
X
X
Рис. 5.23. Рис. 5.24.
Для вычисления выборочного коэффициента парной корреляции в Excel используется стандартная функция КОРРЕЛ (…) – рис. 5.25, 5.26. Вызов функции: Вставка ¾ Функция ¾ Категория
«Статистические» ¾ КОРРЕЛ (массив X, массив Y).
122
Рис. 5.25.
Рис. 5.26.
Рис. 5.27.
123
При необходимости вычислить одновременно несколько коэффициентов парной корреляции (корреляционную матрицу), например, между зависимой переменной y и факторами (x1 , x2 ,K, xm )
целесообразно использовать инструмент «Корреляция» из «Пакета анализа» Excel: Сервис ¾ Анализ данных ¾ Корреляция –
рис. 5.27, 5.28.
Окно «Входной интервал» (рис. 5.28.) предназначено для ввода адресов ячеек, в которых расположены данные выборки (таблица выборочных данных).
Рис. 5.28.
Вывести результаты – коэффициенты парной корреляции (корреляционную матрицу), можно тремя способами.
–На тот же рабочий лист, на котором размещены исходные данные. Для этого в окне «Выходной интервал» указывают адрес ячейки для левого верхнего «угла» выводимой таблицы с результатами расчетов.
–На новый рабочий лист. В этом случае в окне «Новый рабочий лист» указывают имя листа из той же рабочей книги-файла, в которой производятся вычисления.
–В новую рабочую книгу. Для этого в окне «Новая рабочая книга» необходимо указать ее адрес.
Если первая строка таблицы выборочных данных содержит надписи (заголовки), то у надписи «Метки в первой строке» необходимо поставить галочку.
Пример нахождения корреляционной матрицы с помощью инструмента «Корреляция» из «Пакета анализа» Excel показан на рис. 5.29.
124
Рис. 5.29.
Выведенные результаты – ячейки B14:F18, содержат коэффициенты парной корреляции между Y и факторами и коэффициенты парной корреляции факторов между собой. Из таблицы следует, в частности, что, например, ryx1 = 0,843254 , ryx3 = −0,16794 ,
rx1 x2 = 0,721252 , rx2 x3 = −0,25137 .
Пример вычисления коэффициента парной корреляции y и x1
с помощью стандартной функции КОРРЕЛ (…), показан на рис. 5.30.
Рис. 5.30.
125
ОСНОВНЫЕ ТЕРМИНЫ (ГЛОССАРИЙ)
Корреляция – от латинского “correlation” – соотношение, взаимосвязь.
Корреляционный анализ – выявление связи между случай-
ными величинами и оценка тесноты этой связи.
Регрессионные модели – модели (математические соотношения), построенные на основе выборочных статистических данных, в которых зависимую переменную y можно представить как
функцию влияющих на нее факторов (x1 , x2 ,K, xm ) .
Коэффициент парной корреляции – мера тесноты линейной
связи между случайными величинами X и Y – безразмерный числовой коэффициент, обозначаемый символом ρyx , принимающий
значения в диапазоне от -1 до +1.
Выборочный коэффициент парной корреляции – оценка коэффициента парной корреляции – rxy , вычисляемая на основе
статистических (выборочных) данных . ryx ≈ρyx .
Аппроксимация – (от лат. approximo – приближаюсь), замена одних математических объектов другими, в том или ином смысле, близкими к исходным.
Метод наименьших квадратов (МНК) – метод оценивания параметров уравнения аппроксимирующей кривой, основанный на минимизации суммы квадратов отклонений статистических данных от расчетных.
Критерий R2 (коэффициент детерминации) – показывает
долю разброса зависимой переменной, обусловленную изменением фактора (совокупности факторов), включенного (включенных) в регрессионную модель. Критерий качества подобранной кривой.
126
ПРИМЕРЫ ЗАДАЧ И РЕШЕНИЙ (на основе точечных диаграмм, линий тренда
и коэффициентов парной корреляции)
5.1. Котировки акций в зависимости от цен на нефть
Данные о стоимости нефти на мировых рынках и котировках акций нефтяной компании «Мукойл» на фондовом рынке приведены в таблице.
Цена барреля нефти |
Котировки акций компании |
|
(долларов) |
«Мукойл» на фондовом рынке |
|
(рублей за 1 акцию) |
||
|
||
|
|
|
103 |
537 |
|
102 |
534 |
|
110 |
549 |
|
114 |
557 |
|
115 |
560 |
|
111 |
553 |
|
|
|
Требуется
1.Установить – влияют ли цены на нефть на котировки акций компании.
2.Выявить тип функциональной связи между стоимостью акций и ценой на нефть.
3.Построить математическую модель, связывающую между собой котировки (стоимость) акций на фондовом рынке с ценами на нефть на мировых рынках.
4.Спрогнозировать цену одной акции компании в случае, если цена на нефть составит 107 $ за баррель и 120 $ за баррель.
127
Решение |
|
|
|
|
|
|
565 |
|
|
|
|
акции |
560 |
y = 1,9337x + 337,24 |
|
|
|
555 |
R2 = 0,9941 |
|
|
|
|
550 |
|
|
|
|
|
Котировки |
|
|
|
|
|
545 |
|
|
|
|
|
540 |
|
|
|
|
|
|
|
|
|
|
|
|
535 |
|
|
|
|
|
530 |
|
|
|
|
|
100 |
105 |
110 |
115 |
120 |
|
|
Стоимость барреля нефти [us$] |
|
Выводы
•Цены на нефть на мировых рынках влияют на котировки акций компании.
•Связь между стоимостью акций и ценой на нефть достаточ-
но тесная. Зависимость котировок акций от уровня мировых цен на нефть – линейная: y расч. =1,9337x + 337,24. Теснота связи высокая –
R2 = 0,9941.
• Котировки акций при ценах на нефть 107 $ за баррель и 120 $ за баррель составят
yрасч. =1,9337 107 +337,24 = 544,15долларов, yрсч. =1,9337 120 +337,24 = 569,28 долларов.
5.2. Влияние цены товара на объемы продаж
По результатам работы торгового предприятия накоплена статистика, характеризующая зависимость объемов продаж от цены единицы изделия.
128
Требуется
y Установить, существует ли взаимосвязь между этими показателями.
yПостроить на основе имеющейся статистики математическую модель, количественно характеризующую влияние цены на объемы продаж.
yОценить качество полученной модели для целей дальнейшего использования в целях анализа и прогнозирования.
yОпределить каковы будут объемы продаж при ценах изделия, равных 12 рублям и 7 руб 50коп.
Решение
Цена |
Продажи |
|
|
9,5 |
56 |
4 |
201 |
8,5 |
70 |
5 |
130 |
6,5 |
89 |
10,5 |
48 |
6 |
105 |
5,5 |
133 |
7,5 |
92 |
8 |
70 |
3,5 |
245 |
9 |
72 |
7 |
96 |
10 |
60 |
4,5 |
156 |
y Наилучшая математическая модель, количественно характеризующая влияние цены товара на объемы продаж – степенная:
y расч. =1269,7 x −1,3587
yКачество полученной модели высокое – R2 = 0,9721.
yОбъемы продаж при ценах изделия, равных 12 рублям и 7 руб 50коп, составят:
y расч. =1269,7 12−1,3587 = 43 ед.; y расч. =1269,7 7,5−1,3587 = 82 ед.
Объемы продаж
300 |
|
250 |
|
200 |
y = 1269,7x-1,3587 |
2 |
|
|
R = 0,9721 |
150 |
|
100
50
0
2 |
4 |
6 |
8 |
10 |
12 |
|
|
Цена изделия |
|
|
129
5.3. Оценка влияния удаленности от центра на величину стоимости офисного помещения
Статистика, собранная по офисам, предлагавшимся к продаже в г. Москве, а именно – стоимость 1 кв. метра офиса в зависимости от его местоположения (удаленности от центра) приведена в таблице.
Цена за |
Расстояние от |
Цена за |
|
Расстояние от |
1 кв.м |
центра (км) |
1 кв.м |
|
центра (км) |
4189 |
2,6 |
1800 |
|
8 |
2800 |
8,6 |
885 |
11,7 |
|
2150 |
2,55 |
4133 |
5,5 |
|
3000 |
5 |
1400 |
2,5 |
|
1500 |
8,8 |
2000 |
7,15 |
|
3404 |
3,2 |
1900 |
3,2 |
|
3100 |
3,41 |
3030 |
1,3 |
|
2500 |
5 |
1990 |
12,66 |
|
3660 |
0,96 |
2200 |
3,41 |
|
2500 |
6,36 |
4317 |
5,3 |
|
2600 |
8,8 |
2200 |
2,6 |
|
2756 |
2,6 |
4150 |
5,5 |
|
1464 |
12,85 |
2200 |
2,6 |
|
1333 |
13,2 |
4000 |
2,8 |
|
1700 |
9,9 |
4000 |
2,4 |
|
1935 |
5,3 |
3793 |
3,7 |
|
1154 |
8,8 |
3731 |
2,6 |
|
1350 |
12,66 |
3488 |
7 |
|
1600 |
13,4 |
3416 |
2,63 |
|
1800 |
9,97 |
3378 |
0,45 |
|
3600 |
0,45 |
2905 |
1,3 |
|
3056 |
1,8 |
4153 |
1,8 |
|
1842 |
8 |
2600 |
8,8 |
|
1217 |
6,36 |
2900 |
1,74 |
|
2350 |
2,7 |
3000 |
2,4 |
|
2609 |
7,7 |
3000 |
5,5 |
|
2238 |
3,2 |
3000 |
0,6 |
|
2300 |
12 |
1990 |
5,52 |
|
1258 |
8,8 |
1463 |
12,85 |
130