Использование средств excel для решения примера.
Чтобы вычислить корреляцию средствами EXCEL, можно воспользоваться функцией =КОРРЕЛ( ),1указав адреса двух столбцов чисел, как показано на рис. 3.2.

Рис. 3.2.2. Вычисление коэффициента парной корреляции с помощью функции КОРРЕЛ. Ответ помещен в D8 и равен 0,816.
Критическое
значение t
– статистики Стьюдента может быть также
получено с помощью функции СТЬЮДРАСПРОБР
пакета EXCEL.
В качестве аргументов функции необходимо
задать число степеней свободы равное
n-2
(в нашем примере 16-2=14) и значимость
(в нашем примере
равно 0,1). Если фактическое значениеt
– статистики, взятое по модулю больше
критического, то с вероятностью (1-
)
коэффициент корреляции значимо отличается
от нуля.

Рис. 3.2.3. Критическое значение t – статистики равно 1,7613.
В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения различных статистических задач. Для вычисления матрицы коэффициентов парной корреляции R следует воспользоваться инструментом Корреляция и установить параметры анализа в соответствующем диалоговом окне.

Рис. 3.2.3. Вычисление матрицы коэффициентов парной корреляции с помощью инструмента Корреляция пакет анализа.
Ответ будет помещен на новый рабочий лист (рис. 3.2.4)

Рис. 3.2.4. Матрица коэффициентов парной корреляции.
Оценка тесноты нелинейной связи.
При отклонении парной статистической зависимости от линейной коэффициент корреляции теряет свой смысл как характеристика степени тесноты связи. В этом случае можно воспользоваться таким измерителем связи как индекс корреляции(корреляционное отношение).
Корреляционное отношение- показатель уровня связи, употребляющийся в случае нелинейной зависимости между признаками, определяемыми через отношение межгрупповой дисперсии к общей дисперсии.
Применение корреляционного отношения возможно, если между парой исследуемых признаков отмечается нелинейная зависимость и характер выборочных данных (количество, плотность расположения на диаграмме рассеяния) допускает, во-первых, их группирование по оси объясняющей переменной, во-вторых, возможность подсчета “частных” математических ожиданий внутри каждого интервала группирования.
Для определения эмпирического корреляционного отношения совокупность значения результирующего признака yразбивают на отдельные группы. В основу группировки кладётся исследуемый факторx.
Когда изучаемая совокупность (в виде корреляционной таблицы) разбивается на группы по одному (факторному) признаку х, то для каждой из этих групп можно вычислить соответствующие групповые средние результативного признака. Изменение групповых средних от группы к группе свидетельствует о наличии связи результативного признака с факторным признаком, а примерное равенство групповых средних — об отсутствии связи. Следовательно, чем большую роль в общем изменении результативного признака играет изменение групповых средних (за счет влияния факторного признака), тем сильнее влияние этого признака.
Приведем методику вычисления корреляционного отношения.
Пусть группирование данных произведено.
Пусть при этом k–
число интервалов группирования по осих;
–
количество элементов выборки вj-ом
интервале группирования; n — объем
совокупности
;
—
общее среднее.
Вычислим
—
среднее значение
вj-й группе.
Вычислим общее среднее
,
используя средние значения в каждой
группе
.
Найдем межгрупповую дисперсию
![]()
и общую дисперсию
.
Корреляционное отношение
зависимой переменнойYпо независимой переменной Х может быть
получено из отношения межгрупповой
дисперсии к общей дисперсии
.
(3.2.11)
Величина корреляционного отношения изменяется в пределах от 0 до 1. Близость ее к нулю говорит об отсутствии связи, близость к единице — о тесной связи.
Как показатель тесноты связи корреляционное отношение имеет более универсальный характер, чем линейный коэффициент корреляции, поскольку его использование не ограничивается случаями линейной связи, а факторный признак может быть не количественным, а ранговым и даже номинальным.
Пример 3.2.3.Объем выпускаемой продукции и температура.
В табл. 3.2.4 приведены данные, полученные в результате эксперимента, целью которого являлось определение тесноты связи между объемом выпуска продукции и температурой определенного технологического процесса.
Требуется:
Построить диаграмму рассеяния (корреляционное поле) для этой совокупности данных.
Оценить тесноту связи между объемом выпуска продукции и температурой.
Таблица 3.2.4.
|
Температура (х) |
600 |
625 |
650 |
675 |
700 |
725 |
750 |
775 |
800 |
825 |
850 |
|
Объем выпуска продукции (Y) |
127 |
139 |
147 |
147 |
155 |
154 |
153 |
148 |
146 |
136 |
129 |
Решение
1. Корреляционное поле, показанное на рис. 3.2.4., иллюстрирует сильную нелинейную взаимосвязь, характеризующуюся незначительным случайным разбросом.
Коэффициент парной корреляции, г = -0,0155, бесполезен в случае такой нелинейной связи: он не может решить, является связь увеличивающей или уменьшающей, поскольку в действительности есть и то и другое.
В этом корреляционное поле очень полезно, поскольку демонстрирует, что для максимального увеличения объема выпускаемой продукции температуру производственного процесса следует установить равной примерно 700 градусам. Объем продукции резко падает как при слишком высокой, так и при слишком низкой температуре. Этот важный вывод можно сделать, наблюдая на диаграмме сильную взаимосвязь между объемом продукции и температурой.
Замечание:близкое к нулю значение коэффициента корреляции может означать как отсутствие взаимосвязи в данных, так и наличие нелинейной взаимосвязи без преобладания направленности вниз или вверх. Сильная нелинейная взаимосвязь может быть даже тогда, когда корреляция близка к нулю!

Рис. 3.2.4. Нелинейная взаимосвязь объема выпускаемой продукции и температуры производственного процесса.
2. Оценим тесноту связи между объемом выпуска продукции и температурой с помощью корреляционного отношения.
Значения результирующего признака Yразобьем на 5 групп (k=5). В основу группировки кладётся исследуемый фактор x.
Таблица 3.2.5.
|
Номер группы |
1 |
2 |
3 |
4 |
5 |
|
Количество
элементов выборки в j-ой
группе
|
2 |
2 |
3 |
2 |
2 |
|
Значения
|
127;139 |
147;147 |
155;154;153 |
148;146 |
136;139 |
|
Среднее значение
|
133 |
147 |
154 |
147 |
132,5 |
|
|
(133-143,727)2 |
(147-143,727)2 |
(154-143,727)2 |
(147-143,727)2 |
(132,5-143,727)2 |
Вычислим общее среднее
,
используя средние значения в каждой
группе (см. табл. 3.2.5)
.
Найдем межгрупповую дисперсию
![]()
Вычислим общую дисперсию
![]()
Получим корреляционное отношение:

Полученное значение свидетельствует о наличии сильного нелинейного влияния температуры на объем выпуска продукции.
Пример 3.2.4.
В табл. 3.2 приведена информация о среднедушевых денежных доходах (в мес., руб.) и среднедушевых денежных расходах (в мес., руб.) по Центральному федеральному округу в 2002 г. [Россия в цифрах].
Табл. 3.2.
|
Центральный федеральный округ |
№ |
Среднедушевые денежные доходы (в мес., руб.) |
Среднедушевые денежные расходы (в мес., руб.) |
|
Белгородская область |
1 |
2784 |
2478 |
|
Брянская область |
2 |
2255 |
2034 |
|
Владимирская область |
3 |
2062 |
2019 |
|
Воронежская область |
4 |
2553 |
2501 |
|
Ивановская область |
5 |
1595 |
1668 |
|
Калужская область |
6 |
2254 |
2188 |
|
Костромская область |
7 |
2371 |
2217 |
|
Курская область |
8 |
2518 |
2202 |
|
Липецкая область |
9 |
2742 |
2392 |
|
Московская область (без г. Москва) |
10 |
3416 |
3354 |
|
Орловская область |
11 |
2540 |
2347 |
|
Рязанская область |
12 |
2510 |
2309 |
|
Смоленская область |
13 |
2843 |
2671 |
|
Тамбовская область |
14 |
2648 |
2201 |
|
Тверская область |
15 |
2204 |
1932 |
|
Тульская область |
16 |
2561 |
2160 |
|
Ярославская область |
17 |
3311 |
2921 |
Требуется:
Построить однофакторную модель регрессии зависимости расходов от доходов.
Построить доверительный интервал для полученной модели регрессии (
).Проверить значимость параметров модели регрессии (
).Оценить расходы, если доход составит 3600 руб.
№
Доход-X
Расход - Y




Расход -

Остатки

1
2
3
4
5
6
7
8
9
10
1
2784
2478
148,94
244,76
59909,76
36455,54
2537,13
-59,13
3496,59
2
2255
2034
-295,06
-284,24
80789,70
83866,13
2087,43
-53,43
2854,98
3
2062
2019
-310,06
-477,24
227753,53
147971,01
1923,36
95,64
9146,30
4
2553
2501
171,94
13,76
189,47
2366,72
2340,76
160,24
25676,82
5
1595
1668
-661,06
-944,24
891580,29
624195,07
1526,37
141,63
20059,17
6
2254
2188
-141,06
-285,24
81359,17
40234,96
2086,58
101,42
10285,64
7
2371
2217
-112,06
-168,24
28303,11
18852,25
2186,04
30,96
958,34
8
2518
2202
-127,06
-21,24
450,94
2698,13
2311,01
-109,01
11882,49
9
2742
2392
62,94
202,76
41113,53
12762,25
2501,43
-109,43
11974,48
10
3416
3354
1024,94
876,76
768716,35
898632,25
3074,39
279,61
78180,82
11
2540
2347
17,94
0,76
0,58
13,72
2329,71
17,29
298,98
12
2510
2309
-20,06
-29,24
854,70
586,43
2304,21
4,79
22,98
13
2843
2671
341,94
303,76
92273,00
103869,66
2587,29
83,71
7007,78
14
2648
2201
-128,06
108,76
11829,76
-13928,28
2421,52
-220,52
48628,67
15
2204
1932
-397,06
-335,24
112382,70
133108,13
2044,08
-112,08
12561,29
16
2561
2160
-169,06
21,76
473,70
-3679,52
2347,56
-187,56
35179,08
17
3311
2921
591,94
771,76
595620,76
456839,31
2985,13
-64,13
4112,88
сумма
43167,00
39594,00
0,00
0,00
2993601,06
2544843,76
39594,00
0,00
282327,28
среднее
2539,24
2329,06
0,00
0,00
149696,69
0,00
Отобразить на графике исходные данные, результаты моделирования и прогнозирования.
