- •Реализация задач многомерного корреляционного анализа с использованием пакета ms excel
- •Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции.
- •Для расчета частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности 4*4.
- •12. Далее необходимо проверить значимость полученных частных коэффициентов корреляции. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
- •13. Сравним расчетные значения с критическим и определим, какие коэффициенты значимы. Получим матрицу частных коэффициентов корреляции с выделенными значимыми коэффициентами: Таблица 8
- •15. Построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.
- •Расчёт множественных коэффициентов корреляции
- •17. Проверим значимость полученных множественных коэффициентов корреляции и детерминации. Проверка осуществляется с помощью f-критерия:
Реализация задач многомерного корреляционного анализа с использованием пакета ms excel
Проведение корреляционного анализа рассмотрим на примере.
С целью анализа взаимосвязи показателей эффективности производства продукции были рассмотрены параметры производственно-хозяйственной деятельности 30 предприятий машиностроения.
Необходимо провести анализ взаимосвязи следующих экономических показателей:
Результативный признак:
Y1 – производительность труда
Факторные признаки:
Х10 - фондоотдача;
Х14 - фондовооруженность труда;
Х15 - оборачиваемость нормируемых оборотных средств;
X16 - оборачиваемость ненормируемых оборотных средств.
Исходные данные представлены в файле Коррел. анализ.xls.
Предположим, что рассматриваемые признаки Y1, Х10, Х14, Х15, X16 в генеральной совокупности подчиняются нормальному закону распределения, и указанные данные представляют выборку из этой генеральной совокупности. Для решения данной задачи воспользуемся программным продуктом MS EXCEL.
Скопируйте в свою папку или на Рабочий стол файл Коррел. анализ.xls с диска U:\Общая информация\Эконометрика;
Откройте файл Коррел. анализ.xls и перейдите на лист Задание;
Подключите в Excel пакет анализа:
Меню СЕРВИС – Надстройки – Пакет анализа – ОК;
Меню СЕРВИС – Анализ данных – Корреляция – ОК;
Укажите следующие параметры диалогового окна «Корреляция»:
1. Входной интервал
Укажите массив исходных показателей, выделив мышкой все значения исследуемых переменных (Y1, Х10, Х14, Х15, X16).
2. Группирование
Установите переключатель в положение по столбцам.
3. Метки в первой строке
Поставьте флажок в опции Метки в первой строке, чтобы добавить во входной диапазон верхнюю строку, содержащую названия переменных, тогда корреляционная матрица будет выведена с названиями переменных.
4. Выходной интервал
Поставьте точку в опции Выходной интервал, затем щелкните мышью в строке напротив надписи Выходной интервал и щелкните мышью в ячейку G1 листа Задание.
После установки указанных параметров нажмите на кнопку ОК.
Получим корреляционную матрицу в следующем виде:
Таблица 1
-
Y1
X10
Х14
Х15
X16
Y1
1
X10
-0,02152
1
Х14
0,577299
-0,03604
1
Х15
0,334637
0,153663
0,077981
1
X16
-0,2042
-0,34832
-0,16676
-0,25017
1
Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной, и коэффициенты rij = rji. Скопируйте нужные парные коэффициенты корреляции в соответствующие ячейки.
В результате мы получим матрицу парных коэффициентов корреляции размерности 5x5:
Таблица 2
-
Y1
X10
Х14
Х15
X16
Y1
1
-0,02152
0,577299
0,334637
-0,2042
X10
-0,02152
1
-0,03604
0,153663
-0,34832
Х14
0,577299
-0,03604
1
0,077981
-0,16676
Х15
0,334637
0,153663
0,077981
1
-0,25017
X16
-0,2042
-0,34832
-0,16676
-0,25017
1
Далее необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу Hо: rij = 0. Для этого рассчитаем наблюдаемые значения t-статистики для всех коэффициентов корреляции по формуле:
Для этого скопируйте предыдущую таблицу и вставьте ее под самой собой, отступив две строки. Удалите из таблицы все числовые данные и установите курсор в ячейку на пересечении переменных Y1 и Х10. Находясь в указанной ячейке, введите в строку формул выражение для записи вышеуказанной формулы в следующем виде:
=(H3/КОРЕНЬ(1-H3*H3))*КОРЕНЬ(48).
При вводе данного выражения необходимо щелкать мышью в ячейку с соответствующим коэффициентом, для которого рассчитывается значение t-статистики, в данном случае в ячейку H3. Введя указанное выражение, нажмите ENTER. Растяните введенную формулу с помощью черного крестика по соседним ячейкам, в результате у вас должна получиться следующая матрица наблюдаемых значений t-статистики:
Таблица 3
-
tнабл
Y1
X10
Х14
Х15
X16
Y1
X10
-0,15071
Х14
4,949094
-0,25242
Х15
2,485769
1,088567
0,547536
X16
-1,4602
-2,60115
-1,18391
-1,80872
Мы вычислили наблюдаемые значения t-статистики только для нижнего треугольника таблицы, поскольку матрица парных коэффициентов корреляции является симметричной.
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степенен свободы ν=п-2. Для этого используем встроенную функцию Excel ВСТАВКА – Функция – Статистические – СТЬЮДРАСПОБР.
Для расчета tкр выделите пустую ячейку, затем вызовите функцию СТЬЮДРАСПОБР, введите в поле Вероятность число 0,05, а в поле Степени_свободы – число 49, поскольку всего мы имеем 51 наблюдение, поэтому ν=п-2=51-2=49. Нажав на кнопку ОК, мы получим следующее значение tкр = 2,009574.
Сравним рассчитанные нами наблюдаемые значения t-статистики с критическим (табличным) и определим, какие коэффициенты значимы, а какие нет. Коэффициент значим, если его |tнабл| > tкр.
Отметьте жирным шрифтом в таблице значимые коэффициенты корреляции:
Таблица 4
Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)
-
Y1
X10
Х14
Х15
X16
Y1
1
-0,02152
0,577299
0,334637
-0,2042
X10
-0,02152
1
-0,03604
0,153663
-0,34832
Х14
0,577299
-0,03604
1
0,077981
-0,16676
Х15
0,334637
0,153663
0,077981
1
-0,25017
X16
-0,2042
-0,34832
-0,16676
-0,25017
1
Для значимых парных коэффициентов корреляции построим с заданной надёжностью γ=0,95 интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Z' можно найти, используя функцию Excel:
ВСТАВКА – Функция – Статистические – ФИШЕР, в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r.
Значение tγ рассчитаем, используя функцию Excel: ВСТАВКА – Функция – Статистические – НОРМСТОБР, где в поле Вероятность вводится значение 0,95.
Zmin
=
;
Zmax
=
Для обратного преобразования используем функцию Excel: ВСТАВКА – Функция – Статистические –ФИШЕРОБР, где в поле Y вводятся ячейки со значением Zmin, Zmax, т.е. для расчета rmin вводим Zmin, а для расчета rтах вводим Zmax.
Расчеты представим в виде следующей таблицы:
Таблица 5
Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью γ = 0,95
-
r
Z’
Zmin
Zmax
rmin
rтах
Y1X14
0,577299
0,658403
0,413403
0,903403
0,3913583
0,71795081
Y1X15
0,334637
0,348041
0,103041
0,593041
0,10267786
0,5320792
Х10Х16
-0,34832
-0,36353
-0,60853
-0,11853
-0,5430915
-0,11797801
Таким образом, доверительные интервалы с надёжностью γ = 0,95 найдены для всех значимых парных коэффициентов корреляции.
По полученным данным можно сделать следующие выводы:
Между исследуемыми показателями выявлены значимые корреляционные зависимости.
1). Значимая обратная корреляционная взаимосвязь обнаружена между изучаемым признаком Х10 - фондоотдача и факторным признаком X16 - оборачиваемость ненормируемых оборотных средств.
2). Между производительностью труда (Y1) и фондовооруженностью труда (Х14) и между производительностью труда (Y1) и оборачиваемостью нормируемых оборотных средств (Х15) существует прямая связь.
3). Наиболее сильная связь существует между результативным признаком производительность труда (Y1) и факторным признаком фондовооруженность труда (Х14), причем отмеченная связь прямая.
