Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа № 1 в Excel.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
203.78 Кб
Скачать

Реализация задач многомерного корреляционного анализа с использованием пакета ms excel

Проведение корреляционного анализа рассмотрим на примере.

С целью анализа взаимосвязи показателей эффективности производства продукции бы­ли рассмотрены параметры производственно-хозяйственной деятельности 30 предприятий машиностроения.

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y1 производительность труда

Факторные признаки:

Х10 - фондоотдача;

Х14 - фондовооруженность труда;

Х15 - оборачиваемость нормируемых оборотных средств;

X16 - оборачиваемость ненормируемых оборотных средств.

Исходные данные представлены в файле Коррел. анализ.xls.

Предположим, что рассматриваемые признаки Y1, Х10, Х14, Х15, X16 в генеральной совокупности подчиняются нормальному закону распределения, и указанные данные представляют выбор­ку из этой генеральной совокупности. Для решения данной задачи воспользуемся программным продуктом MS EXCEL.

  1. Скопируйте в свою папку или на Рабочий стол файл Коррел. анализ.xls с диска U:\Общая информация\Эконометрика;

  2. Откройте файл Коррел. анализ.xls и перейдите на лист Задание;

  3. Подключите в Excel пакет анализа:

Меню СЕРВИС – Надстройки – Пакет анализа – ОК;

Меню СЕРВИС – Анализ данных – Корреляция – ОК;

  1. Укажите следующие параметры диалогового окна «Корреляция»:

1. Входной интервал

Укажите массив исходных показателей, выделив мышкой все значения ис­следуемых переменных (Y1, Х10, Х14, Х15, X16).

2. Группирование

Установите переключатель в положение по столбцам.

3. Метки в первой строке

Поставьте флажок в опции Метки в первой строке, чтобы добавить во входной диапазон верхнюю строку, содержащую названия переменных, тогда корреляци­онная матрица будет выведена с названиями переменных.

4. Выходной интервал

Поставьте точку в опции Выходной интервал, затем щелкните мышью в строке напротив надписи Выходной интервал и щелкните мышью в ячейку G1 листа Задание.

После установки указанных параметров нажмите на кнопку ОК.

Получим корреляционную матрицу в следующем виде:

Таблица 1

 

Y1

X10

Х14

Х15

X16

Y1

1

X10

-0,02152

1

Х14

0,577299

-0,03604

1

Х15

0,334637

0,153663

0,077981

1

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

  1. Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной, и коэффициенты rij = rji. Скопируйте нужные парные коэффициенты корреляции в соответствующие ячейки.

В результате мы получим матрицу парных коэффициентов корреляции размерности 5x5:

Таблица 2

 

Y1

X10

Х14

Х15

X16

Y1

1

-0,02152

0,577299

0,334637

-0,2042

X10

-0,02152

1

-0,03604

0,153663

-0,34832

Х14

0,577299

-0,03604

1

0,077981

-0,16676

Х15

0,334637

0,153663

0,077981

1

-0,25017

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

  1. Далее необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу Hо: rij = 0. Для этого рассчитаем наблюдаемые значения t-статистики для всех ко­эффициентов корреляции по формуле:

Для этого скопируйте предыдущую таблицу и вставьте ее под самой собой, отступив две строки. Удалите из таблицы все числовые данные и установите курсор в ячейку на пересечении переменных Y1 и Х10. Находясь в указанной ячейке, введите в строку формул выражение для записи вышеуказанной формулы в следующем виде:

=(H3/КОРЕНЬ(1-H3*H3))*КОРЕНЬ(48).

При вводе данного выражения необходимо щелкать мышью в ячейку с соответствующим коэффициентом, для которого рассчитывается значение t-статистики, в данном случае в ячейку H3. Введя указанное выражение, нажмите ENTER. Растяните введенную формулу с помощью черного крестика по соседним ячейкам, в результате у вас должна получиться следующая матрица наблюдаемых значений t-статистики:

Таблица 3

tнабл 

Y1

X10

Х14

Х15

X16

Y1

X10

-0,15071

Х14

4,949094

-0,25242

Х15

2,485769

1,088567

0,547536

X16

-1,4602

-2,60115

-1,18391

-1,80872

 

Мы вычислили наблюдаемые значения t-статистики только для нижнего треугольника таблицы, поскольку матрица парных коэффициентов корреляции является симметричной.

  1. Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степенен свободы ν=п-2. Для этого используем встроенную функцию Excel ВСТАВКА Функция – Статистические – СТЬЮДРАСПОБР.

Для расчета tкр выделите пустую ячейку, затем вызовите функцию СТЬЮДРАСПОБР, введите в поле Вероятность число 0,05, а в поле Степени_свободы – число 49, поскольку всего мы имеем 51 наблюдение, поэтому ν=п-2=51-2=49. Нажав на кнопку ОК, мы получим следующее значение tкр = 2,009574.

Сравним рассчитанные нами наблюдаемые значения t-статистики с критическим (табличным) и опреде­лим, какие коэффициенты значимы, а какие нет. Коэффициент значим, если его |tнабл| > tкр.

  1. Отметьте жирным шрифтом в таблице значимые коэффициенты корреляции:

Таблица 4

Матрица парных коэффициентов корреляции исследуемых показателей с выделением зна­чимых коэффициентов (при α=0,05)

 

Y1

X10

Х14

Х15

X16

Y1

1

-0,02152

0,577299

0,334637

-0,2042

X10

-0,02152

1

-0,03604

0,153663

-0,34832

Х14

0,577299

-0,03604

1

0,077981

-0,16676

Х15

0,334637

0,153663

0,077981

1

-0,25017

X16

-0,2042

-0,34832

-0,16676

-0,25017

1

  1. Для значимых парных коэффициентов корреляции построим с заданной надёжностью γ=0,95 интервальную оценку rmin< r < rтах с помощью Z-преобразования Фишера (см. формулы в лекции). Z' можно найти, используя функцию Excel:

ВСТАВКА Функция – Статистические – ФИШЕР, в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r.

  1. Значение tγ рассчитаем, используя функцию Excel: ВСТАВКА – Функция – Статистические – НОРМСТОБР, где в поле Вероятность вводится значение 0,95.

Zmin = ; Zmax =

Для обратного преобразования используем функцию Excel: ВСТАВКА Функция – Статистические –ФИШЕРОБР, где в поле Y вводятся ячейки со значением Zmin, Zmax, т.е. для расчета rmin вводим Zmin, а для расчета rтах вводим Zmax.

Расчеты представим в виде следующей таблицы:

Таблица 5

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции ис­следуемых экономических показателей с надёжностью γ = 0,95

 

r

Z’

Zmin

Zmax

rmin

rтах

Y1X14

0,577299

0,658403

0,413403

0,903403

0,3913583

0,71795081

Y1X15

0,334637

0,348041

0,103041

0,593041

0,10267786

0,5320792

Х10Х16

-0,34832

-0,36353

-0,60853

-0,11853

-0,5430915

-0,11797801

Таким образом, доверительные интервалы с надёжностью γ = 0,95 найдены для всех значимых парных коэффициентов корреляции.

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимая обратная корреляционная взаимосвязь обнаружена между изучаемым при­знаком Х10 - фондоотдача и факторным признаком X16 - оборачиваемость ненормируемых оборотных средств.

2). Между производительностью труда (Y1) и фондовооруженностью труда 14) и между производительно­стью труда (Y1) и оборачиваемостью нормируемых оборотных средств (Х15) существует прямая связь.

3). Наиболее сильная связь существует между результативным признаком производительность труда (Y1) и факторным признаком фондовооруженность труда 14), причем отмеченная связь прямая.