Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МС_Курсовая_КРА.doc
Скачиваний:
106
Добавлен:
05.06.2015
Размер:
1.91 Mб
Скачать

2. Корреляционный анализ экономических показателей

2.1. Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Отдельный выборочный коэффициент корреляции rij между двумя выбранными признаками Xi и Xj в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН.

Для этого выбираем

ВСТАВКА

f(x) Функция

Статистические

КОРРЕЛ

или ПИРСОН,

отметив в качестве массивов 1 и 2 столбцы двух интересующих переменных Xi и Xj.

Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных, подключение которого рассматривалось в п.1.

Выбираем в менюСЕРВИС

Анализ данных (Data Analysis)

Корреляция (Correlation)

Элементы диалогового окна «Корреляция»

  1. Входной диапазон (Input range)

Ссылка на диапазон, содержащий анализируемые данные. Ссылка должна состоять не менее чем из двух смежных диапазонов данных, данные в которых расположены по строкам или столбцам.

Необходимо указать массив исходных показателей (выделив мышкой все значения исследуемых переменных).

  1. Группирование (Grouped By)

Установите переключатель в положение По столбцам (Columns) или По строкам (Rows) в зависимости от расположения данных во входном диапазоне.

Группировку при таком представлении данных, как в таб.1, надо указать по столбцам.

3. Метки в первой строке/Метки в первом столбце (Labels in first row/column)

Если первая строка исходного диапазона содержит названия столбцов, установите переключатель в положение Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите переключатель в положение Метки в первом столбце. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.

Если поставить флажок в Метки в первой строке (Labels in first row), то во входной диапазон можно добавить верхнюю строку, содержащую названия переменных и корреляционная матрица будет выведена с названиями переменных.

4. Выходной диапазон (Output Range)

Введите ссылку на левую верхнюю ячейку выходного диапазона. Поскольку коэффициент корреляции двух наборов данных не зависит от последовательности их обработки, то выходная область занимает только половину предназначенного для нее места. Ячейки выходного диапазона, имеющие совпадающие координаты строк и столбцов, содержат значение 1, так как каждая строка или столбец во входном диапазоне полностью коррелирует с самим собой.

5. Новый лист (New Worksheet Ply)

Установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.

6. Новая книга (New Workbook)

Установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.

В выходном диапазоне необходимо отметить одну из верхних строк - указать либо ячейку, начиная с которой будет выводиться корреляционная матрица на этом же листе, либо вывести корреляционную матрицу на отдельный лист (в представленном окошке можно дать ему название).

Корреляционная матрица рассчитывается Excel в следующем виде:

Y

X1

X2

X3

X4

Y

1

X1

-0,372813

1

X2

0,475190

0,198409

1

X3

-0,299800

-0,233376

-0,656779

1

X4

-0,384825

0,021751

-0,073867

0,027049

1

Если при настройке корреляционного анализа не был поставлен флажок в Метки в первой строке, то матрица будет выведена без названий переменных и необходимо их добавить.

Столбец 1

Столбец 2

Столбец 3

Столбец 4

Столбец 5

Столбец 1

1

Столбец 2

-0,372813

1

Столбец 3

0,475190

0,198409

1

Столбец 4

-0,299800

-0,233376

-0,656779

1

Столбец 5

-0,384825

0,021751

-0,073867

0,027049

1


Кроме того, для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной и коэффициенты rij=rji.

Итак, получили матрицу парных коэффициентов корреляции размерности k×k (в нашем случае 5×5).

Таблица 2

Матрица парных коэффициентов корреляции исследуемых экономических показателей

Y

X1

X2

X3

X4

Y

1

-0,3728125

0,47519037

-0,2997998

-0,384825

X1

-0,372813

1

0,198409

-0,233376

0,021751

X2

0,47519

0,198409

1

-0,656779

-0,073867

X3

-0,2998

-0,233376

-0,656779

1

0,027049

X4

-0,384825

0,021751

-0,073867

0,027049

1

Теперь необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таб.3).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степеней свободы ν=n-2.

Для этого используем встроенную функцию Excel

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007)

f(x) Функция

Статистические

СТЬЮДРАСПОБР,

введя в предложенное меню вероятность α=0,05 и число степеней свободы ν=n-2=30-2=28.

Можно найти значения tкр по таблицам математической статистики (см. Приложение, таб.П.2.2).

Получаем tкр=2,0484071.

Таблица 3

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X1

X2

X3

X4

Y

-2,1260096

2,85773345

-1,6628801

-2,2062033

X1

-2,1260096

1,07117755

-1,2699768

0,11512476

X2

2,85773345

1,07117755

-4,6087103

-0,39194

X3

-1,6628801

-1,2699768

-4,60871026

0,14318431

X4

-2,2062033

0,11512476

-0,39194004

0,14318431


По результатам, представленным в табл. 3, наблюдаемое значение t-статистики больше критического tкр=2,0484071 по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т.е. коэффициенты - незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса (см. Приложение, таб.П.2.4) для нахождения критического значения rкр для уровня значимости α=0,05 и числа степеней свободы ν=n-2=30-2=28.

По таб. rкр (α=0,05; ν=28)=0,362.

Если соответствующий коэффициент | rij | > rкр, то он считается значимым.

Отметим в матрице парных коэффициентов корреляции значимые.

Таблица 4

Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)

Y

X1

X2

X3

X4

Y

1

-0,3728125

0,47519037

-0,2997998

-0,384825

X1

-0,372813

1

0,198409

-0,233376

0,021751

X2

0,47519

0,198409

1

-0,656779

-0,073867

X3

-0,2998

-0,233376

-0,656779

1

0,027049

X4

-0,384825

0,021751

-0,073867

0,027049

1

Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью γ интервальную оценку ρminρρmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.

1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r :

Для этого в Excel есть встроенные функции:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007)

f(x) Функция f(x) Функция

Статистические или Математические

ФИШЕР, ATANH ,

в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r.

Следует учитывать, что Z-функция – нечетная, т.е. Z(-r)= - Z(r).

Можно найти значение Zr и по таблице Z-преобразования Фишера (см. таб. П.2.5 Приложения)

2). ΔZ Найдём значение tγ, соответствующее заданной надёжности γ=0,95. - значение функции Лапласа.

Значение tγ можно найти по таб.П.2.1 Приложения, а можно использовать встроенную функцию Excel:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007)

f(x) Функция

Статистические

НОРМСТОБР

Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):

.

Поэтому при расчёте всех интервальных оценок нужно пересчитывать γ=0,95 в , а по этому значению уже вычислятьt.

В нашем случае для надёжности γ=0,95: F(t)=0,975; tγ =1,959964 (по таблице tγ =1,96).

Находим

3). Zmin и Zmax Теперь можно найти Zmin и Zmax:

Zmin = ZrΔZ; Zmax= Zr + ΔZ

4). ρmin и ρmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции ρmin и ρmax , соответствующие Zmin и Zmax.

Соответствующие значения ρmin и ρmax являются гиперболическими тангенсами Zmin и Zmax : .

Для их нахождения в Excel используем встроенные функции:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007)

f(x) Функция f(x) Функция

Статистические или Математические

ФИШЕРОБР, TANH ,

введя в качестве аргумента значения соответствующих Zmin и Zmax.

Можно найти значения ρmin и ρmax и по таблице Z-преобразования Фишера (см. таб. П.2.5 Приложения).

Построим с надёжностью γ=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.

Таблица 4

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью γ=0,95

r

Zr

Zmin

Zmax

ρmin

ρmax

Y X1

-0,37281

-0,39169

-0,76888

-0,01449

-0,64628

-0,01449

Y X2

0,47519

0,51675

0,139558

0,893949

0,138659

0,713339

Y X4

-0,38483

-0,40571

-0,78291

-0,02852

-0,65437

-0,02851

X2 X3

-0,65678

-0,78712

-1,16432

-0,40993

-0,82244

-0,38842


Таким образом, доверительные интервалы с надёжностью γ=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(-0,64628≤ ρYX1 ≤ -0,01449)=0,95

P(0,138659≤ ρYX2 ≤ 0,713339)=0,95

P(-0,65437≤ ρYX4 ≤ -0,02851)=0,95

P(-0,82244≤ ρX2X3 ≤ -0,38842)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимые корреляционные обратные взаимосвязи обнаружены между изучаемым признаком Y – рентабельностью и факторными признаками X1 – оборачиваемость ненормируемых средств и X4 – оборачиваемость нормируемых средств.

2). Между рентабельностью (Y) и фондоотдачей (X2) существует прямая умеренная связь.

3). Наиболее сильная связь существует между факторными признаками фондоотдачей (X2) и фондовооруженностью труда (X3), причем отмеченная связь обратная.