Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

курсач

.docx
Скачиваний:
12
Добавлен:
10.06.2015
Размер:
1.36 Mб
Скачать

Корелляционный анализ. Множественная корреляция

При исследовании взаимосвязей между экономическими показателями на основе статистических данных, часто между ними наблюдается стохастическая зависимость. Она проявляется в том, что изменение закона распределения одной случайной величины происходит под влиянием изменения другой. Систему математических процедур, которая направлена на изучение статистических связей между экономическими показателями называется корреляционным анализом. Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике же понятия корреляции появилось в 19-м веке благодаря работам английских статистов Пирсона и Гильтона. Термин корреляция в переводе с латинского означает соотношение, взаимосвязь.

Корреля́ция (от лат. correlatio — соотношение, взаимосвязь), корреляционная зависимость — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции R. Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и её направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной.

Виды зависимостей.

- Функциональная зависимость, при которой каждому значению одной переменной соответствует определенное значение другой. Функциональная зависимость может иметь место как между неслучайными переменными (зависимость скорости падения тела в вакууме от времени) так и между случайными переменными (зависимость стоимости продаж изделий от их числа).

- Статистическая или вероятностная зависимость. Это такой вид зависимости, при котором каждому значению одной переменной соответствует множество значений другой переменной.

- Корреляционная зависимость - такая статистическая зависимость между двумя переменными, при которой каждому значению одной переменной ставится в соответствие усредненное значение другой.

Корреляционный анализ включает следующие этапы:

1.Постановка задачи и выбор признаков;

2. Сбор информации и ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерного распределения);

3. Предварительная характеристика взаимосвязей (аналитические группировки, графики);

4. Устранение мультиколлинеарности (взаимозависимости факторов) и уточнение набора показателей путем расчета парных коэффициентов корреляции;

5. Исследование факторной зависимости и проверка ее значимости;

6. Оценка результатов анализа и подготовка рекомендаций по их практическому использованию.

Корреляционный анализ решает задачу измерения тесноты связи между варьирующими переменными и оценки факторов, оказывающих наибольшее влияние на результирующий признак. Различают парную и множественную корреляцию. В первом случае изучается связь между одним фактором и результативным показателем, во втором - между несколькими факторами и результативным показателем. Теснота связи оценивается с помощью коэффициента корреляции (при линейной зависимости) r, или корреляционного отношения (при нелинейной зависимости) з.

Уравнение множественной регрессии:

a — свободный член уравнения

x1,x2…xn — факторы, определяющие уровень изучаемого результативного показателя;

b1,b2…bn — коэффициенты регрессии при факторных показателях, характеризующие уровень влияния каждого фактора на результативный показатель в абсолютном выражении.

Расчет уравнения связи сводится к определению параметров а, b, с. В соответствии с требованиями метода наименьших квадратов для определения параметров необходимо решить следующие системы уравнений.

1. В случае прямолинейной зависимости:

2. В случае криволинейной зависимости между изучаемыми явлениями, когда при увеличении одного показателя, значения другого возрастают до определенного уровня, а потом начинают снижаться (например, зависимость производительности труда рабочих от их возраста), то для записи такой зависимости лучше всего подходит парабола второго порядка:

3. В случае криволинейной зависимости, когда при увеличении одной переменной значения другой увеличиваются до определенного уровня, а потом прирост снижается, например зависимость урожайности от количества внесенного удобрения, продуктивности животных от уровня их кормления, себестоимости единицы продукции от объема ее производства и т.д. Такую зависимость лучше описывает гипербола:

При более сложном характере зависимости между изучаемыми явлениями используются более сложные полиномы (третьего, четвертого порядка и т.д.), степенные, показательные и другие функции.

Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изучаемыми явлениями, узнать, на сколько единиц, в абсолютном измерении, изменяется величина результативного показателя с изменением факторного на единицу. Однако регрессионный анализ не дает ответа на вопрос: на сколько тесна эта связь, решающее или второстепенное воздействие оказывает данный фактор на величину результативного показателя. Математической мерой корреляции двух случайных величин (факторов) служит корреляционное отношение, либо коэффициент корреляции. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической. Для измерения тесноты связи между факторными и результативными показателями исчисляется коэффициент корреляции. При прямолинейной форме связи между изучаемыми показателями он рассчитывается по следующим формулам:

Этот коэффициент может принимать значения от 0 до 1. Чем ближе его величина к 1, тем более тесная связь между изучаемыми явлениями, и наоборот. Если коэффициент корреляции возвести в квадрат, получим коэффициент детерминации.

Линейный коэффициент корреляции связан с коэффициентом регрессии в виде следующей зависимости:

где: ai—коэффициент регрессии, σx—среднеквадратическое отклонение соответствующего факторного признака, σy—среднеквадратическое отклонение результативного признака.

Что касается измерения тесноты связи при криволинейной форме зависимости, то здесь используется не линейный коэффициент корреляции, а корреляционное отношение, формула которого имеет следующий вид:

Эта формула является универсальной. Ее можно применять для исчисления коэффициента корреляции при любой форме зависимости. Однако, для его нахождения требуется предварительное решение уравнения регрессии и расчет по нему теоретических (выравненных) значений результативного показателя для каждого наблюдения исследуемой выборки. Силу связи между признаками можно оценить по шкале Чеддока:

0.1 < η < 0.3 — слабая

0.3 < η < 0.5 — умеренная

0.5 < η < 0.7 — заметная

0.7 < η < 0.9 — высокая

0.9 < η < 1,0 — весьма высокая

При определении тесноты связи для многофакторной модели, при условии линейной связи между факторами (переменными), используется коэффициент множественной корреляции:

Для расчета которого необходимо определить частные коэффициенты корреляции:

Решение задач многофакторного корреляционного анализа производится по типовым программам. Cведения вводятся в соответствующую программу и рассчитывается уравнение множественной регрессии.

Область применения

Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. В различных прикладных отраслях приняты разные границы интервалов для оценки тесноты и значимости связи.

Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.

Расчёт

Для приведения исследуемых показателей в сопоставимый вид среди отдельно взятого фактора выбиралось максимальное значение и рассчитывался уровень остальных значений по формуле (1):

, i=1,…,m; j=1,…,n

( 0)

где dij – i-е значение j-го фактора, приведенного в сопоставимую форму;

xij – исходное i-е значение j-го фактора;

xmaxj – максимальное значение j-го фактора;

m – число факторов, принимаемых в учет (у нас – 6);

n – число значений одного фактора, выбранных для исследования (у нас – 11).

В качестве экономико-математической модели была выбрана модель множественной корреляции (2):

( 0)

где у – исходные значения исследуемого показателя;

xij – значения факторов фактора;

f – приближающая функция;

 – погрешность вычисления (влияние неучтенных факторов).

В работе использовались возможности табличного процессора Open Office. В результате исследования была определена наиболее подходящая приближающая функция и подтверждена ее значимость расчетом критерия Фишера (Fрасч=133,1162, Fтабл=3,23; Fрасч>Fтабл при уровне значимости =0,05). На основании табличных значений критерия Стьюдента были определены наиболее значимые факторы (коэффициенты при которых в уравнении регрессии отличны от 0). Такими факторами оказались фактор x3 (объем продукции сельского хозяйства в экономике региона) и x5 (оборот розничной торговли в региональной экономике). При этом уравнение регрессии принимает следующий вид (3):

y = 0,1716 + 0,2743 x3 + 0,6072 x5

( 0)

В блоке A4:I14 находятся исходные данные для проведения корреляционного анализа. Исследуется влияние 6 показателей влияющих на объем поступлений налоговых доходов в бюджет региона (рис. 1)

Рис.1 Исходные данные для проведения корреляционного анализа.

Рассчитаем :

1. Значение коэффициентов уравнения регрессии для предполагаемой линейной функции

2. Ошибки для каждого коэффициента

3. Значение коэффициента детерминации

4. Количество степеней свободы.

5. Регрессионную (объяснённую) и остаточную (необъяснённую) сумму квадратов отклонений. (рис.2)

Рис.2 Результат расчётов 1-5

Далее рассчитаем вероятность ошибки при отклонении гипотезы. Если вероятность окажется меньше заданного уровня значимости, то гипотеза отвергается, иначе принимается. Уровень значимости задаём 5 %. (рис.3)

Рис.3 Результаты вычисления ошибки отклонения гипотезы об отсутствии линейной связи

Проверяем значимость показателей в построенном уравнении регрессии.(рис.4)

Рис.4 Результаты проверки значимости показателей в построенном уравнении регрессии

Из рис.4 видно что наименее значимым является 1 показатель- среднегодовая численность занятых в экономике. Далее повторяем расчёт без этого показателя.

На рис. 5 представлены исходные данные для дальнейшего расчёта, но уже без 1-го показателя.

Рис.5 Исходные данные для проведения корреляционного анализа без 1-го показателя

На рис.6 представлены расчёты для данных показателей.

Рис.6 Расчёт показателей

Данный расчёт показывает, что наименее значимым является 6-ой показатель - объем продукции обрабатывающих производств, млн.руб. Дальнейший расчёт проводим без него.

На рис. 7 представлены исходные данные для дальнейшего расчёта, но уже без 4-го показателя

Рис.7 Исходные данные для проведения корреляционного анализа без 4-го показателя

На рис.8 представлены расчёты для данных показателей

Рис.8 Расчёт показателей

Данный расчёт показывает, что наименее значимым является 6-ой показатель - объем продукции обрабатывающих производств, млн.руб Дальнейший расчёт проводим без него.

На рис. 9 представлены исходные данные для дальнейшего расчёта, но уже без 6-го показателя.

Рис.9 Исходные данные для проведения корреляционного анализа без 6-го показателя

На рис.10 представлены расчёты для данных показателей

Рис.10 Расчёт показателей

Данный расчёт показывает, что наименее значимым является 2-ой показатель - степень износа основных фондов, % .

Из расчётов мы видим, что наибольшее влияние на объём поступающих налоговых доходов в региональный бюджет оказывает деятельность сельского хозяйства и розничной торговли.

Выводы

На основе полученных статистических данных [1] можно сделать вывод о том, что мировой финансовый кризис оказал негативное воздействие на создание налогового потенциала региона. В 2008 году по сравнению с 2007 наблюдался рост объёма налогов (рис.1), то в 2009 г. ситуация ухудшилась, что говорит о снижении налогового потенциала в 2009 г.

Таблица 1. Результаты расчета параметров с помощью функции LINEST

Показатели

m5

m3

m0

mn

mn-1

0,6072

0,2743

0,1716

Sen

Sen-1

0,1954

0,1685

0,0287

R2

Sey

0,9708

0,0537

#Н/Д

F

Df

133,1162

8,0000

#Н/Д

Ssreg

Ssresid

0,7684

0,0231

#Н/Д

Рис.1. Налоговые поступления в бюджет Ивановской области за 2001-2011 гг.

Проведенные расчёты показывают, что сельское хозяйство играет немаловажную роль в налоговых поступлениях региона. В последнее время наблюдается снижение темпов роста развития сельского хозяйства, что является следствием повышения ставок и залогов в ряде банков России. Кроме того, кредитные комитеты приостановили рассмотрение различных проектов. Сельскохозяйственный сектор столкнулся с неплатежами и увеличением отсрочки платежей. Сельское хозяйство, свою очередь, тесно связано с обрабатывающими отраслями, основными среди которых являются текстильная отрасль и пищевая промышленность, которые обеспечивали 27,9% валовой добавленной стоимости Ивановской области [1]. Вследствие чего наблюдается снижение среднегодовой численности занятых в экономике региона, и, тем самым, снижение налоговых поступлений в бюджет.

Розничная торговля стала одним из основных видов деятельности города и региона, поскольку многие крупные предприятия приостановлены или работают не на полную мощность. Для увеличения налоговых поступлений следует создавать условия, стимулирующие развитие торговли – как одного из направлений малого бизнеса в городе.

Список используемой литературы

  1. http://www.gks.ru

  2. Антохова И.В. Методы прогнозирования социально-экономических процессов: Учебное пособие.- Улан-Удэ: Издательство ВСГТУ, 2004-212с.

  3. Налоги и налогообложение: учебник/ Под ред. М. В. Романовский, Ред. О.В. Врублевская- 4-е изд., испр. и доп.- СПб,: Питер, 2003.

  4. Попова Г.Л. Многомерная классификация налогового потенциала регионов Центрального Федерального округа. // Вопросы статистики. – 2012. - № 10. – с.67.

  5. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М. Многомерный статистический анализ в экономике. / Под ред. В.Н.Тамашевича. – М.: ЮНИТИ-ДАНА, 2009. – 598 с.

  6. Эконометрика: учеб. / Под ред. И.И.Елисеевой. – М.: Проспект, 2009 – 288 с.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]