Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 700263.doc
Скачиваний:
19
Добавлен:
01.05.2022
Размер:
1.75 Mб
Скачать

Тема 3. Парная линейная регрессия и корреляция

1. Статистическая зависимость (независимость) случайных переменных.

2. Анализ линейной статистической связи экономических данных.

  1. Статистическая зависимость (независимость)

случайных переменных.

Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаи­мозависимы и взаимообусловлены. В одних случаях связь (за­висимость) между признаками оказывается очень тесной (на­пример, часовая выработка и заработная плата), а в других слу­чаях связь между признаками вовсе не обнаруживается или выражается очень слабо (например, пол студентов и их успевае­мость). Чем теснее связь между признаками, тем точнее при­нимаемые решения и легче управление системами.

Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность при­чинности состоит в порождении одного явления другим. В лю­бой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их из­менение, другие - в качестве результатов действия этих фак­торов. Иными словами, одни представляют собой причину, дру­гие - следствие. Признаки, характеризующие следствие, назы­ваются результативными (зависимыми, объясняемыми пере­менными у), признаки, характеризующие причины - фактор­ными (независимыми, объясняющими переменными x).

Различают два типа зависимости между явлениями и их при­знаками: функциональную* или жестко детерминированную (например, зависимость выработки продукции па одного рабочего от объема выпушенной продукции и численности рабочих), и статистическую* или стохастически детерминированную (на­пример, зависимость между производительностью труда и себе­стоимостью единицы продукции).

Для социально-экономических явлений характерно то, что наряду с существенными факторами на них оказывают воздей­ствие многие другие, в том числе случайные факторы. В связи с этим существующая зависимость не проявляется здесь в каж­дом отдельном случае, как при функциональных связях, а лишь «в общем и среднем» при большом числе наблюдений. В этом случае говорят о статистической зависимости. Частным случаем статистической зависимости является кор­реляционная зависимость.

Корреляционная связь является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев.

Функциональная связь всегда выражается формула­ми, что в большей степени присуще точным наукам (ма­тематике, физике), с одинаковой силой проявляет­ся у всех единиц совокупности, является полной и точной, так как обычно известен пе­речень всех факторов и меха­низм их воздействия на пере­менную в виде уравнения.

Корреляционная зависимость – это разнообразие факторов, их взаимосвязи и противоречивые действия вызывают широкое ва­рьирование переменной у . Она обнаруживается не в единич­ных случаях, а в массе и тре­бует для своего исследования массовых наблюдений . Связь между переменными х и у неполная и проявляется лишь в средних величинах.

Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная. По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной). В зависимости от количества признаков, включенных в мо­дель, корреляционные связи делят на однофакторные и много­факторные.

Корреляционная зависимость исследуется с помощью мето­дов корреляционного и регрессионного анализа.

Корреляционно-регрессионный анализ проводится поэтап­но в определенной логической последовательности.

Корреляционно-регрессионный анализ проводится поэтап­но в определенной логической последовательности. Этапы проведения комплексного корреляционно-регрессионного анализа следующие:

1. Предварительный анализ явлений и выявление причин возник­новения взаимосвязей между признаками, характеризующими эти явления

2. Разделение признаков на факторные и результативные, выбор наиболее существенных признаков для их исследования на предмет включения в корреляционно-регрессионные модели

3. Построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков корреляционно-регрессионных моделей

4. Предварительная оценка формы уравнения регрессии

5. Решение уравнения регрессии, вычисление коэффициентов ре­грессии и их смысловая интерпретация

6. Расчет теоретически ожидаемых (воспроизведенных по уравне­нию регрессии) значений результативного признака

7. Определение и сравнительный анализ дисперсий: обшей, фак­торной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель

8. Общая оценка качеств; модели, отсев несущественных (или включение дополнительных) факторов, построение модели, т.е. по­вторение п. 1—7

9. Статистическая оценка достоверности параметров уравнения ре­грессии, построение доверительных границ для теоретически ожи­даемых по уравнению регрессии значений функции

10. Практические выводы из анализа

Наиболее разработанной в эконометрике является методо­логия парной линейной корреляции, рассматривающая влияние вариации переменной x на переменную у и представляющая со­бой однофакторный корреляционный и регрессионный анализ.

  1. Анализ линейной статистической связи экономических данных.

Одной из важнейших задач эконометрических исследований является задача выявления связей между факторами, влияния одного фактора на другой. Такие задачи изучаются разделами прикладной математики и статистики – в регрессионном и корреляционном анализе.

Рассмотрим два показателя Х и Y. Предположим, что они зависимы, то есть изменение одного из них влечет за собой изменение другого. Если при этом, зная точно значение одного показателя можно точно определить значение другого, то связь между показателями называется функциональной. Например, зная точно объем проданного за день товара можно точно рассчитать выручку от его продаж. Однако на практике в подавляющем большинстве случаев встречаются зависимости иного вида, когда изменение одного показателя лишь в среднем приводит к изменению другого. Такие зависимости называются статистическими. Для них, зная значение Х, нельзя точно определить Y, так как на Y кроме Х влияет еще множество неучтенных факторов. Поэтому, зная Х можно лишь в среднем оценить значение Y. Примеры таких зависимостей в экономике: зависимости между ценой и спросом или предложением (функции спроса и предложения), между объемом произведенной продукции и затратами ресурсов (производственные функции), между доходом и потреблением и т.д. Характер статистической зависимости изучается в регрессионном анализе, а сила статистической связи – в корреляционном анализе.

Предположим, что экономисту необходимо исследовать зависимость между показателями Х и Y. Такая зависимость называется парной. Для этого он измеряет в разных условиях значения показателя Х и одновременно значения Y, получая выборки пар значений . Необходимо определить характер статистической зависимости между Х и Y, то есть уравнение вида , которое позволяет по значению переменной x оценить в среднем значение y, спрогнозировав его. Это уравнение называется уравнением регрессии. Для нахождения уравнения регрессии используется метод наименьших квадратов, согласно которому среди всех возможных уравнений регрессии наилучшим является то, для которого сумма квадратов отклонений линии регрессии от опытных данных будет минимальна.

Рассмотрим простейший случай уравнения регрессии – линейную регрессию, когда уравнение регрессии имеет вид прямой линии: . Можно показать, что в соответствии с методом наименьших квадратов для нахождения неизвестных параметров а и b нужно использовать следующие формулы:

a = , b = , (3.1)

где = (x1+x2+…+xn), = (y1+y2+…+yn),

= (x12+x22+…+xn2), = (x1y1+x2y2+…+xnyn). (3.2)

Для проверки полученных результатов можно построить график, на который наносятся исходные точки и линия регрессии (пример 1).

Рассмотрим теперь вопрос оценки качества статистической связи. Мерой оценки силы статистической зависимости между показателями Х и Y служит коэффициент парной корреляции , который в случае линейной связи между факторами вычисляется по формуле (3.3):

rxy = , (3.3)

где = (y 1 2 + y 2 2 +… + y n 2), остальные параметры вычисляются по формулам (2).

Коэффициент корреляции обладает следующими свойствами:

1. Коэффициент корреляции изменяется в пределах .

2. Модуль коэффициента корреляции характеризует силу статистической связи, чем больше , тем сильнее связь, в частности если , то связь функциональная, если близок к нулю, то связь слабая или отсутствует.

3. Знак коэффициента корреляции характеризует направление статистической связи, если , то с ростом Х показатель Y также растет, если , то с ростом Х показатель Y убывает.

4. Величина называется коэффициентом детерминации, его можно интерпретировать как среднюю долю влияния показателя Х на Y.

Для ответа на вопрос: можно ли считать связь между показателями достаточно сильной, чтобы считать Х и Y зависимыми и уравнение их регрессии имело смысл, используется методика проверки значимости коэффициента корреляции. При проверке исследователем задается некоторая маленькая вероятность , называемая уровнем значимости. Он имеет смысл вероятности совершить ошибку, заключающуюся в принятии предположения о независимости показателей, в то время, когда они зависимы. Вместо  иногда задают величину р = 1- , называемую доверительной вероятностью. Ее можно интерпретировать как вероятность, с которой можно доверять полученному результату. На практике обычно выбирают =0,1; 0,05 или 0,01.

Далее, задав  или р , для случая парной линейной регрессии вычисляется величина t по формуле (3.4):

t = . (3.4)

По специальной таблице, называемой критическими значениями распределения Стьюдента, которая приведена в табл. 1, определяется критическое значение данной величины . Если , то можно считать, что коэффициент корреляции значим, показатели Х и Y зависимы, уравнение регрессии можно использовать для прогнозов и оценок. Если , то коэффициент корреляции незначим, показатели Х и Y независимы, уравнение регрессии теряет смысл.

Таблица 1