Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
gos1 / Статистика 29-34.doc
Скачиваний:
23
Добавлен:
26.03.2015
Размер:
214.02 Кб
Скачать

31. Корреляционно-регрессионный анализ в изучении связи показателей

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную(полную) икорреляционную(неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь(которую также называютнеполной, илистатистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, иобратными, при которых рост последнего сопровождается уменьшением функции.

Относительно своей аналитической формы связи бывают линейнымиинелинейными.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные –множественной.

По силе различаются слабыеисильныесвязи.

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются методы корреляционного анализа и регрессионного анализа. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Задачи собственно корреляционного анализасводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализалежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Схема корреляционно-регрессионного анализа:

1. Определение объекта.

2. Набор факторов, влияющих на результативный.

3. Логический отбор факторов.

4. Первичная статистическая обработка.

5. Парная корреляция.Строитсякорреляционное поле– график, где на оси абсцисс откладывают значениях, по оси ординат –y. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

Для количественной оценки тесноты связи широко используют линейный коэффициент корреляции:

[-1; + 1].

Принято считать, что если: r < 0,30– связь слабая;r = 0,3÷0,7 – средняя; приr > 0,70– сильная, или тесная. Когдаr = 1– связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи междуyиx.

Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи:

, где: tрасч– так называемое расчетное значение t-критерия.

Если tрасчбольше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n – 2) степеней свободы, то можно утверждать, что rxyзначимо.

Если связь криволинейная rопределяют:

1. Корреляционное отношение .

2. Индекс корреляции .

Для выявления существенности связи используют F-критерий Фишера.

, если Fрасч≥Fтабл– связь существенна.

6. Простая регрессия– закономерность, выявленная междуyи каждым фактором, влияющим на него.

Выбирается модель, которая точно отображает ряд распределения:

y= a ± bx, где:a–неучтенные факторы;

y = a + bx + cx2 – рост с ускорением;

y = a + b/x– гипербола (затухающий процесс).

Параметры находятся по МНК;

y = axb – степенная;

y = a bx– показательная;

y = ea + bx– экстрапоненциальное;

Выбирается аппроксимирующее уравнение, где ошибка наименьшая: .

Аппроксимирующее уравнение проверяется на типичность: ошибки по параметрам ma,mb,mcсравниваются с табличными. Если нетипичны уравнение нельзя использовать в практических целях.

7. Проверка на мультиколлениарность.Необходимо рассчитатьrмежду факторами:

, если > 0,6 факторы коллинеарны, выбирается тот, у кот r между ним и y больше.

8. Модель множественной регресии: Y = a + bx1 + cx2 + … + zxn.

Параметры находятся на основе симплекс метода.

9.Расчет совокупного r: .

На основе рассчитывается коэффициент детерминации D = R2– если > 0,8 модель можно использовать для практических целей.

Соседние файлы в папке gos1