Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры к госам.doc
Скачиваний:
15
Добавлен:
19.11.2018
Размер:
3.16 Mб
Скачать

Вопрос 10

10. Корреляционно-регрессионный анализ и его использование при изучении взаимосвязей.

КРА явл. самым распространенным методом изучения взаимосвязей.

  1. Дает колич-ю оценку взаим-зи.

  2. Дает точные рез-ты.

  3. Может быть использован как при анализе, так и при прогнозе.

Этапы проведения:

  1. Строится поле корреляции, с пом-ю к-го опред-ся форма связи.

  2. На основании этого поля строится уравнение регрессии, к-е дает колич-ю оценку взаимосвязи.

  3. Рассчит-ся к-т корреляции, с пом-ю к-го определяется теснота взаимосвязи.

  4. Оценивается надежность к-та кор-ции и параметров уравнения регрессии.

Линейные зависимости

Если с пом-ю граф. метода установлено, что точки колеблются вокруг прямой, то в качестве уравнения регрессии принимается уравнение прямой линии: ух = а0 + а1х, х – факт-й признак, у – результ-й, а0, а1 – параметры уравнения.

а1 показывает, на ск-ко изменится рез-й признак, если факт-й изменится на единицу; а0 показывает, чему был бы равен рез-й признак.

Если факт-й признак принять = 0 и учитывать влияние др. факторов, то а0 и а1 нах-ся по методу наим. квадратов. Необх. решить систему:

na0 + a1∑x = ∑y, дает колич-ю

a0∑x + a1∑x² = ∑xy оценку

Для определ-я тесноты взаимосвязи рассчит-ся к-т корреляции:

_______________________

rxy = (nxy - ∑xy) / √(nx² - (∑x)²)( ny² - (∑y)²)

Полученное значение сравнив-ся со шкалой Чеддока и выясняется:

Если r = 0,1-0,3 – связь слабая;

0,3-0,5 – умеренная;

0,5-0,7 – заметная;

0,7-0,9 – высокая;

0,9-0,99 – приближ-ся к функц-й;

0 – связи нет.

Знак «-» - связь обратная.

Т.к. обычно изучение взаимосвязи ведется по малому кол-ву наблюдений, то оцен-ся существенность или надежность к-та кор-ции и параметров уравнения. Рассчитываются:

____

1. Ошибка выборки: Мr = (1 - r²) / √ n - 1

2. Коэф-т доверия: t = r / Мr, если t > 3, то к-т кор-ции существенный или надежный.

Для оценки надежности параметра а1 рас-ся ошибка выборки, а далее к-т доверия. ____ __

Мr = σх √1 - r² / σyn

t = a / Мr, t > 3, параметр надежный.

Нелинейные зависимости

Если с помощью граф. метода установлено, что точки колеблются вокруг параболы, то урвнение регрессии имеет следующий вид:

ух = а0 + а1х + а2х² - уравнение параболы

а0 и а2 смысла не имеют и их не анализируют; а1 показывает на сколько изменится результ-й признак, если факт-й изменится на единицу.

na0 + a1∑x + a2∑x² = ∑y,

a0∑x + a1∑x² + a2∑x³ = ∑xy,

a0∑x² + a1∑x³ + a2∑x^4 = ∑x²y

Из этой системы можно найти параметры.

Если установлено, что точки колеблются вокруг гиперболы, то уравнение имеет вид: ух = а0 + а1 1/х

na0 + a1∑1/x = ∑y,

a0∑1/x + a1∑1/x² = ∑y 1/x

Используя уравнение регрессии, можно рассчитать теорет. уровни рез-го признака. Для этого в уравнение регрессии вместо х подставляются фактич. значения и получают теор. значения.

Рассчитывается ошибка аппроксимации:

ε = 1/n∑(Yф – Yтеор) / Yф * 100%, норма до 10 %.

При нелинейной завис-ти при оценке тесноты взаимосвязи рассчит-ся корреляционное отношение:

________

ρ = √ σух ² / σу² , σух² - теоретическая дисперсия, σу² - фактическая.

σу² = (∑(у-уср)²) / n

σух² = (∑(ух-уср)²) / n, где ух – теоретические уровни.

Для проверки связи используется шкала Чеддока.

Кроме того, в коррел-м анализе исп-ся уравнение показат. кривой для потроения уравнения регрессии: ух = а0 + а1^х , lg ух = lg а0 + x lgа1

n lg a0 + lg a1∑x = ∑lg y,

lg a0∑x + lg a1∑x² = ∑x lg y

Полулогарифмическая функция: ух = а0 + а1 lg x

na0 + a1∑lg x = ∑ y,

a0∑lg x + a1∑(lg x)² = ∑y lg x

Выбор адекватной модели осущ-ся на основании расчета остаточной дисперсии: σу² = (∑(yi - yx)²) / n. Наилучшая модель, когда σу² = min/

Многофакторные зависимости

Когда на рез-й признак оказывают влияние несколько факторов.

Ух1 х2 … хn = а0 + а1х1 + а2х2 + … + аnxn , а0 смысла не имеет.

а1, а2 … показывают как изменится рез-й признак, если каждый фактор изменится на единицу.

При многофакторной зависимости сущ-т понятие коллинеарности – тесная связь между факторными признаками, к-я обнаруживается при расчете к-та кор-ции. Если обнаружена коллинеарность, то 1 из факторных признаков отбрасывается.

На практике чаще всего встречаются двухфакторные завис-ти. Уравнение имеет вид: Ух1 + х2 = а0 + а1х1 + а2х2

na0 + a1∑x1 + a2∑x2 = ∑y,

a0∑x1 + a1∑x1² + a2∑x1х2 = ∑x1y,

a0∑x2 + a1∑x1х2 + a2 ….

Для расчета к-та кор-ции при двухфакторной завис-ти сначала рассчитываются парные коэф-ты, а затем общий к-т кор-ции:

____________________________________

k = √ (ryx1² + ryx2² - 2ryx1*ryx2 - rx1x2) / (1 - rx1x2²)

Если k > 0 – связь прямая, < 0 – обратная.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]