Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат_моделир_2015_заоч_ЭП_ФИН / Мат_мод_лекции.doc
Скачиваний:
61
Добавлен:
14.02.2016
Размер:
7.73 Mб
Скачать

3.4. Форма корреляционной связи

Форма уравнения связи устанавливается на основе теоретических, технологических соображений или интуиции. Когда заранее трудно представить зависимость, то строят корреляционное поле точек для двух признаков, по расположению которых на плоскости судят о направлении действия и форме связи. Каждой паре значений исследуемых признаков соответствует точка на корреляционном поле.

Если точки корреляционного поля (рис.3.1):

  • беспорядочно разбросаны по всему полю, то зависимости между исследуемыми признаками нет;

  • концентрируются вокруг прямой линии, идущей от нижнего левого угла в верхний правый угол, то имеется прямая линейная зависимость;

  • концентрируются вокруг прямой линии, идущей от верхнего левого угла в нижний правый угол, то имеется обратная линейная зависимость;

  • концентрируются вокруг некоторой кривой, то имеется нелинейная зависимость.

Рис.3.1. Связь корреляционного поля точек с выборочным коэффициентом корреляции

Корреляционное поле точек строят для выборок малого объема. Для больших выборок строят корреляционные таблицы, в которых информация представляется в упорядоченном виде. По расположению информации в таблице также можно установить направление действия и форму связи (рис. 3.2).

Парная корреляция – это связь между двумя признаками, один из которых является факторным (фактором), а другой – результативным.

В случае линейной корреляции зависимость между случайными величинами выражается уравнением прямой

Возможны случаи нелинейной зависимости, уравнения могут быть вида или вообще

а)

б)

Рис. 3.2. Связь вида корреляционной таблицы с выборочным коэффициентом корреляции и математической моделью

а – линейная модель; б – нелинейная модель (последние две таблицы).

Если устанавливается зависимость между тремя и более случайными величинами, то в этом случае имеем дело с множественной корреляцией.

3.5. Теснота корреляционной связи

В случае линейной зависимости между двумя признаками тесноту связи характеризуют коэффициентом корреляции

, (3.1)

где - корреляционный момент случайных величин (СВ); - среднеквадратичные отклонения СВ .

Корреляционный момент – это математическое ожидание произведения центрированных СВ и : . Для независимых СВ, =0, следовательно, и , в остальных случаях Если , то корреляция положительная, если , то - отрицательная. Оценкой коэффициента корреляции является выборочный коэффициент корреляции , который обладает свойствами коэффициента корреляции (рис.3.1 и рис. 3.2). Эти коэффициенты называют еще соответствующими парными коэффициентами корреляции, например, выборочный парный коэффициент корреляции.

Коэффициент парной корреляции является безразмерной величиной и его значение не зависит от выбора единиц измерения рассматриваемых признаков. Близость к нулю значения коэффициента парной корреляции свидетельствует об отсутствии линейной связи признаков, но не об отсутствии связи между ними вообще. Последняя часть рис. 3.1 поясняет это положение – точки разбросаны по всему корреляционному полю, но концентрируются вокруг окружности. Следовательно, коэффициент парной корреляции близок к нулю, но признаки явно связаны друг другом. Поэтому в случае равенства нулю коэффициента парной корреляции нужно не говорить сразу о независимости признаков в данный период, а построить более сложную модель их связи, учитывающую хотя бы нелинейную зависимость между этими признаками.

В случае нелинейной зависимости тесноту связи устанавливают теоретическим корреляционным отношением.

При исследовании зависимостей между случайными переменными Х и обычно ограничиваются изучением зависимости одной из них и условным математическим ожиданием другой, т.е.илигде- математическое ожидание случайной величиныпри условии, что случайная величинаприняла значение

Условное математическое ожидание случайной переменной, рассматриваемое как функция, т.е., называется функцией регрессиина.

На практике часто предпосылки корреляционного анализа нарушаются: один из признаков оказывается величиной не случайной или признаки не имеют совместного нормального распределения, но статистическая зависимость между ними существует. Для изучения связи между признаками в этом случае существует общий показатель зависимости признаков, в основу которого заложено понятие общей (или полной) дисперсии.

Полной называется дисперсия (рассеянность значений) признака относительно его математического ожидания. Для результативного признака полная дисперсия записывается в виде

(3.2)

Полную дисперсию можно разложить на две составляющие, одна из которых характеризует влияние признака на, другая – влияние прочих признаков:

(3.3)

Первое слагаемое обозначают и называют дисперсией функции регрессии относительно математического ожидания признака. Эта дисперсия измеряет влияние признакана. Второе слагаемое обозначаюти называют дисперсией признакаотносительно функции регрессии или остаточной дисперсией, которая измеряет влияние напрочих признаков.

Разделив обе части равенства (3.3) на полную дисперсию, получим

или, (3.4)

где - теоретическое корреляционное отношение, значения которого находятся в диапазоне от 0 до 1 и которое является показателем тесноты группировки точек около кривой регрессии независимо от ее вида. Корреляционное отношение, полученное по выборке, называют выборочным корреляционным отношением.

Соседние файлы в папке Мат_моделир_2015_заоч_ЭП_ФИН