Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Prakticheskaya_2_Stat_analiz.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.08 Mб
Скачать

§ 3.2. Множественная корреляция

Корреляционная связь между несколькими признаками при k > 2 называется множественной. Простейшим случаем является трехмерная модель. Трехмерная случайная величина (X,Y,Z), распределенная по нормальному закону, характеризуется девятью параметрами:

– математическими ожиданиями Mx, My, Mz ;

– дисперсией Dx, Dy, Dz;

– парными коэффициентами корреляции ρxy, ρxz, ρyz .

Через эти параметры выражаются частные коэффициенты корреляции, которые определяются при фиксированных значениях остальных случайных величин:

Аналогично определяются частные коэффициенты корреляции ρxz/y и ρyz/x.

Для нормального распределения частный коэффициент корреляции ρxy/z совпадает с парным коэффициентом корреляции между X и Y при фиксированном Z в двумерном условном распределении (X,Y)/Z и обладает всеми его свойствами. Частный коэффициент корреляции служит показателем линейной связи между двумя переменными случайными величинами независимо от влияния остальных случайных величин. Для оценки тесноты связи используют и коэффициент детерминации, равный квадрату коэффициента корреляции.

Если частный коэффициент детерминации меньше, чем соответствующий парный коэффициент детерминации, то взаимосвязь между двумя величинами обусловлена частично ( или целиком при равенстве нулю частного коэффициента детерминации ) воздействием на эту пару остальных, фиксируемых, случайных величин. Если же, наоборот, частный коэффициент детерминации больше соответствующего парного коэффициента детерминации, то фиксируемые величины ослабляют связь.

Множественный коэффициент корреляции между одной величиной Z и двумя другими величинами (X,Y) определяется по формуле:

и является мерой связи между одной случайной величиной и двумя остальными. Множественный коэффициент детерминации, равный , показывает долю дисперсии случайной величины Z , обусловленную изменением случайных величин (X,Y).

Значения множественного коэффициента корреляции заключены между 0 и 1: 0 ≤ ρz≤ 1. При ρz = 1 связь между Z и (X,Y) является функциональной. Точки (x,y,z) расположены в плоскости регрессии Z на (X,Y) . Если ρz = 0 , то одномерная случайная величина Z и двумерная случайная ве личина (X,Y) являются независимыми ( в силу нормальности их распределения). При этом .

В случае многомерной модели случайной величины особое значение имеют условные распределения. Для трехмерной модели это – условное распределение при фиксированном z и условное распределение при заданном (x,y).

При заданном z получаем двумерное распределение (x,y)/z, которое определяется при нормальном распределении пятью параметрами: двумя условными математическими ожиданиями μx/z и μy/z ; двумя условными дисперсиями σ2x/z и σ2y/z ; условным коэффициентом корреляции ρxy/z.

Распределение z/(x,y) является одномерным и определяется своими условным математическим ожиданием Mz/(x,y) и условной дисперсией Dz/(x,y) = σ2z/xy. Если точку (x,y) менять, то получим плоскость регрессии z на (x,y)

Mz/(x,y) – μz = βzx/y(x – μx) + βzy/x(y – μy)

и остаточную дисперсию относительно плоскости регрессии, совпадающую с условной дисперсией

σ2z/xy = σ2z/x(1 – ρ2zx/y) = σ2z/x(1 – ρ2yz/x) .

βzx/y и βzy/x – коэффициенты множественной регрессии. Множественный коэффициент корреляции ρz можно вычислить в силу линейности регрессии и как корреляционное отношение z на (x,y):

Точечные оценки частных и множественных коэффициентов корреляции вычисляются по выборке и выражаются через оценки основных числовых характеристик. Оценками математических ожиданий служат выборочные средние :

Оценки дисперсий – выборочные дисперсии:

,

где Sx , Sy , Sz – оценки средних квадратических отклонений.

Оценки парных коэффициентов корреляции :

rxz и ryz определяются аналогично.

Оценка частного коэффициента корреляции:

( аналогично для всех остальных).

Оценки условных средних квадратических отклонений :

Оценки множественных коэффициентов корреляции:

Проверка значимости множественного коэффициента детерминации ρz2 осуществляется с помощью F-распределения. Вычисляется

Fнабл =

Затем с уровнем значимости α и числами степеней свободы ν1=2 (числителя ) и ν2 = n – 3 (знаменателя) находят Fкр. Если Fнабл > Fкр , гипотеза H0 : ρz2 = 0 отвергается с вероятностью ошибки α, т.е. ρz2 значимо отличается от 0. В противном случае, если коэффициент ρz незначим, связь между случайной величиной Z и случайной величиной (X,Y) отсутствует.

Для значимых множественных коэффициентов корреляции можно получить оценки уравнения регрессии. Так, если ρz значимо отличается от нуля, оценкой соответствующего уравнения регрессии будет

.

При этом коэффициенты регрессии вычисляются по формулам:

и является оценкой Mz/(x,y).

Для значимых параметров связи можно найти интервальную оценку с надежностью γ = 1 – α с помощью Z–преобразования Фишера.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]