
- •Содержание
- •Введение
- •I.Статистический анализ
- •§1.1. Основные понятия выборочного метода
- •§1.2. Законы распределения непрерывных случайных величин. Нормальное распределение
- •§1.3.Оценка параметров распределения
- •§ 1.4. Статистическая проверка гипотез
- •Тесты для самоконтроля Составьте краткие ответы на следующие вопросы
- •Характеристика тестов
- •II. Корреляционный и регрессионный анализ
- •§2.1. Система случайных величин
- •§ 2.2. Основы корреляционного анализа
- •§ 2.3. Регрессия. Линии среднеквадратической регрессии
- •§ 2.4. Выборочное уравнение регрессии
- •§ 2.5. Основы дисперсионного анализа
- •§ 2.6. Нелинейная корреляционная связь
- •Тесты для самоконтроля Составьте краткие ответы на вопросы
- •Характеристика тестов
- •III.Многомерный статистический анализ
- •§3.1. Основные характеристики многомерной генеральной совокупности
- •§ 3.2. Множественная корреляция
- •§ 3.3. Множественное уравнение регрессии
- •Тесты для самоконтроля
- •Характеристика тестов
- •IV. Статистический анализ в Excel
- •§ 4.1.Очистка информации от засорения
- •§ 4.2. Проверка закона распределения.
- •§ 4.3. Корреляционный анализ
- •§4.4. Регрессионный анализ двумерной модели.
- •§4.5. Регрессионный анализ трехмерной модели.
- •V. Содержание и объем курсовой работы
- •VI. Литература
- •Статистические данные.
- •Варианты заданий к работе « Статистический анализ»
§ 3.2. Множественная корреляция
Корреляционная связь между несколькими признаками при k > 2 называется множественной. Простейшим случаем является трехмерная модель. Трехмерная случайная величина (X,Y,Z), распределенная по нормальному закону, характеризуется девятью параметрами:
– математическими ожиданиями Mx, My, Mz ;
– дисперсией Dx, Dy, Dz;
– парными коэффициентами корреляции ρxy, ρxz, ρyz .
Через эти параметры выражаются частные коэффициенты корреляции, которые определяются при фиксированных значениях остальных случайных величин:
Аналогично определяются частные коэффициенты корреляции ρxz/y и ρyz/x.
Для нормального распределения частный коэффициент корреляции ρxy/z совпадает с парным коэффициентом корреляции между X и Y при фиксированном Z в двумерном условном распределении (X,Y)/Z и обладает всеми его свойствами. Частный коэффициент корреляции служит показателем линейной связи между двумя переменными случайными величинами независимо от влияния остальных случайных величин. Для оценки тесноты связи используют и коэффициент детерминации, равный квадрату коэффициента корреляции.
Если частный коэффициент детерминации меньше, чем соответствующий парный коэффициент детерминации, то взаимосвязь между двумя величинами обусловлена частично ( или целиком при равенстве нулю частного коэффициента детерминации ) воздействием на эту пару остальных, фиксируемых, случайных величин. Если же, наоборот, частный коэффициент детерминации больше соответствующего парного коэффициента детерминации, то фиксируемые величины ослабляют связь.
Множественный коэффициент корреляции между одной величиной Z и двумя другими величинами (X,Y) определяется по формуле:
и является мерой
связи между одной случайной величиной
и двумя остальными. Множественный
коэффициент детерминации, равный
,
показывает долю дисперсии случайной
величины Z
, обусловленную изменением случайных
величин (X,Y).
Значения
множественного коэффициента корреляции
заключены между 0 и 1: 0 ≤ ρz≤
1. При ρz
= 1 связь между Z
и (X,Y)
является функциональной. Точки (x,y,z)
расположены в плоскости регрессии Z
на (X,Y)
. Если ρz
= 0 , то одномерная случайная величина Z
и двумерная случайная ве личина (X,Y)
являются независимыми ( в силу нормальности
их распределения). При этом
.
В случае многомерной модели случайной величины особое значение имеют условные распределения. Для трехмерной модели это – условное распределение при фиксированном z и условное распределение при заданном (x,y).
При заданном z получаем двумерное распределение (x,y)/z, которое определяется при нормальном распределении пятью параметрами: двумя условными математическими ожиданиями μx/z и μy/z ; двумя условными дисперсиями σ2x/z и σ2y/z ; условным коэффициентом корреляции ρxy/z.
Распределение z/(x,y) является одномерным и определяется своими условным математическим ожиданием Mz/(x,y) и условной дисперсией Dz/(x,y) = σ2z/xy. Если точку (x,y) менять, то получим плоскость регрессии z на (x,y)
Mz/(x,y) – μz = βzx/y(x – μx) + βzy/x(y – μy)
и остаточную дисперсию относительно плоскости регрессии, совпадающую с условной дисперсией
σ2z/xy = σ2z/x(1 – ρ2zx/y) = σ2z/x(1 – ρ2yz/x) .
βzx/y и βzy/x – коэффициенты множественной регрессии. Множественный коэффициент корреляции ρz можно вычислить в силу линейности регрессии и как корреляционное отношение z на (x,y):
Точечные оценки частных и множественных коэффициентов корреляции вычисляются по выборке и выражаются через оценки основных числовых характеристик. Оценками математических ожиданий служат выборочные средние :
Оценки дисперсий – выборочные дисперсии:
,
где Sx , Sy , Sz – оценки средних квадратических отклонений.
Оценки парных коэффициентов корреляции :
rxz и ryz определяются аналогично.
Оценка частного коэффициента корреляции:
( аналогично для всех остальных).
Оценки условных средних квадратических отклонений :
Оценки множественных коэффициентов корреляции:
Проверка значимости множественного коэффициента детерминации ρz2 осуществляется с помощью F-распределения. Вычисляется
Fнабл
=
Затем с уровнем значимости α и числами степеней свободы ν1=2 (числителя ) и ν2 = n – 3 (знаменателя) находят Fкр. Если Fнабл > Fкр , гипотеза H0 : ρz2 = 0 отвергается с вероятностью ошибки α, т.е. ρz2 значимо отличается от 0. В противном случае, если коэффициент ρz незначим, связь между случайной величиной Z и случайной величиной (X,Y) отсутствует.
Для значимых множественных коэффициентов корреляции можно получить оценки уравнения регрессии. Так, если ρz значимо отличается от нуля, оценкой соответствующего уравнения регрессии будет
.
При этом коэффициенты регрессии вычисляются по формулам:
и
является оценкой Mz/(x,y).
Для значимых параметров связи можно найти интервальную оценку с надежностью γ = 1 – α с помощью Z–преобразования Фишера.