Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RGR_Rozhnovskaya_Word.doc
Скачиваний:
54
Добавлен:
25.03.2016
Размер:
434.69 Кб
Скачать

Корреляционный анализ Парная корреляция

Цель: Определять связь между содержанием АСТ и АЛТ.

При парной корреляции устанавливают зависимость между двумя признаками, один из которых является факторным, другой  результативным. Связь между ними может иметь различный характер. Поэтому важно правильно установить форму связи между признаками и в соответствии с этим подобрать математическое уравнение, выражающее эту связь.

Вопрос о форме связи можно решить несколькими способами: на основе логического анализа, по данным статистической группировки или графическим способом. При парной корреляции предпочтителен последний способ, так как он позволяет выявить не только характер связи, но дает представление о степени связи.

После того, как определен вид уравнения связи, необходимо найти числовые значения его параметров. При вычислении параметров применяют различные методы: метод наименьших квадратов, метод средних, метод наименьшего предельного уклонения и др. Наиболее распространенным является метод наименьших квадратов. При его использовании находят такие значения параметров уравнения регрессии, при которых сумма квадратов отклонений фактических данных от расчетных является минимальной:

,

где y – фактическое значение результативного признака;

расчетное значение результативного признака.

Показатель, характеризующий отношение вариаций расчетных и исходных значений результативного признака, называют индексом корреляции. Его рассчитывают по формуле:

,

где I – индекс корреляции;

общая дисперсия результативного признака (средний квадрат отклонений фактических значений у от средней );

факторная дисперсия результативного признака, рассчитанного по уравнению регрессии (средний квадрат отклонений расчетных значений от средней);

n – численность совокупности.

Индекс корреляции изменяется в пределах от 0 до 1. Он показывает, что чем ближе его значение к 1, тем сильнее связь между признаками, и тем лучше уравнение регрессии описывает взаимосвязь между признаками. При индексе корреляции равном 1 взаимосвязь между признаками является функциональной. Если же индекс корреляции равен 0, то связь между признаками отсутствует.

Поскольку факторная дисперсия показывает вариацию результативного признака, зависящую от факторного признака, то можно рассчитать остаточную дисперсию, показывающую вариацию других неучтенных факторов. Она равна раз­нице между общей и факторной дисперсиями:

,

где  остаточная дисперсия.

Остаточная дисперсия показывает вариацию фактических значений результативного признака относительно расчетных значений, то есть колеблемость фактических значений относи­тельно линии регрессии. Чем меньше будет эта колеблемость, тем в большей степени уравнение регрессии отражает связь между признаками.

Формула индекса корреляции, рассчитанного на основе остаточной и общей дисперсий, имеет вид:

.

Для линейной регрессии индекс корреляции называют коэффициентом корреляции. Формула его при парной корре­ляции после преобразования имеет вид:

,

где r – коэффициент корреляции;

средние значения факторного и результативного признаков;

среднее значение произведений факторного и результативного признаков;

средние квадратические отклонения факторного и результативного признаков.

В отличие от индекса корреляции коэффициент корреляции показывает не только тесноту связи, но и ее направление, поскольку меняется в пределах от −1 до +1. Если коэффициент корреляции положительный, то связь между призна­ками прямая (прямо пропорциональная), если отрицательный, то связь обратная (обратно пропорциональная).

Квадраты индекса корреляции и коэффициента корреляции называют соответственно индексом детерминации (I2) и коэффициентом детерминации (r2). Индекс детерминации и коэффициент детерминации показывают, какая доля общей вариации результативного признака определяется изучаемым фактором.

Так как надежность изучения связей в значительной степени зависит от количества сопоставляемых данных, необходимо измерять существенность полученного уравнения регрессии и индекса (коэффициента) корреляции. Показатели корреляции, исчисленные для ограниченной по объему совокупности, могут быть искажены действием случайных факторов.

Существенность индекса (коэффициента) корреляции, а, следовательно, всего уравнения регрессии, может быть оценена с помощью дисперсионного анализа (F-критерия Фишера). При этом сравнивают факторную и остаточную дисперсии с учетом числа степеней свободы вариации. F-критерий в данном случае рассчиты­вают по формуле:

,

где  выборочная факторная дисперсия;

выборочная остаточная дисперсия;

n – численность выборочной совокупности;

k – число параметров в уравнении регрессии.

Значение F-критерия можно получить также, используя значения индекса или коэффициента корреляции:

; .

Полученное значение F-критерия сравнивают с табличным значением. При этом для факторной дисперсии число степеней свободы вариации составляет , а для остаточной дисперсииЕсли фактическое значениеF-критерия больше табличного, следовательно, связь между признаками достоверна и уравнение регрессии в полной мере отражает эту связь. Если фактическое значение F-критерия меньше табличного, то можно сделать вывод, что связь между признаками носит случайный характер.

Для оценки значимости индекса (коэффициента) корреляции и уравнения регрессии также используют t-критерий Стьюдента, который для больших выборок рассчитывают по формулам:

Для малых выборок формулы имеют вид:

Также, как при дисперсионном анализе, фактическое значение t-критерия сравнивают с табличным с учетом числа степеней свободы вариации = n k. Если фактическое значение t-критерия больше табличного, то связь достоверна, если меньше, то связь несущественна.

Зависимость содержания АСТ от содержания АЛТ:

Рис. 7 Точечный график

Таблица №10

ВЫВОД ИТОГОВ

Регрессионная статистика

 

Множественный R

0,966483098

R-квадрат

0,934089579

Нормированный R-квадрат

0,931093651

Стандартная ошибка

3,09916035

Наблюдения

24

Дисперсионный анализ

 

df

SS

Регрессия

1

2994,644096

Остаток

22

211,3054873

Итого

23

3205,949583

MS

F

Значимость F

2994,644096

311,7863666

1,76941E-14

9,604794876

 

 

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

23,46217104

3,007052506

7,802381566

155

0,236935697

0,013418437

17,65747339

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

8,91913E-08

17,22592586

29,69841622

17,22592586

29,69841622

1,76941E-14

0,209107562

0,264763832

0,209107562

0,264763832

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]