Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
nasledov_gl.1-6.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.7 Mб
Скачать

Часть I. Основы измерения и количественного описания данных

Сумма произведений отклонений дает нам значение числителя, а произведение стандартных отклонений и (./V— 1) — значение знаменателя формулы коэффици­ента корреляции:

- - 25'6 - = 0,517.

" 1,735 1,501 19

Если значения той и другой переменной были преобразованы в г-значения по формуле:

то формула коэффициента корреляции r-Пирсона выглядит проще:

N

39 N-l '

Отметим еще раз: на величину коэффициента корреляции не влияет то, в каких единицах измерения представлены признаки. Следовательно, любые линейные преобразования признаков (умножение на константу, прибавление кон­станты: у; = хр + а) не меняют значения коэффициента корреляции. Исключе­нием является умножение одного из признаков на отрицательную константу: коэффициент корреляции меняет свой знак на противоположный.

На рис. 6.2 приведены примеры диаграмм рассеивания для различных зна­чений коэффициента корреляции. Обратите внимание: на последнем рисун­ке визуально наблюдается нелинейная взаимосвязь между переменными, од­нако коэффициент корреляции равен нулю. Таким образом, коэффициент корреляции Пирсона есть мера прямолинейной взаимосвязи; он не чувствителен к криволинейным связям.

КОРРЕЛЯЦИЯ, РЕГРЕССИЯ И КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ

Корреляция Пирсона есть мера линейной связи между двумя переменны­ми. Она позволяет определить, насколько пропорциональна изменчивость двух переменных. Если переменные пропорциональны друг другу, то графи­чески связь между ними можно представить в виде прямой линии с положи­тельным (прямая пропорция) или отрицательным (обратная пропорция) на­клоном. Кроме того, если известна пропорция между переменными, заданная уравнением графика прямой линии:

72

Глава 6. Коэффициенты корреляции

то по известным значениям переменной ЛГможно точно предсказать значения переменной Y.

На практике связь между двумя переменными, если она есть, является ве­роятностной и графически выглядит как облако рассеивания эллипсоидной формы. Этот эллипсоид, однако, можно представить (аппроксимировать) в виде прямой линии, или линии регрессии. Линия регрессии (Regression Line) — это прямая, построенная методом наименьших квадратов: сумма квадратов расстояний (вычисленных по оси У) от каждой точки графика рассеивания до прямой является минимальной:

где у, — истинное /-значение Y, у, — оценка /-значения Кпри помощи линии (уравнения) регрессии, е, = .у,— ytошибка оценки (см. рис. 6.4). Уравнение регрессии имеет вид:

у-, = bXj+а, (6.2)

где b коэффициент регрессии (Regression Coefficient), задающий угол наклона прямой; а — свободный член, определяющий точку пересечения прямой оси Y. Если известны средние, стандартные отклонения и корреляция гху, то сум­ма квадратов ошибок минимальна, если:

о

b = r —^-,а = М„—ЬМг (f, i.\

у *. (6.3)

Таким образом, если на некоторой выборке измерены две переменные, которые коррелируют друг с другом, то, вычислив коэффициенты регрессии,

Рис. 6.4. Диаграмма рассеивания и линия регрессии (е,- — ошибка оценки для одного из

объектов)

73

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]