Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев О.Ю. Математическая статистика.doc
Скачиваний:
369
Добавлен:
13.08.2019
Размер:
23.04 Mб
Скачать

11.9. Корреляционное отношение Пирсона η

Все рассмотренные выше коэффициенты корреляции служат для выявления только линейной зависимости между признаками. Для измерения нелинейной зависимости К. Пирсон предложил по­казатель, который он назвал корреляционным отношением. На­помним, что коэффициент корреляции rxy. (формула 11.1), который был введен Пирсоном, характеризует связь между переменными X и У с точки зрения прямой или обратной пропорциональности, иными словами, получаемая связь между переменными является согласованной и такой, что с увеличением одной переменной дру­гая (в среднем) либо только увеличивается, либо только уменьша­ется (в среднем). При этом в первом случае получается положитель­ный коэффициент корреляции, во втором отрицательный.

Корреляционное отношение описывает искомую связь, ус­ловно говоря, с двух сторон: со стороны переменной X по отно­шению к К, и со стороны переменной Y по отношению к X. Со­ответственно этому корреляционное отношение представляет со-

239

бой два показателя, обозначаемые как hyx и hxy* Они вычисляются отдельно друг от друга. Однако они связаны между собой, по­скольку при строго линейной зависимости между переменными X и Y имеет место равенство hyx = hxy В этом случае величины обо­их показателей корреляционного отношения совпадают с вели­чиной коэффициента корреляции Пирсона.

Показатели корреляционного отношения вычисляются по следующим двум формулам:

(11.18)

(11.19)

здесь х и у общие, a xy и ухгрупповые средние арифметические, fy и fx частоты рядов X и Y. Согласно этим формулам оба показате­ля всегда положительны и располагаются в интервале от 0 до +1.

Подчеркнем, что, как правило, hyx hxy. Равенство между эти­ми коэффициентами возможно лишь при наличии строго линей­ной связи между коррелируемыми переменными. Именно поэто­му различие между hyx и hxy будет означать наличие не линейной, а связи более сложного'типа между коррелируемыми признаками.

Для вычисления корреляционного соотношения hуx (Yno X) или hxy. (X по Y) необходимо выполнить следующие действия:

1) расположить по порядку исходные данные по X от мень-

шей величины к большей, при этом сохранив значения соответствующих величин Y пo отношению к X;

2) определить частоты переменной Xобозначение/(;

3) подсчитать арифметические (частные) средние по перемен-

ной Y для соответствующей частоты fx — обозначение ух;

4) найти варианты (неповторяющиеся значения) величины Xобозначение хi;

5) расположить по порядку исходные данные по Y от мень-

шей величины к большей, при этом сохранив значения соответствующих величин X по отношению к Y;

240

6) определить частоты переменной Yобозначение fy;

7) подсчитать арифметические (частные) средние по пере­менной X для соответствующей частоты fy — обозначение xy;

8) найти варианты (неповторяющиеся значения) перемен­ной Yобозначение уx ;

9) определить общие средние по переменной X и Y обозна­чение x и у ;

10) произвести расчет по формулам (11.18) и (11.19);

11) определить уровень значимости полученных показателей корреляционного отношения по таблице критических зна-i чений для t-критерия Стьюдента при k = п - 2.

На конкретном примере рассмотрим, как производить расчет показателей корреляционного отношения.

Задача 11.9. Психолог у 8 подростков сравнивает баллы по третьему, математическому, субтесту теста Векс-лера (переменная X) и оценки по алгебре (пере­менная Y). Интересующие психолога вопросы можно сформулировать двояко. Первый вопрос -связана ли успешность решения третьего субтес­та Векслера с оценками по алгебре? И второй -связаны ли оценки по алгебре с успешностью решения третьего субтеста Векслера?

Решение. Представим экспериментальные данные в следу­ющем виде:

Значения X 8 18 18 10 16 10 8 14

Значения Y 2 3 4 5 4 4 3 5

Если мы подсчитаем коэффициент линейной корреляции Пирсона по формуле (11.1) то получим величину rxy = 0,244. Этот коэффициент незначим и, следовательно, линейной связи между переменными Х и Y нет. Нужно выяснить — существует ли между двумя вышеприведенными переменными другой тип связи?

Произведем расчет согласно пунктам 1 — 11.

1. Расставим по порядку величины X от меньшей к наибольшей, сохраняя их соответствие с исходными данными по У:

241

Значения X 8 8 10 10 14 16 18 18

Значения Y 2 3 4 5 5 4 3 4

2. Определяем частоты переменной X (обозначаемые как fx) и со­ответствующие им неповторяющиеся значения переменной X (обозначающиеся как х). Частоты вычисляются по правилу, изложенному в главе 3, раздел 3.2. Согласно этому правилу, если какая-либо переменная величина встречается в анализи­руемом ряду один, два, три и большее число раз, то этой ве­личине проставляется частота, равная соответственно одно­му, двум, трем и большим значениям. Так, в нашем случае число 8 встречается два раза — следовательно его частота рав­на 2, число 10, также два раза, следовательно его частота так­же равна 2.

Частоты переменной X fx 2 2 1 I 2

Неповторяющиеся значения переменной X х 8 10 14 16 18

Проверим правильность подсчета частот — их сумма должна равняться числу варьирующих величин переменной X.

3. Подсчитываем арифметические частные средние для перемен­ной Y по отношению к переменной X. Для этого одинаковым значениям вставим в соответствие их среднее арифметичес­кое по К следующим образом: в исходных данных двум значе­ниям 8 и 8 по X соответствовали величины 2 и 3 по Yсле­довательно, одному значению X (равному 8) — будет соответствовать частное среднее поY равное (2 + 3):2 = 2,5 . Значению 10 по

Соответствие между числами 14 и 5 и 16 и

4 остается неизменным. Значению 18 по X ставим - (3 + 4):2=3,5

Таким образом построено новое распределение, где fx— час­тота для переменной X. Расположим полученные величины в следующем виде:

Частоты по X fx 2 2 1 I

Значения X без повторов хi 8 10 14 16 18

Частные средние по Y yx 2,5 4,5 5 4 3,5

242

4. Расположим по возрастающей экспериментальные данные по Y:

Значения Y 2 3 3 4 4 4 5 5

Значения X 8 8 18 10 16 18 10 14

5. Подсчитаем соответствующие частоты:

Частоты переменной Y fy 1 2 3 2

Неповторяющиеся значения Y уi 2 3 4 5

Проверка правильности подсчета частот:

6. Подсчитаем соответствующие частные средние по X:

Расположим полученные величины в следующем виде:

Частоты по Y fy1232

Значения Y без повторов уi 2 3 4 5

Частные средние по X xy 8 13 14,7 12

7. Теперь подсчитаем общие средние.

- общее сред­нее по X.

- общее среднее по Y.

8. Все готово для расчета по формулам (11.18) и (11.19)

243

Подсчитаем теперь

В результате получено два неравных показателя корреляцион­ного отношения. Для проверки их значимости следует применить формулу (11.9) для k = п - 2.

Проверим на уровень значимости первый показатель.

По таблице 16 Приложения 1 для k = n - 2 = 8-2 = 6 находим:

Строим соответствующую «ось значимости»:

Можно сделать вывод о том, что полученный показатель зна­чим. Принимается гипотеза H1.

Подсчитываем уровень значимости второго показателя:

Поскольку критические значения уже найдены выше, стро­им соответствующую «ось значимости»:

244

Следовательно, полученный показатель незначим. Принима­ется гипотеза H0.

Таким образом можно сделать вывод о том, что в данном случае есть значимое влияние Y на X, а обратное влияние X на У незначимо. Следовательно, решение искомой задачи может зву­чать так: хорошее знание алгебры влияет на эффективность ра­боты с третьим субтестом Векслера, и, напротив, успешное ре­шение третьего субтеста Векслера никак не сказывается на овла­дении учащимися алгеброй.

Разумеется, корреляционное отношение Пирсона не дает возможности установить характер выявленной зависимости — она может быть параболической, кубической, логарифмической и др. Из результатов анализа ясно только одно: связь между пе­ременными Х и Уносит нелинейный характер. Более точно ха­рактер связи можно определить с помощью метода регрессион­ного анализа.

К сожалению, в психологии метод корреляционного отно­шения не нашел широкого распространения. Многие исследо­вания, использующие корреляционный анализ, ограничива­лись нахождением только линейной зависимости между пере­менными, хотя нельзя исключить вероятность того, что реаль­ные связи были нелинейными. Напомним, что в нашем приме­ре коэффициент корреляции Пирсона, подсчитанный по фор­муле (11.1) r = 0,243 оказался незначимым. Однако, как это было установлено с помощью метода корреляционного отноше­ния, связь, с одной стороны, действительно была незначимой, а с другой, напротив, высокозначимой.

Для применения корреляционного отношения Пирсона необхо­димо соблюдать следующие условия:

245

1. Сравниваемые переменные должны быть измерены в шкале интервалов или отношений.

2. Предполагается, что обе переменные имеют нормальный закон распределения.

3. Число варьирующих признаков в сравниваемых переменных X

и Y должно быть одинаковым.

4. Для оценки уровня достоверности корреляционного отношения

Пирсона следует пользоваться формулой (11.9) и таблицей критических значений для t-критерия Стьюдента при k = п - 2.