
- •Оглавление
- •Часть I
- •Глава 4. Первичные описательные статистики 40
- •Глава 5. Нормальный закон распределения и его
- •Глава 6. Коэффициенты корреляции 64
- •Глава 10. Корреляционный анализ 147
- •Глава 11. Параметрические методы сравнения двух
- •Глава 12. Непараметрические методы сравнения
- •Глава 14. Назначение и классификация многомерных
- •Глава 1
- •Глава I. Генеральная совокупность и выборка
- •Часть I. Основы измерения и количественного описания данных
- •Глава 2 измерения и шкалы
- •Часть I. Основы измерения и количественного описания данных
- •Глава 2. Измерения и шкалы
- •Часть I. Основы измерения и количественного описания данных
- •Глава 2. Измерения и шкалы
- •Часть I. Основы измерения и количественного описания данных
- •Глава 2. Измерения и шкалы
- •Глава 3
- •Глава 3. Таблицы и графики Та блица 3.1 х3,-— самооценка до тренинга (порядковый),
- •Часть I. Основы измерения и количественного описания данных
- •Часть I. Основы измерения и количественного описания данных
- •Часть I. Основы измерения и количественного описания данных
- •Глава 3. Таблицы и графики
- •Часть I. Основы измерения и количественного описания данных
- •Глава 3. Таблицы и графики
- •Глава 4
- •Глава 4. Первичные описательные статистики
- •Часть I. Основы измерения и количественного описания данных
- •Глава 4. Первичные описательные статистики
- •Часть I. Основы измерения и количественного описания данных
- •Глава 4. Первичные описательные статистики
- •Часть I. Основы измерения и количественного описания данных
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Часть I. Основы измерения и количественного описания данных
- •Глава 5. Нормальный закон распределения и его применение
- •Глава 6
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
- •Часть I. Основы измерения и количественного описания данных
- •Глава 6. Коэффициенты корреляции
- •Часть I. Основы измерения и количественного описания данных
Часть I. Основы измерения и количественного описания данных
Часто такая «чистка» совершенно необходима. Например, при исследовании времени реакции, когда основная масса наблюдений находится в диапазоне 250-700 мс, исключение нескольких «странных» значений меньше 50 мс и больше 1000 мс может существенно изменить общую картину.
По сути, наличие выбросов означает отклонение распределений одной или обеих переменных от нормального вида. В общем случае, если распределения переменных сильно скошены (асимметричны), это может существенно снижать значение корреляции даже при сильной связи между соответствующими свойствами или, наоборот, обусловить появление «ложной» корреляции. Особенно сильно асимметричность распределений влияет на г-Пирсона. Поэтому при существенном отклонении формы распределения хотя бы одной переменной от нормального вида желательно перейти к рангам и воспользоваться ранговым коэффициентом корреляции.
Влияние «третьей» переменной
Иногда корреляция между двумя переменными обусловлена не связью между соответствующими свойствами, а влиянием некоторой общей причины совместной изменчивости этих переменных, которая зачастую выпадает из поля зрения исследователя. Эта общая причина может быть измерена как некоторая «третья» переменная, представленная либо в номинативной шкале, либо в количественной (ранговой или метрической) шкале.
Если истинная причина корреляции представляет собой номинативную переменную, то это проявляется в характерной неоднородности выборки: в ней можно обнаружить различные группы, для которых согласованно меняются средние двух переменных, в то время как внутри групп эти переменные не коррелируют. Если подобное явление возможно и существует способ содержательно интерпретируемого деления выборки на группы, необходимо вычислить корреляцию не только для всей выборки, но и для каждой группы в отдельности.
ПРИМЕР
Если мы возьмем достаточно большую группу людей — мужчин и женщин, то обнаружим существенную отрицательную корреляцию роста и длины волос: чем больше рост, тем короче волосы. Однако, рассматривая график рассеивания роста и длины волос с выделением групп мужчин и женщин, мы обнаружим истинную причину этой корреляции — пол (рис. 6.6). Корреляции роста и длины волос отдельно для мужчин и отдельно для женщин будут близки к нулю.
Другой случай «ложной» корреляции — когда «третья» переменная может быть представлена в числовой шкале.
ПРИМЕР
Число церквей и количество увеселительных заведений в городах, как известно, сильно коррелируют, так же, впрочем, как рост и навык чтения у детей. Нетрудно
86
Рис. 6.6. График рассеивания для роста и длины волос. Темные точки — мужчины, светлые треугольники — женщины
догадаться, что в первом случае «третьей» переменной является численность городского населения, а во втором — возраст детей. (См. также пример 6.3 из раздела «Частная корреляция».)
Если истинная причина корреляции между двумя переменными Хп YИзмерена как количественная переменная Z, то предположение о том, что именно она является причиной корреляции, можно проверить, вычислив частную корреляцию rxy_z по формуле 6.5. Если частная корреляция Хп Ус учетом Z (rxy-z) существенно меньше г^, то весьма вероятно, что именно Zявляeтcя истинной причиной корреляции Хп Y.
Следует отметить, что за редким исключением факт наличия или отсутствия корреляции может быть объяснен влиянием некоторой «третьей» переменной, упущенной из поля зрения исследователя. Таким образом, всегда остается возможность альтернативной интерпретации обнаруженной корреляции.
\
Нелинейные связи
Еще одним источником низкой эффективности корреляций являются возможный нелинейный характер связи между переменными. То, какой характер имеет связь между переменными, можно заметить, рассматривая график двумерного рассеивания. Это свидетельствует о важности визуального анализа связи с помощью таких графиков во всех случаях применения корреляций.
К отклонениям от прямолинейной зависимости любого рода наиболее чувствителен коэффициент корреляции r-Пирсона. Однако если нелинейная
87