Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 4-Корреляция-1.doc
Скачиваний:
3
Добавлен:
08.09.2019
Размер:
361.47 Кб
Скачать

15

Лекция 4. Оценки связи между переменными 4-

Лекция4. Оценки связи между переменными

Содержание

4.1. Понятие корреляции 1

4.2. Назначение корреляции 2

4.3. Корреляция Пирсона 2

4.3.1. Назначение коэффициента корреляции Пирсона 2

4.3.2.Формулы 3

4.3.3. Вызов процедуры 3

4.3.4. Установка параметров 3

4.3.5. Анализ корреляции Пирсона 4

4.4.1. Назначение корреляции Спирмена 4

4.4.2. Вызов процедуры 4

4.4.3. Установка параметров 4

4.4.4. Результаты расчета коэффициента Спирмена 5

4.5. Корреляция Кенделла 5

4.5.1. Назначение корреляции Кенделла 5

Корреляция Кенделла – это непараметрический метод и все вышесказанное к корреляции Спирмена относится и к нему. Но в отличие от ранговой корреляции Спирмена он может быть обобщен для случая нескольких независимых переменных. Численные значения коэффициентов Кенделла и Спирмена не совпадают, но заключения о корреляции одинаковы. 5

4.5.2. Вызов процедуры 5

4.5.3. Установка параметров 5

4.5.4. Результаты расчета коэффициентов Кенделла 5

4.6. ЧАСТНАЯ КОРРЕЛЯЦИЯ 5

4.6.1. Назначение частной корреляции 5

4.6.2. Вызов процедуры 5

4.6.3. Установка параметров частной корреляции 5

4.6.4. Результаты частной корреляции 6

4.7. Применение таблиц сопряженности (crosstabs) 6

4.7.1. Назначение 6

4.7.2. Представление результатов 6

4.7.3. Вызов процедуры 7

4.7.4. Задание параметров 7

4.7.5. Анализ результатов 10

Рис.4-13. Вид результатов расчета 10

4.8. Использование отношения шансов 10

4.8.1. Назначение отношения шансов 10

4.8.2. Область применения относительного риска 11

4.8.3. Область применения отношения шансов 11

4.8.4. Вызов процедуры 11

4.8.5. Заполнение параметров 11

Рис.4-16. Диалоговое окно выбора мер связи 12

4.8.6. Анализ результатов вычислений 12

Оценка темпа роста промыш. * INV_GR03 Crosstabulation 12

Низкие 12

Chi-Square Tests 13

Рис.4-19. Таблица хиквадрат 13

Risk Estimate 13

4.9. Другие меры для таблиц 2х2 13

4.9.1. Мера согласия каппа для таблицы RxR 13

4.9.1.1. Назначение меры согласия каппа 13

4.9.2. Меры связи для таблиц RxC с ранжированными переменными 14

4.9.2.1. Назначение 14

4.9.2.2. Меры, основанные на корреляции 14

4.9.2.3. Меры, основанные на согласующихся парах наблюдений 15

4.9.3. Двумерная таблица с зависимой и независимой переменными 15

4.9.3.1. Назначение двумерной таблицы с зависимой и независимой переменными 15

4.1. Понятие корреляции

Корреляция, или коэффициент корреляции, — это статистический показатель вероятностной связи между двумя переменными, измеренными в количественной шкале. В отличие от функциональной связи, при которой каждому значению одной переменной соответствует строго определенное значение другой переменной, вероятностная связь характеризуется тем, что каждому значению одной переменной соответствует множество значений другой переменной. Примером вероятностной связи является связь между ростом и весом людей. Ясно, что один и тот же рост может быть у людей разного веса, как и наоборот. Величина коэффициента корреляции меняется от -1 до 1. Крайние значения соответствуют линейной функциональной связи между двумя переменными, 0 — отсутствию связи.

Наглядное представление о связи двух переменных дает график двухмерного рассеивания — соответствующая команда Scatter (Рассеивание) имеется в меню Graphs (Графики). На таком графике каждый объект представляет собой точку, координаты которой заданы значениями двух переменных. Таким образом, множество объектов представляет собой на графике множество точек. По конфигурации этого множества точек можно судить о характере связи между двумя переменными.

Строгая положительная корреляция (perfect positive correlation) определяется значением r = 1. Термин «строгая» означает, что значения одной переменной однозначно определяются значениями другой переменной, а термин «положительная» — что с возрастанием значений одной переменной значения другой переменной также возрастают.

Строгая корреляция является математической абстракцией и практически не встречается в реальных исследованиях. Примером строгой корреляции является соответствие между временем пути и пройденным расстоянием при неизменной скорости.

Положительная корреляция соответствует значениям 0 < r < 1. Положительную корреляцию следует интерпретировать следующим образом: если значения одной переменной возрастают, то значения другой имеют тенденцию к возрастанию. Чем коэффициент корреляции ближе к 1, тем сильнее эта тенденция, и обратно, с приближением коэффициента корреляции к 0 тенденция ослабевает.

Примером значительной положительной корреляции служит зависимость между ростом и весом человека. Считается, что в этом случае коэффициент корреляции равен r = 0,83. Слабая положительная корреляция (r = 0,12) наблюдается между способностью человека к сочувствию и реальной помощью, которую он оказывает нуждающимся людям.

Отсутствие корреляции (no correlation) определяется значением r = 0. Нулевой коэффициент корреляции говорит о том, что значения переменных никак не связаны друг с другом. Примером пары величии с нулевой корреляцией является рост человека и результат его IQ-теста.

Отрицательная корреляция соответствует значениям -1 < r < 0. Если значения одной переменной возрастают, то значения другой имеют тенденцию к убыванию. Чем коэффициент корреляции ближе к -1, тем сильнее эта тенденция, и обратно, с приближением коэффициента корреляции к 0 тенденция ослабевает.

Слабая отрицательная корреляция (r = -0,13) наблюдается между агрессивностью человека но отношению к своему другу и помощью, которую он ему оказывает. Чем агрессивней человек, тем помощь меньше, однако зависимость выражена слабо. Примером значительной отрицательной корреляции (r = -0,73) служит зависимость между нервной возбудимостью человека и его эмоциональной уравновешенностью. Чем выше оказывается результат его теста на возбудимость, тем более низкий результат имеет его тест на уравновешенность.