Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 4-Корреляция-1.doc
Скачиваний:
3
Добавлен:
08.09.2019
Размер:
361.47 Кб
Скачать

4.2. Назначение корреляции

Для вычисления корреляций между данными в программе SPSS используются команды подменю Correlate (Корреляция) меню Analyze (Анализ). Корреляция представляет собой величину, заключенную в пределах от -1 до +1, и обозначается буквой r. Понятия корреляция и двумерная корреляция часто употребляются как синонимы; последнее означает «корреляция между двумя переменными» и подчеркивает, что рассматривается именно двухмерное соотношение. Основной коэффициент корреляции r Пирсона предназначен для оценки связи между двумя переменными, измеренными в метрической шкале, распределение которых соответствует нормальному. Несмотря на то что величина r рассчитывается в предположении, что значения обеих переменных распределены но нормальному закону, формула для ее вычисления дает достаточно точные результаты и в случаях аномальных распределений, а также в случаях, когда одна из переменных является дискретной. Для распределений, не являющихся нормальными, предпочтительнее пользоваться ранговыми коэффициентами корреляции Спирмена или Кендалла. Команды подменю Correlate (Корреляция) позволяют вычислить как коэффициент Пирсона (Pearson), так и коэффициенты Спирмена (Spearman) и Кендалла (Kendall's tau-b). Существуют и другие коэффициенты корреляции, применяющиеся для самых разных типов данных, однако их описание выходит за рамки темы этой книги..

Применяют корреляционный анализ в тех случаях, когда нас интересует не предсказание значений одной переменной по значениям другой, а просто характеристика тесноты (силы) связи между ними.

Корреляционные связи могут использоваться в качестве вспомогательных, а также как основные. Например, при построении статистической модели с влияющими параметрами можно использовать математический аппарат, если переменные влияют на результат, а между собой они в свою очередь независимы, т.е. нет корреляции между ними. Здесь строят вспомогательные корреляционные связи.

В качестве основного корреляционный анализ применяют при анализе влияния факторов на результирующую переменную.

4.3. Корреляция Пирсона

4.3.1. Назначение коэффициента корреляции Пирсона

Коэффициент корреляции Пирсона является индикатором линейной связи между парными переменными. Его значение, близкое к +1 или к -1, говорит о сильной прямой или обратной корреляции. В этом случае на графике, парные значения представлены как координаты Х и У и все точки группируются около некоторой прямой. Значение, близкое к 0, указывает на отсутствие линейной связи, но не исключает возможность нелинейной связи между переменными. Поэтому важно исследовать коэффициент корреляции совместно с функциональным графиком.

Кроме того, высокая корреляция не обязательно означает наличие причинной связи между переменными, поскольку, например, обе они могут зависеть от третьей переменной.

Применяемый математический аппарат предполагает, что переменная Х и переменная У имеют законы распределения, не противоречащие нормальному. Чтобы уйти от этого предположения, используют корреляции Спирмена и Кендела, которые заменяют исходные данные на ранги.

Поэтому при проверке гипотез о корреляциях необходима проверка на нормальность. А прежде чем делать вывод о корреляции необходимо оценить:

  • наличие выбросов;

  • необходимость линеаризующего преобразования данных;

  • наличие переменных замаскировывающих связь или, наоборот, усилить ее.

Последнее обнаруживается при вычислениях частной корреляции.