
- •19. Корреляционный анализ
- •1. Коэффициент корреляции значимо отличается от нуля (т.Е. Есть взаимосвязь между величинами):
- •2. Отличие между двумя коэффициентами корреляции значимо:
- •20.Факторный анализ
- •21.Линейное предсказание речи
- •22. Нормальный закон распределения
- •23. Скос и Эксцесс.
- •Эксцесс
- •24. Статистические функции в ms Excel
19. Корреляционный анализ
Корреляционный анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов (корреляции). Его применение возможно в случае наличия достаточного количества (для конкретного вида коэффициента корреляции) наблюдений из более чем одной переменной. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков, для установления между ними статистических взаимосвязей.
Данный метод обработки статистических данных весьма популярен в социальных науках (в частности впсихологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия и проч.
Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации (принятие гипотезы о наличии корреляции означает что изменение переменной А, произойдет одновременно с изменением значения Б), простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.
Часто, заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи межу парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи.
Иллюстрацией этому служит хорошо известный анекдот: если выйти на улицу и измерить у 1000 случайных прохожих размер обуви и IQ, между ними будет обнаружена статистически значимая корреляция. Однако это не значит, что размер ноги влияет на интеллект, так как на наличие этой взаимосвязи скорее всего повлияли такие факторы, как пол и возраст участников исследования.
Стоит отметить, что в современной количественной методологии социальных наук, фактически произошел отказ от попыток установить причинно-следственные связи между наблюдаемыми переменными эмпирическими методами. Поэтому когда исследователи в социальных науках говорят об установлении взаимосвязей между изучаемыми переменными, то с всеобщего молчаливого согласия, подразумевают либо общетеоретическое допущение, либо статистическую зависимость.
К недостаткам корреляционного анализа относится априорное предположение о линейной зависимости наблюдаемых переменных.
Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.
Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров.
Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве:
Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют.
В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:
Отрицательная корреляция:
|
Отсутствие корреляции:
|
Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи:
|
|
Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:
Есть массив из n точек {x1,i, x2,i}
Рассчитываются средние
значения для каждого параметра:
И коэффициент корреляции:
r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.
Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы: