
- •Тема 11. Статистическое изучение корреляционных взаимосвязей
- •Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами
- •Коэффициенты Фехнера и Спирмэна
- •Эмпирическое и теоретическое корреляционное отношение
- •Оценка тесноты связи нелинейной зависимости
- •Множественная корреляция
Тема 11. Статистическое изучение корреляционных взаимосвязей
Основные задачи корреляционно-регрессионного анализа
Выявления наличия (или отсутствия) корреляционной связи между изучаемыми признаками.
Определение формы корреляционной зависимости, то есть вида функции регрессии (линейной, логарифмической, параболической и др.).
Построение уравнения регрессии.
Оценка степени тесноты корреляционной связи.
Понятие корреляционной зависимости
Одна из основных задач статистики -установление и измерение связей между явлениями.
При изучении связей выделяют факторные и результативные признаки.
Факторные - это признаки, оказывающие влияние на изменение результативных признаков.
Результативные представляют собой результат влияния факторных признаков.
Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами
Виды взаимосвязей
Функциональная связь характеризуется строго определенным изменением значения переменной у при изменении другой переменной х.
Такие связи обычно встречаются в естественных науках: математике, физике и др.
Частным случаем стохастической или статистической связи является корреляционная связь.
Статистическая зависимость характеризуется изменением распределения одной переменной под влиянием изменения другой.
Например, уровень машины в зависимости от занимаемой должности
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.
Например, скорость машины зависит от мощности двигателя
Виды зависимостей между факторным и результативным признаками
1) По направлению связи выделяют прямую и обратную зависимости:
Прямая зависимость - направление изменения результативной переменной совпадает с изменением направления факторной переменной.
Например, общая производительность зависит от тактовой частоты процессора
Обратная зависимость - направление изменения результативной переменной противоположно направлению изменения факторной переменной.
Например, чем выше температура процессора, тем меньше его производительность
2) по количеству факторных признаков выделяют парную и множественную зависимости:
Парная зависимость (однофакторная) - это связь между одной факторной переменной и одной результативной переменной.
Например, чем быстрее бежит спортсмен, тем быстрее он достигнет финиша
Множественная зависимость (многофакторная) - это связь между несколькими факторными переменными и одной (иногда несколькими) результативной переменной.
Например, чем быстрее бежит один спортсмен, чем медленнее бегут остальные по сравнению с ним, тем больше шансов, что он получит медаль.
Выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками производится:
на основе параллельного сопоставления (сравнения)значений х и у;
с помощью группировок;
путем построения и анализа специальных корреляционных таблиц;
графическим способом.
Теснота связи между факторным и результативным признаками колеблется от -1 до +1
Термин «регрессионный анализ» подразумевает всестороннее исследование корреляционных связей, в том числе:
нахождение уравнений регрессии,
определение возможных ошибок параметров уравнений регрессии и показателей тесноты связи,
оценка существенности коэффициента регрессии и уравнения связи.
Простейшей системой корреляционной связи является линейная связь между двумя признаками - парная линейная корреляция.
Практическое значение ее в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных, многофакторных связей. Есть такие системы связей, при изучении которых следует предпочесть парную корреляцию. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связей для выполнения расчетов преобразуются в линейную форму.
Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид: у = а + bх,
где у - среднее значение результативного признака при определенном значении факторного признака х; а - свободный член уравнения; b - коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения - вариация у, приходящаяся на единицу вариации х.
Параллельное рассмотрение коррелирующих значений проводится:
показателем тесноты связи -коэффициентом Фехнера;
ранговым коэффициентом Спирмэна;
группировками;
на основе таблиц сопряженности.