- •Тема 11. Статистическое изучение корреляционных взаимосвязей
- •Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами
- •Коэффициенты Фехнера и Спирмэна
- •Эмпирическое и теоретическое корреляционное отношение
- •Оценка тесноты связи нелинейной зависимости
- •Множественная корреляция
Тема 11. Статистическое изучение корреляционных взаимосвязей
Основные задачи корреляционно-регрессионного анализа
Выявления наличия (или отсутствия) корреляционной связи между изучаемыми признаками.
Определение формы корреляционной зависимости, то есть вида функции регрессии (линейной, логарифмической, параболической и др.).
Построение уравнения регрессии.
Оценка степени тесноты корреляционной связи.
Понятие корреляционной зависимости
Одна из основных задач статистики -установление и измерение связей между явлениями.
При изучении связей выделяют факторные и результативные признаки.
Факторные- это признаки, оказывающие влияние на изменение результативных признаков.
Результативныепредставляют собой результат влияния факторных признаков.
Связь изучается между вариацией результативного и факторного признаков, а не между их отдельными величинами
Виды взаимосвязей
Функциональная связьхарактеризуется строго определенным изменением значения переменной упри изменении другой переменнойх.
Такие связи обычно встречаются в естественных науках: математике, физике и др.
Частным случаем стохастической или статистической связи является корреляционная связь.
Статистическая зависимостьхарактеризуется изменением распределения одной переменной под влиянием изменения другой.
Например, уровень машины в зависимости от занимаемой должности
Корреляционной связьюназывают важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различныесредние значениядругой. С изменением значения признакахзакономерным образом изменяется среднее значение признакау;в то время как в каждом отдельном случае значение признакау(с различными вероятностями) может принимать множество различных значений.
Например, скорость машины зависит от мощности двигателя
Виды зависимостей между факторным и результативным признаками
1) По направлению связи выделяют прямую и обратную зависимости:
Прямая зависимость- направление изменения результативной переменной совпадает с изменением направления факторной переменной.
Например, общая производительность зависит от тактовой частоты процессора
Обратная зависимость- направление изменения результативной переменной противоположно направлению изменения факторной переменной.
Например, чем выше температура процессора, тем меньше его производительность
2) по количеству факторных признаков выделяют парную и множественную зависимости:
Парная зависимость(однофакторная) - это связь между одной факторной переменной и одной результативной переменной.
Например, чем быстрее бежит спортсмен, тем быстрее он достигнет финиша
Множественная зависимость(многофакторная) - это связь между несколькими факторными переменными и одной (иногда несколькими) результативной переменной.
Например, чем быстрее бежит один спортсмен, чем медленнее бегут остальные по сравнению с ним, тем больше шансов, что он получит медаль.
Выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками производится:
на основе параллельного сопоставления (сравнения)значений хиу;
с помощью группировок;
путем построения и анализа специальных корреляционных таблиц;
графическим способом.
Теснота связи между факторным и результативным признаками колеблется от -1 до +1
Термин «регрессионный анализ» подразумевает всестороннее исследование корреляционных связей, в том числе:
нахождение уравнений регрессии,
определение возможных ошибок параметров уравнений регрессии и показателей тесноты связи,
оценка существенности коэффициента регрессии и уравнения связи.
Простейшей системой корреляционной связи является линейная связь между двумя признаками -парная линейная корреляция.
Практическое значение ее в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных, многофакторных связей. Есть такие системы связей, при изучении которых следует предпочесть парную корреляцию. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связей для выполнения расчетов преобразуются в линейную форму.
Уравнение парной линейной корреляционной связи называется уравнением парной регрессиии имеет вид:у = а + bх,
где у -среднее значение результативного признака при определенном значении факторного признаках; а -свободный член уравнения;b - коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения -вариацияу,приходящаяся на единицу вариациих.
Параллельное рассмотрение коррелирующих значений проводится:
показателем тесноты связи -коэффициентом Фехнера;
ранговым коэффициентом Спирмэна;
группировками;
на основе таблиц сопряженности.