
- •8.4.2.1 Корреляцонный эллипс как числовая характеристика
- •Глава 7. Обработка совместных измерений двух величин
- •7.1. Задачи совместной обработки двух величин
- •7.2. Линейная корреляция
- •7.2.1. Характеристики корреляции и их оценки
- •7.2.1.1 Свойства коэффициента корреляции
- •7.2.I.2. Геометрический смысл коэффициента корреляции
- •7.2.1.З. Назначение коэффициента корреляции
- •7.2.I.4. Оценка значимости коэффициента корреляции
- •7.2.I.5. Оценка равенства двух коэффициентов корреляции
- •7.2.2. Установление линейной корреляции, регрессии
- •7.2.3. Оценка нелинейной статистической связанности
- •7.2.3.1. Корреляционное отношение
- •7.2.3.2. Свойства корреляционного отношения
- •7.2.3.3. Критерий линейности
- •7.2.4.1. Подбор эмпирической кривой
- •7.2.4.2. Определение параметров кривой
- •7.2.4.3. Ортогональные полиномы Чебышева
- •7.2.4.4. Построение ортогональной системы полиномов
- •7.2.4.5. Аппроксимация ортогональными полиномами Чебышева
- •7.1. Основы корреляционного анализа.
- •7.1.1. Определение формы связи. Понятие регрессии.
- •7.1.2. Оценка тесноты связи.
- •7.1.3. Выборочный коэффициент корреляции и его свойства.
- •7.1.4. Частный коэффициент корреляции.
- •7.1.5. Совокупный коэффициент корреляции.
7.1. Основы корреляционного анализа.
Зависимость между одной случайной переменной и условным средним значением другой случайной переменной называется корреляционной зависимостью. Корреляционная зависимость широко применяется при выявлении связи в исследовательской работе. Она характеризуется формой и теснотой связи
Вопрос о том, что принять за зависимую переменную, а что за независимую, решают применительно к каждому конкретному случаю..
7.1.1. Определение формы связи. Понятие регрессии.
При изучении статистических зависимостей, форму связи можно характеризовать функцией регрессии (линейной, квадратной, показательной и т. д.).
Условное математическое ожидание M(Y/X=x) случайной переменной Y, рассматриваемое как функция x, т. е. y=M(Y/X=x) = f(x), называется функцией регрессии случайной переменной Y относительно X (или функцией регрессии Y по X). Точно так же условное математическое ожидание M(X/Y=y) случайной переменной X, т. е. M(X/Y=y) = f(y), называется функцией регрессии случайной переменной X относительно Y (или функцией регрессии X по Y).
Функции регрессии выражают математическое ожидание переменной Y (или X) для случая, когда другая переменная принимает определённое числовое значение, или, иначе говоря, функция M(Y/X=x) показывает, каково будет в среднем значение случайной переменной Y, если переменная X принимает значение x. Все сказанное справедливо и для функции M(X/Y=y).
Функция регрессии имеет большое значение при статистическом анализе зависимостей между переменными и может быть использована для прогнозирования одной из случайных переменных, если известно значение другой случайной переменной. Точность такого прогноза определяется дисперсией условного распределения
2(Y/X=x) = M[(Y/X=x) - M(Y/X=x)]2 = M(Y2/x=x) - [M(y/x=x)]2 (7.1.1)
Для оценки функции регрессии необходимо знать аналитический вид двумерного распределения (X, Y). Для подобной оценки мы чаще всего располагаем лишь выборкой ограниченного объема, по которой нужно найти вид двумерного распределения (X, Y), а затем вид функции регрессии. Это может привести к значительным ошибкам, так как одну и ту же совокупность точек (xi, yi) на плоскости можно одинаково успешно описать с помощью различных функций.
Для характеристики формы связи при изучении корреляционной зависимости пользуются понятием кривой регрессии. Кривой регрессии Y по X называется условное среднее значение средней переменной Y, рассматриваемой как функция от x, т. е.
Yср(x) = f(x) (7.1.2)
В теории корреляции важное место занимает двумерный нормальный закон распределения случайных переменных (X, Y). При нормальном распределении условные математические ожидания M(Y/X=x) и M(X/Y=y) совпадают с условными средними значениями M(Y/X=x) = yср(x) и M(X/Y=y)=xср(y), что следует из свойств нормального закона распределения. Поэтому кривая регрессии совпадает с функцией регрессии, и, следовательно, средняя погрешность прогноза по уравнению регрессии уменьшается.
7.1.2. Оценка тесноты связи.
При изучении корреляционных зависимостей возникает необходимость в измерении тесноты связи. Тесноту связи удобно оценивать в единицах общей дисперсии. Эта величина называется теоретическим корреляционным отношением.
Перед тем как начать исследование формы связи, когда вид зависимости еще не установлен, а коэффициенты регрессии не вычислены, необходимо убедиться в наличии какой бы то ни было связи между переменными. Ибо может оказаться, что связь не существенна и вычисление коэффициентов регрессии не оправдано и проведено в пустую. Для обнаружения связи вычисляется эмпирическое корреляционное отношение.
В отличие от теоретического корреляционного отношения, при выводе формулы эмпирического отношения пользуются эмпирической линией регрессии и оценками дисперсии s2.
Эмпирическое корреляционное отношение систематически завышает тесноту связи и тем сильнее, чем меньше число наблюдений. Поэтому эмпирическое корреляционное отношение рекомендуется использовать для предварительной оценки тесноты связи, для окончательной же оценки используется теоретическое корреляционное отношение.