Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УчПособие.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
5.34 Mб
Скачать

8.2.2. Точечная оценка корреляционного отношения

При нелинейной связи двух случайных величин Y и Х или при их негауссовом распределении оценка степени их взаимозависимости производится с использованием более общего коэффициента — корреляционного отношения, для которого вводится выражение вида:

Ryx = = (8.25)

Здесь ‑ условная дисперсия; ‑ оценка отклика в задаче регрессии или регрессионное соотношение с подставленными в него значениями найденных в задаче регрессии параметров.

Сопоставляя выражения (8.23) и (8.25), нетрудно заметить сходство выражений для Ryx и . Однако это сходство — только внешнее, поскольку условная дисперсия в (8.25) для случаев негауссового распределения или нелинейной связи Y и Х будет определяться соотношением более сложного вида, чем выражение в (8.23), которое предполагает линейную связь Y и Х (или, соответственно, — вариант простой линейной регрессии).

Свойства Ryx формально аналогичны свойствам коэффициента корреляции , В то же время Ryx и связывают более сложные взаимоотношения, в том числе

1. Неравенство вида 0 1. При Ryx = 0 имеет место независимость, а, следовательно, — и некоррелированность, случайных величин Y и X. Обратное утверждение в общем случае неверно.

2. = = 1 указывает на наличие строгой линейной функциональной зависимости Y от X.

3. При < = 1 имеет место строгая нелинейная функциональная зависимость Y от X.

4. Случай = < 1 соответствует варианту простой линейной регрессии. Строгая функциональная зависимость Y от X отсутствует. Такой вариант будет иметь место при нормальном распределении элементов вектора zT = |Y, Х |.

5. Вариант < < 1, означает, что функциональная зависимость отсутствует, а использование нелинейного регрессионного соотношения (например, Y = сХ2 + aХ + b) даст условную дисперсию, меньшую, чем использование линейного соотношения вида Y = aХ + b.

Типовые картины разброса откликов вокруг кривой регрессии представлены на рис. 8.6. На графиках изображены результаты решения конкретных задач оценки корреляционного отношения для линейной регрессии с зависимостью вида у = 0 + 2х2 + ε.

Ryx = 0,462 Ryx = 0,826

Рис. 8.6. Разброс откликов при различных значениях Ryx

Форма соотношений (8.25) и используемые в них величины свидетельствуют, что выборочное корреляционное отношение может быть найдено после предварительного решения задачи регрессии.

Пусть, как и ранее, исследуется связь случайных величин X и Y, данные наблюдений за которыми объединены в два вектора: Х с элементами хi и Y с элементами yi, i = . Теоретическое значение корреляционного отношения можно найти по одной из формул в (8.25).

Выборочные значения корреляционного отношения, как и других числовых характеристик можно найти, заменив теоретические величины в (8.25) соответствующими выборочными значениями (точечными оценками).

Эти значения определяются следующими алгоритмами:

для : ; ; (8.26)

для : d = S/n = = (еу) Т еу /n; еу = – Y; (8.27)

для : = d. (8.28)

На основании (8.25)-(8.28) точечную оценку корреляционного отношения получим в следующей форме:

= = , (8.29)

где , — корни квадратные из дисперсий и .

Оценку (8.29) назовем выборочным корреляционным отношением. Из выражения (8.29) следует, что имеет свойства, аналогичные рассмотренным выше свойствам теоретического корреляционного отношения. Так, выборочное корреляционное отношение удовлетворяет неравенству: 0 1. На рис. 8.7 приведено решение типовой задачи оценки Ryx.

В примере (см. рис. 8.7) данные наблюдений предварительно генерируются в среде Mathcad. Объем выборок для случайных величин Y и X задан равным 50. Элементами вектора х служат xi = 0,1(i + 0,1εi); вектор у формируется выражением, показанным в первой строке mcd-файла. Вектор помех ε образован независимыми нормально распределенными числами с нулевым средним и дисперсией, которая может варьироваться (для варианта, изображенного на рис. 8.7, дисперсия равна 4).

Задача регрессии решается в форме, рассмотренной на рис. 8.1. Оценка корреляционного отношения, найденная по формулам (8.29), равна 0,617, что свидетельствует о достаточно большом разбросе откликов вокруг кривой регрессии. Это подтверждается графиком.

Для сопоставления с в примере вычислен и выборочный коэффициент корреляции (выделен рамкой). Его значение 0,607 < 0,617, с одной стороны, говорит об отсутствии функциональной зависимости Y от X, а с другой — что использование нелинейного регрессионного соотношения дает остаточную дисперсию d, меньшую, чем при использовании линейного регрессионного соотношения. Последнее легко проверить, решая для тех же исходных данных задачу простой линейной регрессии, для чего в структуре файла (см. рис. 8.7) необходимо исключить из матрицы А третий столбец, т. е. задать A: = augment(a, b); остальные элементы остаются без изменений.

Рис. 8.7. Типовая задача точечной оценки Rxy

Программные структуры, подобные изображенной на рис. 8.7, позволяют путем изменения СКО помех ε, значений параметров регрессии я исследовать влияние этих изменений на точность решения задач регрессии и оценку корреляционного отношения.