Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
згс .2 КУРС. 4 семестр КР №4.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
2.05 Mб
Скачать

Глава 4. Элементы корреляционного и регрессионного анализа

4.1. Линейная корреляционная зависимость.

Два признака X и Y находятся в корреляционной зависимости, если каждому значению одного из них соответствует некоторое распределение другого. Корреляционная зависимость между признаками X и Y обычно задается с помощью корреляционной таблицы. Корреляционная зависимость между признаками Y и X может быть заменена функциональной, если каждому значению признака X поставить в соответствие условное среднее признака Y, т.е. каждому значению поставить в соответствие величину , где - частота пары ; - частота значения . Если затем точки выровнять по методу наименьших квадратов ( см. ниже ) вдоль некоторой линии, то эта линия называется линией регрессии y на x , а ее уравнение – уравнением регрессии y на x.

Аналогично определяется линия регрессии x на y.

Пусть - двумерная случайная величина. С целью предсказания значений случайной величины Y по фиксированным значениям случайной величины X исследуют зависимость между случайными величинами Y и X . Эта зависимость может быть охарактеризована функцией регрессии Y на X:

,

где - математическое ожидание Y при условии, что случайная величина X приняла определенное значение x. График функции является линией регрессии Y на X . Зная , можно делать прогноз ожидаемых средних значений случайной величины Y по фиксированным значениям случайной величины X. Как правило, при обработке результатов наблюдений распределение случайной величины неизвестно. Поэтому искомую зависимость стараются охарактеризовать какой-нибудь эмпирической формулой.

Для нахождения эмпирической формулы из множества значений случайной величины извлекается выборка объема n. Результаты выборки представляют в виде точек плоскости Oxy. Полученную точечную диаграмму называют корреляционным полем. При этом возможны два случая.

1) Точки на корреляционном поле группируются вокруг некоторой прямой линии. В этом случае по опытным данным подбирают линейную функцию регрессии:

2) Точки корреляционного поля группируются вокруг некоторой кривой , где - функция определенного вида (многочлен, степенная, логарифмическая и т.д.).

Выбрав конкретную эмпирическую формулу для регрессии, подбирают параметры этой формулы методом наименьших квадратов.

Метод наименьших квадратов – это метод статистической оценки функциональной зависимости путем установления таких ее параметров, при которых сумма квадратов отклонений опытных данных от этой зависимости является минимальной.

Наиболее простыми и наиболее важными линиями регрессии являются прямые. Согласно методу наименьших квадратов для определения параметров а и b в случае линейной функции регрессии требуется решить систему уравнений:

.

Для измерения линейной связи между величинами – количественными признаками Y и X, служит также выборочный коэффициент корреляции , который является точечной оценкой коэффициента корреляции генеральной совокупности.

Выборочный коэффициент линейной корреляции при построении линейной регрессионной зависимости Y на X вычисляют по формуле:

Значения коэффициента линейной корреляции принадлежат отрезку . Если коэффициент принимает значение 1 или -1, то между признаками Y и X существует линейная функциональная зависимость. Если же значение коэффициента равно нулю, то между величинами Y и X отсутствует линейная корреляционная зависимость.