Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Mat3_all.doc
Скачиваний:
0
Добавлен:
01.01.2020
Размер:
1.93 Mб
Скачать

5.7. Корреляционный момент. Коэффициент корреляции.

Определение: Корреляционным моментом случайных величин X и Y называют математическое ожидание от произведения отклонения данных случайных величин:

.

Эту формулу можно переписать следующим образом:

.

Для вычисления корреляционного момента ДСВ используется следующая формула:

.

Для непрерывной случайной величины корреляционный момент будет равен:

.

Корреляционный момент служит для характеристики связи между случайными величинами X и Y.

Теорема 1: Корреляционный момент двух независимых случайных величин X и Y равен 0 (нулю).

Доказательство: Пусть случайные величины независимы. Вычислим их корреляционный момент в соответствии с определением:

.

По свойству математического ожидания независимых случайных величин:

.

Теорема доказана.

Следствие: Если корреляционный момент (не равен нулю), то случайные величины X и Y зависимые.

Определение: Коэффициентом корреляции случайных величин X и Y называется отношение корреляционного момента к произведению средних квадратических отклонений случайных величин X и Y,

.

Из определения следует, что коэффициент корреляции для независимых случайных величин равен нулю.

Теорема 2: Модуль корреляционного момента двух случайных величин не превосходит среднего геометрического дисперсий данных величин:

.

Доказательство: рассмотрим случайную величину :

Вычислим дисперсию:

, т.о. .

Аналогично, используя случайную величину ,

можно получить: ; ,

,

что и требовалось доказать.

Теорема 3: Коэффициент корреляции по модулю не превосходит единицы. .

Доказательство: Из теоремы 1 имеем: .

Поделим все части на получим:

, откуда и ,

что и требовалось доказать.

Определения: Две случайные величины X и Y называют коррелированными, если их корреляционный момент отличен от 0 (нуля).

Две случайные величины X и Y называют некоррелированными, если их корреляционный момент равен 0 (нулю).

Из этих определений следует, что две коррелированные величины будут также зависимы. Обратное утверждение не всегда справедливо: если две случайные величины зависимы, то они могут быть как коррелированными, так и некоррелированными.

5.8.Линейная регрессия. Прямые линии среднеквадратической регрессии.

Пусть даны две случайные величины (X, Y), где X и Y зависимые. Предположим, что одна величина может быть выражена через другую величину линейно, т.е. представим случайную величину Y как линейную функцию от Х:

Y  g (X) = a + b*X .

Найдем коэффициенты a и b , используя метод наименьших квадратов.

Функция g(X) = a + b*X, называется наилучшим приближением случайной величины Y. Для того, чтобы эта функция давала более точное приближение, достаточно, чтобы математическое ожидание отклонения квадрата случайной величины Y от данной функции было бы наименьшим:

M(Y – a – b*X)2 .

Функцию g (X) называют среднеквадратической регрессией случайной величины Y на X .

Теорема: Линейная среднеквадратическая регрессия случайной величины Y на X имеет следующий вид:

, где .

Доказательство: Рассмотрим функцию от двух переменных равную:

.

Данную функцию можно представить в виде:

Исследуя данную функцию F(a,b) на экстремум, вычислим частные производные первого порядка и приравняем их к нулю:

Решая, получим:

F(a, b) имеет наименьшее значение, тогда получим, что

,

, что и требовалось доказать.

Коэффициент, равный , называют коэффициентом регрессии случайной величины Y на X , а прямую

прямой среднеквадратической регрессии случайной величины Y на случайную величину X .

Если в F(a, b) подставить найденные коэффициенты, то получим наименьшее значение данной функции

которое называется остаточной дисперсией Y относительно X, и которая характеризует величину ошибки, которая допускается при замене случайной величины Y на g (X).

Если коэффициент корреляции , то F(a,b) = 0 и ошибка не возникает. Это значит, что X и Y связаны функциональной линейной зависимостью.

Аналогично можно получить прямую среднеквадратической регрессии случайной величины X на Y . Она имеет вид:

.

Обе прямые среднеквадратической регрессии Y на X и X на Y пересекаются в точке с координатами (mx, my), которая называется центром совместного распределения случайных величин X , Y .

Если коэффициент r =  1 , то прямые регрессии будут совпадать.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]