Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по ТВ.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
921 Кб
Скачать

4.7. Нормальный закон распределения на плоскости.

Определение: Нормальным законом распределения на плоскости называют распределение вероятностей непрерывной двумерной случайной величины (X, Y), если плотность совместного распределения вероятностей ее компонент имеет вид:

Вероятностный смысл параметров:

a1, a2 – математические ожидания случайных величин X и Y соответственно;

средние квадратические отклонения случайных величин X и Y соответственно;

коэффициент корреляции случайных величин X и Y.

Теорема: Для нормально распределённых компонент X и Y двумерной случайной величины (X, Y) понятия независимости и некоррелированности равносильны.

Доказательство: Докажем, что если компоненты двумерной, нормально распределенной случайной величины некоррелированны, то они и независимы. Пусть случайные величины X и Y некоррелированны. Тогда, полагая в формуле плотности совместного распределения вероятностей 0, получим:

Следовательно, случайные величины X и Y независимы.

Справедливо и обратное утверждение (ведя рассуждения от конца к началу, получим, что независимые случайные величины X и Y некоррелированны).

Можно доказать, что если двумерная случайная величина (X, Y) распределена нормально с параметрами , то её компоненты X и Y также распределены нормально с параметрами, соответственно равными и .

4.8. Линейная регрессия. Прямые линии среднеквадратической регрессии.

Рассмотрим двумерную случайную величину (X, Y), где X и Y – независимые случайные величины. Представим одну из этих величин, как функцию другой. Ограничимся приближённым представлением (точное приближение, вообще говоря, невозможно) величины Y в виде линейной функции величины X:

где α и β – параметры, подлежащие определению. Найдем α и β, например, методом наименьших квадратов.

Определение: Функцию называют наилучшим приближением Y в смысле метода наименьших квадратов, если принимает наименьшее возможное значение. Функцию g(x) называют линейной среднеквадратической регрессией Y на X.

Теорема: Линейная среднеквадратическая регрессия Y на X имеет вид:

Доказательство: Рассмотрим функцию двух независимых аргументов α и β:

Отнимем и прибавим М(Y) и β М(X), сгруппируем и получим:

Учитывая, что:

и, выполнив выкладки, получим:

(1)

Исследуем функцию F(α, β) на экстремум, для чего приравняем к нулю частные производные:

Отсюда находим:

Легко убедиться, что при этих значениях α и β рассматриваемая функция принимает наименьшее значение.

Итак,

Определение: Коэффициент называют коэффициентом регрессии Y на X, а прямую

(2)

называют прямой среднеквадратической регрессии Y на X.

Подставим найденные значения α и β в формулу (1), получим:

Величину называют остаточной дисперсией случайной величины Y относительно случайной величины X. Она характеризует величину ошибки, которую допускают при замене Y линейной функцией .

При остаточная дисперсия равна нулю. Т.е. при этих крайних значениях коэффициента корреляции не возникают ошибки при представлении Y в виде линейной функции от X.

Вывод: Если , то Y и X связаны линейной функциональной зависимостью.

Аналогично можно получить прямую среднеквадратической регрессии X на Y:

(3)

Тогда

коэффициент регрессии X на Y,

остаточная дисперсия X относительноY.

Заметим, что при обе прямые регрессии, как видно из уравнений (2) и (3), совпадают.

Также из (2) и (3) следует, что обе прямые регрессии проходят через точку (M(X), M(Y)), которую называют центром совместного распределения случайных величин X и Y.