
- •Вероятность событий
- •1.1 Элементарные понятия теории вероятности.
- •1.2 Операции над случайными событиями
- •1.3 Вероятность случайного события
- •1.4 Формулы комбинаторики
- •1.5 Вероятность произведения событий
- •1.6 Вероятность суммы событий
- •1.7 Формула полной вероятности. Формула Байеса.
- •Независимые повторные испытания
- •2.1 Формула Бернулли
- •2.2 Наивероятнейшее число появлений успеха в n независимых испытаниях.
- •2.3 Обобщение формулы Бернулли
- •2.4 Формула Пуассона
- •2.5 Локальная теорема Лапласа.
- •2.6 Интегральная теорема Лапласа
- •2.7 Вероятность отклонения относительной частоты от вероятности события a
- •Дискретные случайные величины
- •3.1 Основные определения
- •3.1.1.Дискретная случайная величина
- •3.1.2 Функция дискретной случайной величины
- •3.2 Законы распределения случайной дискретной величины
- •3.2.1. Биномиальное распределение
- •3.2.2. Распределение Пуассона
- •3.2.3. Геометрическое распределение
- •3.2.4. Гипергеометрическое распределение
- •3.3 Числовые характеристики дискретной случайной величины.
- •3.3.1. Математическое ожидание дискретной случайной величины
- •3.3.2. Математическое ожидание функции дискретной случайной величины
- •3.3.3. Свойства математического ожидания
- •3.3.4. Дисперсия дискретной случайной величины
- •3.3.5. Основные свойства дисперсии
- •3.4 Другие числовые характеристики дискретной случайной величины
- •3.4.1 Среднеквадратическое отклонение
- •3.4.2. Моменты k-го порядка
- •3.4.3. Нормированная случайная величина
- •3.4.4. Функция распределения дискретной случайной величины.
- •3.4.5. Мода и медиана дискретной случайной величины
- •3.4.6. Ковариация и коэффициент корреляции
- •Непрерывные случайные величины.
- •4.1. Функция распределения и плотность вероятности непрерывной случайной величины
- •5.2. Функция непрерывной случайной величины
- •5.3. Основные характеристики непрерывной случайной величины
- •5.3.1. Математическое ожидание
- •5.3.2. Дисперсия
- •5.3.3. Мода и медиана
- •5.3.4. Моменты k-го порядка
- •5.3.5. Асимметрия и эксцесс.
- •5.3. Законы распределения непрерывной случайной величины
- •5.3.1. Равномерное распределение
- •5.3.2. Показательное распределение
- •5.3.3. Нормальное распределение
- •5. Закон больших чисел
- •5.1. Центральная предельная теорема
- •5.2. Неравенство и теорема Чебышева.
- •5.3. Теорема Бернулли (Закон больших чисел)
- •5.4. Эмпирическая оценка параметров случайной величины
- •Система двух случайных величин
- •6.1. Закон распределения дискретной двумерной случайной величины
- •6.2. Функция распределения двумерной случайной величины
- •6.3. Свойства функции распределения двумерной случайной величины
- •6.4. Функция плотности вероятности непрерывной двумерной случайной величины
- •6.5. Функция двумерной случайной величины
- •6.6. Условные законы распределения составляющих двумерной случайной величины
- •6.6.1. Условные законы распределения дискретной случайной величины
- •6.6.2. Условные законы распределения непрерывной случайной величины
- •6.6.3. Условное математическое ожидание
- •6.7. Корреляция случайных величин
- •6.7.1 Независимость компонент двумерной случайной величины
- •6.7.2. Корреляционный момент и коэффициент корреляции
- •6.7.3. Линейная регрессия, линейная корреляционная зависимость.
6.7.2. Корреляционный момент и коэффициент корреляции
Для двумерной случайной величины (системы двух случайных величин) можно ввести понятие корреляционного момента. Такой момент равен математическому ожиданию произведения отклонений величин (X, Y), то есть ковариации компонент.
xy= M([X-M(X)][Y-M(Y)])=Cov(X, Y)
Для дискретной двумерной случайной величины
xy= [xi- M(X)][yj- M(Y)] p(xi, yj)
ij
Для непрерывной двумерной случайной величины
xy= ∫ ∫[x-M(X)][y-M(Y)]f(x, y)dxdy
--
Отношение корреляционного момента к произведению среднеквадратичных отклонений случайной величины равно коэффициенту корреляции
rxy=xy/(xy)
Напомним, что для коэфициента корреляции всегда выполняется свойство:
|rxy|1
Случайные величины X и Y называются коррелированными, если их корреляционный момент (и коэффициент корреляции) отличен от нуля. Такие величины всегда являются зависимыми. Независимые величины являются некоррелированными и их коэффициент корреляции равен нулю. Вместе с тем, обратное не всегда верно и некоррелированные величины (rxy=0) могут оказаться зависимыми.
Однозначное соответствие между зависимостью и коррелированностью выполняется для двумерной случайной величины только при нормальном распределении:
f(x, y)=1/ (2xy (1- rxy2)0.5)exp[-1/(2(1- rxy2)0.5)((x-ax)2/x2+
+(y-ay)2/y2- 2 rxy(x-ax)/x(y-ay)/y)]
Еще одна особенность нормального закона распределения двумерной случайной величины состоит в том, что коррелированные компоненты X и Y связывает линейная регрессионная зависимость.
6.7.3. Линейная регрессия, линейная корреляционная зависимость.
Рассмотрим двумерную случайную величину (X, Y), для которой компоненты X и Y являются зависимыми (коррелированными). Предположим, что одна из них может быть приближенно описана некоторой функцией другой:
Yg(X)
Чтобы определить параметры, входящие в функцию g(X) (в случае линейного приближения g(X)=X+ это параметры и ), обычно используют метод наименьших квадратов. Функцию g(X) называют наилучшим приближением Y в смысле метода наименьших квадратов, если математическое ожидание квадрата отклонения Y от g(X)
M([Y-g(X)]2)
при подстановке данных параметров принимает наименьшее возможное значение. Функцию g(X) называют среднеквадратической регрессией Y на X. Для линейного приближения существует следующая теорема:
Линейная средняя квадратическая регрессия Y на X имеет вид:
g(X)=M(Y)+rxyy/x (X-M(X))= X+, где
= rxyy/x, = M(Y)-rxyy/xM(X),
M(Y), M(X) – математические ожидания соответствующих величин, y, x – их среднеквадратичные отклонения. Коэффициент называют коэффициентом линейной регрессии Y на X, а прямую
Y- M(Y)=rxyy/x (X-M(X))
- прямой среднеквадратической регрессии Y на X.
Рассмотрим функцию двух независимых переменных
F(, )= M([Y-g(X)]2)
Если подставить в нее коэффициенты и , соответствующие уравнению линейной средней квадратической регрессии, данная функция примет наименьшее возможное значение, равное
F(, )=y2(1- rxy2)
Полученную величину называют остаточной дисперсией случайной величины Y относительно X. Она характеризует величину ошибки, которая допускается при замене случайной величины Y функцией g(X). При |rxy|=1 остаточная дисперсия равна 0 и Y действительно является линейной функцией X. Аналогично строится прямая среднеквадратичной регрессии X на Y
X- M(X)=rxyx/y (Y-M(Y))
С остаточной регрессией x2(1- rxy2). При |rxy|=1 обе прямые совпадают. В общем случае прямые линейной регрессии проходят через точку (M(X), M(Y)), которую называют центром совместного распределения X и Y.
В случае, если коэффициент корреляции для компонент двумерной случайной величины равен по модулю единице, говорят, что эти компоненты связаны линейной корреляционной зависимостью. Именно такая зависимость наблюдается для коррелированных компонент случайной величины X и Y, распределенной по нормальному закону.