- •События, их виды и действия с ними. Алгебра событий. Аксиоматическое определение вероятности.
- •Аксиоматическое определение вероятности
- •Классическое и статистическое определения вероятности. Свойства вероятности. Классическое определение вероятности.
- •Свойства вероятности.
- •Относительная частота. Статистическое определение вероятности.
- •Теоремы сложения вероятностей. Теорема сложения вероятностей.
- •4. Независимость событий. Условные вероятности. Теоремы об умножениях вероятностей зависимых и независимых событий. Условная вероятность
- •Независимость событий
- •Теоремы умножения вероятностей.
- •5. Формула полной вероятности. Формулы Байеса. Формула полной вероятности.
- •6. Схема и формула Бернулли.
- •7. Понятия случайной величины.
- •Функция распределения
- •Свойства функции распределения:
- •Числовые характеристики дискретной случайной величины.
- •Свойства математического ожидания:
- •Свойства дисперсии:
- •8. Математическое ожидание св и его свойства.
- •Дисперсия и ее свойства. Стандартное отклонение.
- •Свойства дисперсии:
- •10. Биномиальное распределение. Формула Бернулли. Распределение Пуассона. Биномиальное распределение
- •Распределение Пуассона
- •11. Непрерывная случайная величина
- •Свойства функции распределения:
- •Плотность распределения вероятностей и ее свойства.
- •Свойства плотности распределения вероятностей:
- •13. Равномерный закон распределения
- •Понятие многомерной (векторной) св и ее закон, функция и плотность распределения. Условные математические ожидания и дисперсии. Многомерные случайные величины
- •Зависимые св. Ковариация и коэффициент корреляции. Корреляционная матрица случайного вектора. Независимые случайные величины
- •Свойства независимых случайных величин
- •Ковариация
- •Линейный коэффициент корреляции
- •Нормальное распределение.
- •Центральная предельная теорема
- •Нормальное распределение(не википед)
- •18. Вероятность попадания св в заданный интервал .Вероятность заданного отклонения нормальной св.Правило 3 сигм.
- •Отметим ряд свойств функции Лапласа, полезных для применения.
- •19. Теоремы Муавра-Лапласа
- •Понятие о центральной предельной теореме Ляпунова и ее применение.
- •Задачи математической статистики. Генеральная и выборочная совокупности.
- •Статистическое распределение. Эмпирическая функция распределения и ее свойства.
- •Полигон и гистограмма.
- •Генеральная и выборочная средние, их свойства. Оценка генеральной средней по выборочной.
- •Генеральная и выборочная дисперсии, их свойства. Оценка генеральной дисперсии по выборочной. Исправленная дисперсия.
- •Линейная регрессия. Метод наименьших квадратов.
Генеральная и выборочная дисперсии, их свойства. Оценка генеральной дисперсии по выборочной. Исправленная дисперсия.
Линейная регрессия. Метод наименьших квадратов.
Регрессионный анализ.
Рассмотрим выборку двумерной случайной величины (Х, Y) . Примем в качестве оценок условных математических ожиданий компонент их условные средние значения, а именно: условным средним назовем среднее арифметическое наблюдавшихся значений Y, соответствующих Х = х. Аналогично условное среднее - среднее арифметическое наблюдавшихся значений Х, соответствующих Y = y. В лекции 11 были выведены уравнения регрессии Y на Х и Х на Y:
M (Y / x) = f (x), M ( X / y ) = φ (y).
Условные средние и являются оценками условных математических ожиданий и, следовательно, тоже функциями от х и у, то есть
= f*(x) - (22.1)
- выборочное уравнение регрессии Y на Х,
= φ*(у) - (22.2)
- выборочное уравнение регрессии Х на Y.
Соответственно функции f*(x) и φ*(у) называются выборочной регрессией Y на Х и Х на Y , а их графики – выборочными линиями регрессии. Выясним, как определять параметры выборочных уравнений регрессии, если сам вид этих уравнений известен.
Пусть изучается двумерная случайная величина (Х, Y), и получена выборка из п пар чисел (х1, у1), (х2, у2),…, (хп, уп). Будем искать параметры прямой линии среднеквадратической регрессии Y на Х вида
Y = ρyxx + b , (22.3)
Подбирая параметры ρух и b так, чтобы точки на плоскости с координатами (х1, у1), (х2, у2), …, (хп, уп) лежали как можно ближе к прямой (22.3). Используем для этого метод наименьших квадратов и найдем минимум функции
. (22.4)
Приравняем нулю соответствующие частные производные:
.
В результате получим систему двух линейных уравнений относительно ρ и b:
. (22.5)
Ее решение позволяет найти искомые параметры в виде:
. (22.6)
При этом предполагалось, что все значения Х и Y наблюдались по одному разу.
Теперь рассмотрим случай, когда имеется достаточно большая выборка (не менее 50 значений), и данные сгруппированы в виде корреляционной таблицы:
Y |
X |
||||
x1 |
x2 |
… |
xk |
ny |
|
y1 y2 … ym |
n11 n12 … n1m |
n21 n22 … n2m |
… … … … |
nk1 nk2 … nkm |
n11+n21+…+nk1 n12+n22+…+nk2 …………….. n1m+n2m+…+nkm |
nx |
n11+n12+…+n1m |
n21+n22+…+n2m |
… |
nk1+nk2+…+nkm |
n=∑nx = ∑ny |
Здесь nij – число появлений в выборке пары чисел (xi, yj).
Поскольку , заменим в системе (22.5)
, где пху – число появлений пары чисел (х, у). Тогда система (22.5) примет вид:
. (22.7)
Можно решить эту систему и найти параметры ρух и b, определяющие выборочное уравнение прямой линии регрессии:
.
Но чаще уравнение регрессии записывают в ином виде, вводя выборочный коэффициент корреляции. Выразим b из второго уравнения системы (22.7):
.
Подставим это выражение в уравнение регрессии: . Из (22.7)
, (22.8)
где Введем понятие выборочного коэффициента корреляции
и умножим равенство (22.8) на : , откуда . Используя это соотношение, получим выборочное уравнение прямой линии регрессии Y на Х вида
. (22.9)
Метод квадратов.
Если требуется оценить зависимость величин у и х, причем известен вид связывающей их функции, но неизвестны значения входящих в нее коэффициентов, их величины можно оценить по имеющейся выборке с помощью метода наименьших квадратов. Для этого функция у = φ (х) выбирается так, чтобы сумма квадратов отклонений наблюдаемых значений у1, у2,…, уп от φ(хi) была минимальной:
При этом требуется найти стационарную точку функции φ(x; a, b, c…), то есть решить систему:
(решение, конечно, возможно только в случае, когда известен конкретный вид функции φ).
Рассмотрим в качестве примера подбор параметров линейной функции методом наименьших квадратов.
Для того, чтобы оценить параметры а и b в функции y = ax + b, найдем Тогда . Отсюда . Разделив оба полученных уравнения на п и вспомнив определения эмпирических моментов, можно получить выражения для а и b в виде:
. Следовательно, связь между х и у можно задать в виде: