
- •Теория вероятностей и математическая статистика
- •1.2 События и действия (операции) над ними.
- •1.3 Классическое определение вероятности
- •1.4. Свойства вероятностей
- •1.5. Формула сложения вероятностей
- •Эта формула называется формулой сложения вероятностей для несовместных событий и читается так: вероятность суммы нескольких попарно несовместных событий равна сумме их вероятностей.
- •1.6. Статистическое и геометрическое определения вероятности
- •Геометрическое определение вероятности.Вероятностью событияА называется.
- •1.7. Понятие об аксиоматическом определении вероятности.
- •2.1 Условная вероятность
- •2.2 Формула умножения вероятностей.
- •2.3 Формула полной вероятности
- •2.4 Формула Байеса
- •2.5 Схема и формула Бернулли
- •2.5 Приближенные формулы в схеме Бернулли
- •Лекция 3
- •3.1 Случайная величина
- •3.2 Дискретные случайные величины
- •3.4 Непрерывные случайные величины
- •Свойства плотности вероятности.
- •Смысл дисперсии в том, что она является мерой рассеяния значений случайной величины от математического ожидания. Чем меньше дисперсия, тем меньше разброс значений от математического ожидания.
- •4.4 Свойства дисперсии
- •4.5 Другие числовые характеристики
- •4.6 Нормальное распределение (распределение Гаусса)
- •Лекция 5
- •5.1 Числовые характеристики некоторых распределений
- •Равномерное распределение.
- •Непрерывно распределенные двумерные случайные величины
- •6.3 Корреляционный момент, коэффициент корреляции
- •6.4 Представление о законе больших чисел
- •6.5 Представление о центральной предельной теореме
- •Лекция 7
- •Рассмотрим три закона распределения, которые часто используются в теории вероятностей.
- •1. Распределение (читается “хи в квадрате”). ПустьÎn(0, 1) – независимые нормально распределенные с.В. С.В. Называетсяраспределенной по закону со степенью свободыk.
- •2. Распределение Стьюдента т(k). С.В. , гдеU în(0, 1), называется распределенной по закону Стьюдента со степенью свободы k.
- •3. С.В. , гдеk1, k2 – натуральные числа, называется распределенной по закону Фишера со степенями свободы k1, k2.
- •7.4.1 Доверительный интервал для м.О. Нормально распределенной с.В.
- •7.4.2 Доверительный интервал для дисперсии нормально распределенной г.С.
- •8.1 Предварительная обработка реализации выборки
- •F*(X) – статистическая функция распределенияр(X) – плотность распределения
- •8.2 Основные понятия проверки статистических гипотез
- •Лекция 9. Элементы регрессионного анализа
- •9.1 Парный линейный регрессионный анализ.
- •9.2 Парный обобщенный линейный регрессионный анализ
Лекция 9. Элементы регрессионного анализа
9.1 Парный линейный регрессионный анализ.
Пусть проводится наблюдение над двумерной г.с. (Х, Y).
Если фиксировать значение x случайной величины X, то можно рассмотреть условное математическое ожидание с.в. Y при X=x: M[Y/X=x]. Таким образом, M[Y/X=x] является некоторой детерминированной функцией от x: M[Y/X=x] =j(x). Эта функция называется функцией регрессии Y на X, а график функции y=j(x) кривой регрессии Y на X. Если наблюдаетя с.в. Y при определенных значениях x, то случайную величину Y можно представить в виде Y=j(x)+e, где e – с.в. Пусть наблюдения проводятся при фиксированных значениях x1, x2, …,xn. При этом случайная величина Y приняла соответственно значения y1, y2, …, yn. Тогда можно считать, что имеет место выборка yi = j(xi) + ei, i=1, …, n. В дальнейшем будем считать, что случайные величины ei, i=1, …, n, удовлетворяют следующим условиям.
ei (i=1, …, n) распределены по нормальному закону с математическим ожиданием 0 и дисперсией s2;
они попарно некоррелированны.
Если функция регрессии j(x) линейна, то говорят, что имеет место линейная регрессионная модель. Рассмотрим подробно эту модель.
Пусть Y= b0+b1x+e, yi= b0+b1xi+ei, (i=1, …, n) и выполняются условия 1) – 2).
Задача корреляционного и регрессионного анализа состоит в следующем.
Получить наилучшие точечные и интервальные оценки параметров b0, b1, s линейной модели;
Проверить значимость модели;
Проверить адекватность модели наблюдаемым данным.
Для нахождения
точечных оценок
применяется метод наименьших квадратов
(сокращенно – МНК).
Обозначим искомое
уравнение
.
По МНК коэффициенты
ищут, такие, чтобы принимала минимальное
значение сумма
,
где
обозначено
.
По необходимому
условию экстремума частные производные
функции S
по переменным
должны обратиться в нуль в точке минимума.
Итак, решаем систему
Преобразовав систему, получаем
(9.1)
По методу Крамера, получим
,
где– выборочный корреляционный момент,
–
выборочная дисперсия с.в.X.
Преобразовав далее, получим
,
где–
выборочный коэффициент корреляции.
В итоге получаем формулы для оценок коэффициентов уравнения линейной регрессии:
,
.
(9.2)
Коэффициент
называется выборочным коэффициентом
регрессии. Выборочное уравнение регрессии
имеет вид
Введем в рассмотрение следующие суммы.
–сумма квадратов
отклонений,
–остаточная сумма
квадратов,
–сумма квадратов,
обусловленная регрессией,
называется
остаточной дисперсией.
Теорема 9.1
.
Если параметр
=
0, то линейная модель называется
незначимой. Для проверки значимости
линейной модели выдвигается основная
гипотезаH0:
=
0 при альтернативной гипотезеH1:
¹
0.
Статистика
имеет распределение Фишера с 1 иn–2
степенями свободы, если основная гипотеза
верна. Таким образом, если выборочное
значение Fв
больше
квантили
распределения Фишера, то основная
гипотеза отвергается с вероятностьюa,
то есть на уровне значимости a
линейная
модель статистически значима.
Доверительные
интервалы для коэффициентов
,
c
доверительной вероятностью 1–
a
имеют вид:
<
<
,
<
<
,
где
–
квантиль распределения Стьюдента
порядка 1–a./2
со степенью свободы n–2.
Коэффициентом
детерминации называется величина
.
Чем ближе значение коэффициента
детерминации к 1, тем лучше линейная
модель описывает наблюдаемые данные.
Если имеет место линейная регрессионная
модель, то выборочный коэффициент
корреляции междуX,
Y
.