
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
Приведем систему исходных предпосылок регрессионного анализа (гипотезы Гаусса–Маркова) в порядке убывания их важности:
1. yi = h(xi) + ei ; Все случайные ошибки относятся только к у; h(xi) – известная функция.
2.
M(ei) = 0; Систематических
ошибок нет;
.
3.
; Наблюдения
равноточны (гомоскедастичность –
одинаковый разброс).
4. M(eiej) = 0; Наблюдения не коррелированы (не зависимые).
5. ei ~ N(0; se); Ошибки распределены нормально (самая несущественная предпосылка).
По
исходным данным (xi,
yi)
вычислены некоторые числовые
характеристики:
.
Первые две из этих характеристик
считаются измеренными точно, поскольку
все случайные ошибки относятся только
к переменной y.
Остальные же характеристики содержат
случайную ошибку, поэтому они сами
являются случайными величинами с
известным законом распределения (такие
характеристики называются “статистиками”).
Рассмотрим первую статистику из вышеприведенного списка:
Поскольку
все
(вторая гипотеза), то
.
Вычисляем
дисперсию
:
.
Здесь использовано:
;
свойства математического ожидания;
для
i ¹ j
(четвертая гипотеза);
(третья
гипотеза).
Мы получили известный факт – случайная дисперсия среднего арифметического в n раз меньше случайной дисперсии отдельных наблюдений.
Теперь рассмотрим коэффициент регрессии b1 :
Здесь b1=M(b1) получается по той же формуле, что и b1 с заменой yi на hi .
Вычисляем
дисперсию
:
Покажем,
что ковариация
равна нулю:
т.к.
Расчетное
значение yp
для
каждого x
оказывается комбинацией двух случайных
величин
и
b1:
.
Вычисляем его дисперсию по известному свойству дисперсии суммы:
Осталось заменить дисперсию случайной ошибки на несмещенную дисперсию остатка модели:
.
Вопросы для самопроверки
1. Что такое "стандартизованные переменные"? Каковы из свойства?
2. Что такое "-коэффициенты"? Как они связяны с коэффициентами регрессии? Чему равно 0 ?
3. Какой вид имеет система нормальных уравнений в стандартизованных переменных?
4. Как в стандартизованных переменных записывается выражение для коэффициента детерминации?
4. Как оценивается значимость модели в целом и значимость ее отдельных членов?
5. Как записать интервальные оценки для коэффициентов регрессии:
6. Как строится доверительная полоса на расчетные значения? Что она показывает?
7. Как составляется многофакторная регрессионная модель?
8. Что такое "коэффициенты частной корреляции"?
9. Каков общепринятый критерий качества регрессионной модели?