
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Способы составления многофакторных моделей
Многофакторная модель может быть значимой в целом (по критерию Фишера), но в то же время состоять из незначимых членов (по критерию Стьюдента). Значимая в целом модель хорошо воспроизводит опытные данные и уравнение регрессии можно использовать как интерполяционную формулу. Но мы желаем большего – мы желаем получить значимые интервальные оценки коэффициентов регрессии ("инструментов экономического воздействия") – тогда регрессионная модель приобретает содержательную экономическую интерпретацию.
В методе наименьших квадратов не предусмотрены какие-либо требования к оценкам коэффициентов регрессии, мы добиваемся улучшения только ее качества интерполирования.
Исследования показали, что наиболее существенной ошибкой спецификации многофакторной модели (вида уравнения регрессии) является пропуск важного члена – в этом случае все оценки регресии будут смещенными, иногда настолько, что нельзя поручиться даже за их знаки. Будем считать, что специалист знает свое дело и ясно представляет себе, какие факторы являются существенными в той или иной проблеме.
Другие
последствия будут, если в модель включить
несколько незначимых членов – в этом
случае снижается значимость всех
остальных членов, коэффициенты регрессии
оцениваются с большими случайными
ошибками (большой дисперсией). Согласно
"принципу экономии" Л. Клейна,
незначимые члены не просто бесполезны,
они снижают качество модели и поэтому
должны быть выбракованы. Однако выбраковки
надо производить последовательно,
начиная с самых незначимых по Стьюденту
членов. Сначала каждая очередная
выбраковка приводит к улучшению качества
модели (повышается значимость оставшихся
членов), но начиная с некоторого этапа
процесс выбраковок надо прекратить,
иначе будет выбракован пока еще
незначимый, но важный член модели.
Предложено несколько критериев качества
модели, из которых наиболее простым
является величина несмещенной остаточной
дисперсии – для наилучшей модели эта
величина принимает наименьшее значение:
.
Способ последовательных исключений ("сверху–вниз") с оценкой значимости по критерию Стьюдента оставшихся в модели членов (кандидатов на очередную выбраковку) легко реализуется на компьютере.
При расчетах вручную предпочитают способ последовательных подключений ("снизу вверх") с оценкой значимости еще не подключенных членов (кандидатов на подключение) с помощью, так называемых, "коэффициентов частной корреляции".
Первые
два способа приводят к разным моделям
с разным числом членов и разным их
составом. Теоретически наилучшим
способом составления многофакторной
модели был бы способ "всех регрессий",
когда когда рассматриваются все возможные
комбинации объясняющих переменных. Но
таких вариантов
!
, начиная с отсутствия в модели объясняющих
переменных, далее
однофакторных моделей,
– двухфакторных, и т.д. до включения в
модель всех
аргументов. Число всех регрессий быстро
возрастает с увеличением числа членов
модели.
Поэтому предложена методика подключения–исключения, которая реализованна в специальных статистических пакетах программ на компьютере. Согласно этой методике, на очередном этапе делается попытка подключить в модель самую перспективную переменную, которая объясняет максимум остаточной дисперсии. Эта переменная выбирается по максимуму коэффициента частной корреляции. Если качество модели при очередном подключении не улучшается (не уменьшается несмещенная оценка остаточной дисперсии), то последнее подключение отменяется и процесс составления модели завершается. При подключении в модель очередного члена изменяются вклады ранее подключенных членов и некоторые из них перестают быть значимыми. Надо попробовать их выбраковать, начиная с самого незначимого по критерию Стьюдента, пока с очередной выбраковкой не ухудшится качество модели. В наилучшую модель ничего больше не подключается и ничто не выбраковывается. В научной литературе этот метод иногда называется "методом пошаговой регрессии".