
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Оценка параметров распределения
До сих пор мы рассматривали оценки характеристик распределения и для самых распространенных характеристик получили готовые вычислительные формулы.
Переходим к оценкам параметров закона распределения (в будущем будем оценивать также параметры эконометрических моделей).
Любой
закон распределения зависит от небольшого
количества параметров. Если значения
параметров известны, то можно вычислить
характеристики данного закона
распределения. "Параметры распределения"
и "характеристики распределения"
– это разные вещи. Например, равномерный
закон зависит от двух параметров a
и b;
зная значения этих параметров, можно
вычислить характеристики равномерного
распределения, например, математическое
ожидание и стандартное отклонение:
;
.
Чтобы получить оценки параметров, применяется один их трех методов: метод моментов, метод максимального правдоподобия и метод наименьших квадратов.
Метод моментов – самый простой из них. Согласно этому методу, надо теоретические характеристики распределения (они являются функциями неизвестных параметров) приравнять их выборочным оценкам. В результате получаем систему уравнений для определения оценок параметров.
Например, чтобы найти два параметра равномерного закона приравниваем две важнейшие характеристики (обычно это математическое ожидание и стандартное отклонение) их выборочным оценкам (среднему и несмещенной оценке стандартного отклонения):
.
Мы
составили систему двух уравнений
относительно двух неизвестных параметров
равномерного распределения и получили
оценки этих параметров. Резонно их
обозначать
,
или же, наоборот, теоретические параметры
закона переобозначить греческими
буквами ,
.
Иногда в одном и том же тексте одновременно
используются теоретическая функция
распределения (например, плотность
вероятности) f(xj),
ее эмпирическая оценка (гистограмма)
и теоретическая функция, в которой
параметры заменены на их оценки. Для
этой последней разновидности оценки
функции распределения можно ввести еще
какое-нибудь свое обозначение, например,
.
У нормального закона параметры совпадают с основными характеристиками, поэтому систему уравнений не придется решать:
.
Показательный
закон зависит от одного параметра ,
характеристики распределения выражаются
через этот параметр:
Если их теоретических соображений
ожидается показательное рапределение
и
,
то параметр определяется из одного
уравнеия
.
Метод максимального правдоподобия – считается наиболее обоснованным и пропагадируется как (не побоимся этого слова) самый модный (в настоящее время) способ определения параметров. Заключается он в следующем: для всей системы наблюдений {xi} составляется "функция правдоподобия" – вероятность или плотность вероятности совместного появления такой системы данных. Функция правдоподобия зависит от параметров предполагаемого закона распределения. Эти параметры следует определять из условий максимума функции прадоподобия.
Например,
предполагая показательное распределение,
найдем наиболее правдоподобную оценку
параметра .
Функция плотности вероятности этого
распределения для наблюдения xi
имеет вид: f(xi) = exp{–xi}.
Для независимых наблюдений дифференциальная
функция их совместного распределения
получается как произведение дифференциальных
функций: f(x1, x2, … , xn} = П(exp{–xi}) = nexp{–xi}.
Обычно функцию правдоподобия принимают
равной логарифму натуральному от этого
выражения: Ф() = nln() – xi .
Приравниваем нулю первую производную
от функции прабдоподобия
,
откуда получаем
. Именно такую оценку параметра мы
получили ранее методом моментов.
Для
нормального закона
,
тогда функция правдоподобия (логарифм
от произведения функций f(xi))
будет равна
,
где
постоянное слагаемое
отброшено.
Приравниваем
нулю частную производную функции
правдоподобия по параметру а:
,
откуда
.
Правдоподобная оценка параметра а
совпала с оценкой по методу моментов.
Приравниваем
нулю частную производную функции
правдоподобия по параметру :
,
откуда
.
Правдоподобная оценка параметра 2
оказалась равна обычной (смещенной)
оценке дисперсии.
Метод наименьших квадратов – применяется, в основном, в тех случаях, когда модель зависит от параметров линейно. Мы будем использовать этот метод для определения параметров регрессионных моделей. Он будет подробно описан в разделе "Регрессионный анализ".