
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Критерий согласия Колмогорова – Смирнова
Это
самый простой (и самый ненадежный)
критерий. Основан он на сравнении
интегральных функций распределения –
теоретической F(sj)
и эмпирической
(кумуляты). Статистика Колмогорова –
Смирнова имеет вид:
.
Если вычисленное значение KS
оказывается меньше 1,36 , теоретический
закон принимается; если же KS
оказывается больше 1,63 , теоретический
закон отвергается.
Очень простой критерий, но есть одна маленькая деталь – теоретический закон должен быть известен полностью, включая знание значений его параметров.
При
применении критерия Пирсона неизвестные
параметры теоретического закона
заменялись на свои выборочные оценки
и вместо теоретической интегральной
функции F(sj)
использовалась интегральная функция
,
которая "подогнана под данные выборки".
Из-за этого сравниваемые законы получались
более согласованными, чем это есть в
действительности, но этот нежелательный
эффект нейтрализовывался соответствующим
уменьшением числа степеней свободы.
Если же, применяя критерий Колмогорова – Смирнова, мы заменяем параметры распределения на его оценки, то верить критерию KS можно только когда он отвергает предполагаемый закон. Критерий KS – слишком "либеральный" и склонен часто принимать не совсем верные теоретические законы. Так, для примера, который был рассмотрен выше, критерий KS не нашел существенных различий в эмпирическом и нормальном распределениях.
Интервальные оценки характеристик и параметров
О
ценки,
которыми мы пользовались до сих пор,
представляли собой одно число, поэтому
они называются "точечными". Выше
уже указывалось, что многие оценки
являются "статистиками", указывая
этим, что известен закон их распределения.
В
таком случае можно определить границы
случайного изменения оценки К
(границы доверительного интервала с
заданным уровнем доверия Р = 1 – )
как квантили
и
(см. рис. 11.3). Доверительный интервал
со случайными границами (выборочные
квантили) накрывает неизвестное
генеральное значение статистики с
заданным уровнем доверия Р,
и не накрывает – с уровнем значимости
(т.е. с малой вероятностью
наши интервальные оценки могут быть
ошибочными).
Впервые интервальную оценку (для дисперсии) построил К. Пирсон.
Рассмотрим
случайные величины xi ,
распределенные по нормальному закону
с одинаковыми характеристиками:
xi ~ N(a; x).
Известно, что среднее этих случайных
величин
также имеет нормальное распределение
с тем же центром
.
Тогда случайные величины
будут распределены по стандартному
нормальному закону с нулевым математическим
ожиданием и единичной дисперсией, а
сумма их квадратов – по закону Пирсона:
Строим
доверительный 90%-ный интервал этой
статистики
,
откуда получаем 90%-ный доверительный
интервал для дисперсии:
.
С уровнем доверия Р = 0,9
этот интервал со случайными границами
накрывает неизвестное нам значение
генеральной дисперсии.
Математическое
ожидание статистики 2
равно dfx
– числу степеней свободы разностей
:
Отсюда получаем несмещенную оценку
дисперсии в виде:
,
т.к.
.
Осталось
определить число степеней свободы, от
которого зависят границы доверительного
интервала. Если случайные величины –
взаимно независимые, то для разностей
имеется только одна связь
(центральное свойство среднего). В этом
частном случае dfx = n – 1.
Если же на разности
наложены еще какие-то связи (их количество
обозначим через l),
то dfx = n – l –1.