
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Характеристики разброса
Одной характеристики положения недостаточно для представления о случайной величине. Например, чем различается продукция мастера от продукции ученика? Они оба придерживаются одного задания и намерены изготавливать детали строго по чертежу. Но большая часть продукции ученика является браком, так как размеры его деталей часто выходят за пределы допуска; в то же время практически вся продукция мастера принимается. Таким образом, продукция мастера и ученика отличается разной изменчивостью.
Наиболее простой характеристикой изменчивости (разброса, рассеивания) является размах – разность между максимальным и минимальным значениями случайной величины: d = xmax – xmin . К сожалению, размах – нестабильная характеристика, она зависит только от предельных значений величины, которые имеют малую вероятность появления (и в малой партии могут не появиться). Основными же характеристиками разброса является дисперсия и среднее квадратическое отклонение.
Для каждой детали имеется какое-то отклонение от заданного размера (центра группировки, математического ожидания): (xi – a). Большие отклонения встречаются редко, а малые – значительно чаще. Возникает идея, характеризовать меру изменчивости "средней величиной отклонения": М(x ‑ a) = (xi – a)pi . Ожидается, что чем больше "среднее отклонение", тем будет больше случайная изменчивость, тем должен быть большим разброс данных вокруг центра а. Однако, как будет показано далее, "среднее отклонение" оказалось всегда равным нулю (и для мастера, и для ученика) из-за разных знаков отклонений.
Для того, чтобы погасить знаки, все отклонения предварительно возводят в квадрат и находят "средний квадрат отклонения" D(x) = М(x ‑ a)2 = (xi ‑ a)2pi . Эта характеристика называется дисперсией (в переводе – разброс). Вычислим ее на примере задачи о лотереи, где уже определено математическое ожидание а = 0,9:
D(x) = (0 – 0,9)2 0,5 + (1 – 0,9)2 0,3 + (2 – 0,9)2 0,15 + (5 – 0,9)2 0,04 + (10 – 0,9)2 0,01 =
= 0,810,5 + 0,010,3 + 1,210,15 + 16,810,04 + 82,810,01 = 2,09.
Однако
не очень удобно, что размерность дисперсии
равна квадрату размерности случайной
величины. Поэтому извлекают корень
квадратный из дисперсии и полученную
характеристику называют "средним
квадратическим отклонением";
по традиции ее обозначают греческой
буквой сигма:
.
Обычное среднее отклонение (взвешенное
среднее) равно нулю, поэтому используют
среднее квадратическое
(взвешенное с весами pi).
Вместо "среднего квадратического
отклонения" часто употребляют
выражения "стандартное отклонение"
и даже "стандартная ошибка". Но
надо сразу предостеречь против последнего
словосочетания. За рубежом различают
термины Standard Deviation (стандартное отклонение)
и Standard Error (стандартная ошибка). Последняя
величина равна
и в нашей литературе называется "ошибкой
среднего"
(о ней будет сказано
позже). Для примера с лотереей
.
Иногда
увеличение среднего размера (математического
ожидания) сопровождается одновременным
увеличением разброса. Для характеристики
изменчивости таких случайных величин
может оказаться полезным коэффициент
вариации, который
равен
.
Если коэффициент вариации оказывается
меньшим 2% ,
то такую случайную величину считают
константой (ее изменчивостью можно
пренебречь). Сверху коэффициент вариации
не ограничен. Для примера с лотереей
.