
- •Лекция 1. Основные понятия теории вероятности
- •Вопросы для самопроверки
- •Лекция 2. Теоремы о вероятностях
- •Теорема умножения вероятностей
- •Краткая классификация событий
- •Теорема о полной вероятностей
- •Теорема (формула) Байеса
- •Теорема сложения вероятностей
- •Принцип практической невозможности редких событий
- •Вопросы для самопроверки
- •Лекция 3. Случайные величины
- •Дискретная случайная величина
- •Числовые характеристики случайных величин
- •Характеристики положения
- •Характеристики разброса
- •Характеристики формы
- •Свойства математического ожидания
- •Свойства дисперсии
- •Правило "3-х сигм"
- •Вопросы для самопроверки
- •Лекция 4. Распределение Бернулли, Пуассона, Лапласа Распределение Бернулли
- •Биномиальные коэффициенты
- •Распределение Пуассона
- •Вопросы для самопроверки
- •Лекция 5. Распределение Лапласа
- •И нтегральная теорема Лапласа
- •Три основных формы интегральной теоремы Лапласа
- •Вопросы для самопроверки
- •Лекция 6. Непрерывная случайная величина
- •Нормальный закон распределения Гаусса
- •Показательный или экспоненциальный закон распределения
- •Квантили распределения
- •Вопросы для самопроверки
- •Лекция 7. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •Центральная предельная теорема
- •Композиция распределений случайных величин
- •Функции случайного аргумента
- •Вопросы для самопроверки
- •Лекция 8. Система случайных величин
- •Закон распределения дискретной двумерной случайной величины
- •Характеристики дискретной двумерной случайной величины
- •Закон распределения непрерывной двумерной случайной величины
- •Характеристики непрерывной двумерной величины
- •Двумерный нормальный закон
- •Вопросы для самопроверки
- •Лекция 9. Проблемы математической статистики
- •Способы составления выборочных подсовокупностей
- •Статистичекое оценивание
- •Вопросы для самопроверки
- •Лекция 10. Свойства статистических оценок
- •Оценка параметров распределения
- •Статистические критерии
- •Вопросы для самопроверки
- •Лекция 11. Критерии согласия Критерий согласия Пирсона
- •Критерий согласия Колмогорова – Смирнова
- •Интервальные оценки характеристик и параметров
- •Вопросы для самопроверки
- •Лекция 12. Проверка статистических гипотез Распределение Стьюдента
- •Интервальная оценка для математического ожидания
- •Проверка гипотезы о равенстве центров двух совокупностей
- •Сравнение двух дисперсий
- •Вопросы для самопроверки
- •Лекция 13. Дисперсионный анализ
- •Ранговый дисперсионный анализ Краскала–Уоллиса
- •Время появления реакции в 4-х группах
- •Ранжированнае данные
- •Дополнение к выводу формул Краскала–Уоллиса
- •Вопросы для самопроверки
- •Лекция 14. Регрессионный анализ
- •Метод наименьших квадратов (мнк)
- •Пример расчета мнк-оценок параметров
- •Оценка тесноты принятой формы связи.
- •Однофакторная линейная зависимость
- •Нелинейные двухпараметрические модели
- •Вопросы для самопроверки
- •Лекция 15. Проблема значимости и адекватности регрессионной модели Оценка значимости регрессионной модели
- •Оценка значимости корреляционной связи
- •Проверка адекватности модели
- •Коэффициент ранговой корреляции Спирмена
- •Вывод формулы для коэффициента ранговой корреляции Спирмена
- •Вопросы для самопроверки
- •Лекция 16. Линейный регрессионный анализ в стандартизованных переменных
- •Способы составления многофакторных моделей
- •Коэффициенты частной корреляции
- •Вывод формул для дисперсий коэффициентов регрессии и расчетных значений
- •Вопросы для самопроверки
Интервальная оценка для математического ожидания
Как
уже указывалось выше, статистика
распределена по закону Стьюдента с
df = n – 1.
Тогда с уровнем доверия Р = 1 –
выполняется условие
.
Это неравенство можно разрешить
относительно а:
.
Мы получили доверительный интервал со
случайными границами, который с
вероятностью Р = 1 –
накрывает неизвестное значение
математического ожидания (центра всей
совокупности). По результатам обследования
относительно малой выборки сделано
заключение о важнейшей характеристике
генеральной совокупности.
Математическое
ожидание оценивается с уровнем доверия
Р = 1 –
и погрешностью
.
Погрешность можно выразить в процентах
от
(относительная погрешность):
,
где
– коэффициент вариации.
Теперь мы можем сформулировать три вида стандартных задач.
1. При заданном уровне доверия Р можно определить погрешность оценки математического ожидания .
2. При заданной погрешности можно найти уровень доверия Р.
3. Можно определить объем выборки, для которого с заданной надежностью (уровнем доверия Р = 1 – ) погрешность в оценке математического ожидания не превзойдет некоторого заданного значения; предельное значение погрешности обычно задается в процентах q% .
Рассмотрим
решение этой задачи. Из выражения для
относительной погрешности имеем:
,
откуда
.
Полученное неравенство еще предстоит
решать итерациями, т.к. табличное значение
квантиля t
зависит от ЧСС, которое здесь равно
df = n – 1.
Пример.
Пусть принят уровень доверия P = 0,95
(соответственно, уровень значимости
= 0,05).
Предельная относительная погрешность
принята равной
q = 5% .
Тогда
.
Если
vx = 20% ,
то
.
Принимаем t0,05 = 2
(предельное значение для больших n)
и получаем n 1622 = 64.
Проверяем: df = n – 1 = 63,
далее по таблице Стьюдента находим
t0,05(63) = 2.
Процесс закончился за одну итерацию:
n = 64.
Если
vx = 10% ,
то
.
Принимаем t0,05 = 2
и получаем n 422 = 16.
Проверяем: df = n – 1 = 15,
далее по таблице Стьюдента находим
t0,05(15) = 2,1.
Новое значение n 42,12 = 17,6
дает верхнюю
границу n = 18.
Проверяем среднее
значение n = 17,
df = 17 – 1 = 16;
далее по таблице Стьюдента находим
t0,05(16) = 2,1.
Процесс закончился за две итерации:
n = 17.
Если
vx = 5% ,
то
.
Принимаем t0,05 = 2
и получаем n 22 = 4.
Проверяем: df = 4 – 1 = 3,
далее по таблице Стьюдента находим
t0,05(3) = 3,2.
Новое значение n 3,22 = 10,2
дает верхнюю
границу n = 11.
Проверяем среднее
значение n = 8,
df = 8 – 1 = 7;
далее по таблице Стьюдента находим
t0,05(7) = 2,4.
Новое значение n 2,42 = 5,8
дает границу n = 6.
Проверим эту
границу: n = 6,
df = 6 – 1 = 5,
t0,05(5) = 2,6,
n 2,62 = 6,8,
откуда получаем
n = 7.
Процесс закончился за пять итераций:
n = 7.
Если
vx = 2% ,
то
.
Принимаем t0,05 = 2
и получаем n 0,1622 = 0,64.
Принимаем n = 2,
df = 2 – 1 = 1,
t0,05(1) = 12,7,
n 0,1612,72 = 25,8.
Это явно завышенная
оценка, поэтому проверяем следующее
значение n = 3,
df = 3 – 1 = 2,
t0,05(2) = 4,3,
n 0,164,32 = 3,0.
Процесс закончился.
Достаточно n = 3.
Для еще меньших значений коэффициента вариации vx < 2% случайную величину можно считать постоянной (ее изменчивостью можно пренебречь).