- •Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- •Часть II
- •Введение
- •1. Закон больших чисел
- •1.2. Неравенства чебышева
- •1.3. Сходимость по вероятности
- •1.4.Теоремы чебышева
- •1.4.1.Первая теорема Чебышева.
- •1.4.2. Вторая теорема Чебышева:
- •1.5. Теорема бернулли
- •1.6. Центральная предельная теорема
- •1.7. Предельные теоремы
- •1.7.1. Локальная теорема Муавра-Лапласа.
- •1.7.2. Интегральная теорема Муавра-Лапласа.
- •2. Базовые понятия математической статистики
- •2.1. Эмпирическая функция распределения
- •2.2. Гистограмма
- •2.3. Оценки параметров распределения и их свойства
- •2.4. Оценки моментов и квантилей распределения
- •2.5. Точечная оценка параметров распределения
- •2.5.1. Сущность задачи точечного оценивания параметров
- •2.5.2. Метод максимального правдоподобия
- •2.5.3. Метод моментов
- •2.5.4. Метод квантилей
- •3. Проверка статистических гипотез
- •3.1. Сущность задачи проверки статистических гипотез
- •3.2. Типовые распределения
- •3.2.1. Нормальное распределение
- •3.2.2. Распределение χ2 (хи-квадрат)
- •3.2.3. Распределение Стьюдента
- •3.3.4. Распределение Фишера
- •3.3. Проверка гипотез о законе распределения
- •3.3.1. Критерий хи-квадрат к. Пирсона
- •3.3.2. Критерий а.Н. Колмогорова
- •3.3.3. Критерий р. Мизеса
- •4. Интервальная оценка параметров распределения
- •4.1. Сущность задачи интервального оценивания параметров
- •4.2. Общий метод построения доверительных интервалов
- •4.3. Доверительный интервал для математического ожидания
- •4.4. Доверительный интервал для дисперсии
- •4.5. Доверительный интервал для вероятности
- •5. Аппроксимация закона распределения экспериментальных данных
- •5.1. Задачи аппроксимации
- •5.2. Аппроксимация на основе типовых распределений
- •6. Обработка однотипных выборок
- •6.1. Однотипные выборки эд и задачи их обработки
- •6.2. Объединение выборок
- •6.2.1. Объединение однородных выборок
- •6.2.2. Объединение неоднородных выборок
- •6.3. Однофакторный дисперсионный анализ
- •6.3.1. Задачи дисперсионного анализа
- •6.3.2. Проверка однородности совокупности дисперсий
- •6.3.3. Сравнение факторной и остаточной дисперсий
- •7. Корреляционный и регрессионный анализ
- •7.1. Матрица данных
- •7.2. Корреляционный анализ
- •7.3. Регрессионный анализ
- •7.3.1. Постановка задачи
- •7.3.2. Выбор вида уравнения регрессии
- •7.3.4. Вычисление коэффициентов уравнения регрессии
4.4. Доверительный интервал для дисперсии
По выборке достаточно большого объема (n>30) и при заданной надежности 1–a необходимо определить доверительный интервал для дисперсии m2 , оценка которой
.
Если стандартизовать оценку дисперсии, то величина (n–1)S2/ m2 имеет распределение хи-квадрат с (n–1) степенями свободы. Из этого вытекает вероятностное утверждение относительно выборочной дисперсии
P[(n–1)S2 / μ2 >c2a(n–1)] = a. (4.3)
Функция хи-квадрат несимметричная, поэтому границы интервала c21(n–1) и c22(n–1) выбирают из условия равной вероятности выхода за их пределы
P[(n–1)S2/ μ2 <c21(n–1)] = P[(n–1)S2/ μ2 >c22(n–1)] = a/2
или (4.4)
P[(n–1)S2/c21(n–1) < m2] = P[(n–1)S2/c22(n–1) > m2] = a/2.
Значения границ соответствуют квантилям распределения хи-квадрат с значениями уровней a/2 и 1– a/2, количество степеней свободы равно n–1.
Нижняя граница c21(n–1) равна квантили c2a/2(n–1), а верхняя – квантили c21-a/2(n–1). Если воспользоваться критическими точками распределения, то следует записать
c21(n–1) = c2(1– a/2; n–1),
c22(n–1) = c2(a/2; n–1).
Пример 4.4. Определить с надежностью 0,9 доверительный интервал для дисперсии случайной величины (n=44, S2= 0,91)
Решение. Количество степеней свободы 44–1=43. Вероятности выхода за нижнюю и верхнюю границы (1–0,9)/2 =0,05. По распределению хи-квадрат находим квантили
c20,05(43)=28,96, c20,95(43) =59,30.
Следовательно, НДГ для дисперсии
θ0=(n–1)S2/c20,95(43)= 43×0,91/59,30= 0,66,
и ВДГ
θ1=(n–1)S2/c20,05(43)=43×0,91/28,96 = 1,36.
4.5. Доверительный интервал для вероятности
Пусть случайная величина Х имеет только два возможных значения: 0 и 1. В результате проведения достаточно большого количества наблюдений эта случайная величина приняла единичное значение n раз. Необходимо при заданной надежности 1–a определить доверительный интервал для вероятности р, оценка которой соответствует частоте w* = m*/n.
Оценка w* вероятности р является состоятельной, эффективной и несмещенной. Если оцениваемая вероятность не слишком мала и не слишком велика (0,05< p <0,95), то можно считать, что распределение случайной величины w* близко к нормальному. Этим допущением можно пользоваться, если пр и п(1–р) больше четырех. Параметры нормального распределения частоты m*x = р, S2 = р(1–р)/п (дисперсия S2(m) количества успехов m составляет величину пр(1–р), а дисперсия частоты S2(m)/п2. Тогда по аналогии с определением доверительного интервала для математического ожидания нормально распределенной величины w* можно записать
ε = |w*– p| = u1– a/2(S2 (т) )0,5 =u1– a/2(р(1–р)/п)0,5,
где u1– a/2 – квантиль стандартизованного нормального распределения.
Чтобы связать доверительный интервал с исходными параметрами n, w* и u1– a/2, возведем выражение для ε в квадрат, т. е. преобразуем равенство к виду
(w*–p)2=u21– a/2(1–p)p/п.
Доверительные границы можно получить, решив это уравнение второй степени
p2,1 ={nw* + 0,5u21– a/2 ± u1– a/2 [nw*(1–w*) + 0,25u21– a/2]0,5}/(п + u21– a/2). (4.5)
С увеличением объема выборки (пw* >200, nw*(1–w*)>200) такими слагаемыми как u21– a/2, 0,5u21– a/2 и 0,25u21– a/2 можно пренебречь, тогда приближенно
p1 =w*– u1– a/2 [w*(1–w*)/n]0,5,
p2 =w* + u1– a/2 [w*(1–w*)/n]0,5. (4.6)
Более общие результаты получены с учетом того, что случайная величина w* распределена по биномиальному закону
(4.7)
где Cnk – число сочетаний из n по k.
Исходя из этого положения, для практического применения получены значения нижней р1 и верхней р2 доверительных границ
(4.8)
. (4.9)
где– квантиль распределения хи-квадрат уровняX с числом степеней свободы k.
Формулы (4.8) и (4.9) можно применять и в тех случаях, когда частость w* события близка (равна) нулю или близка (равна) количеству экспериментов п соответственно. В первом случае НДГ р1 принимается равной нулю и рассчитывается только ВДГ р2. Во втором случае рассчитывается НДГ р1, а верхняя граница р2 =1.
Пример 4.5. В результате наблюдения за 58 изделиями не было зафиксировано ни одного отказа. Определить доверительный интервал для вероятности отказа с надежностью 0,9.
Решение. Нижнюю доверительную границу р1 следует принять равной нулю, ВДГ
Таким образом, доверительный интервал с нижней границей 0 и верхней границей 0,05 с вероятностью 0,9 накрывает истинное значение вероятности отказа изделий.