- •§ 2. Закон распределения вероятностей дискретной двумерной случайной величины
- •§ 3. Функция распределения двумерной случайной величины.
- •§ 4. Свойства функции распределения двумерной случайной величины
- •§ 5. Вероятность попадания случайной точки в полуполосу
- •§ 6. Вероятность попадания случайной точки в прямоугольник
- •§ 7. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •§ 8. Нахождение функции распределения системы по известной плотности распределения
- •§ 9. Вероятностный смысл двумерной плотности вероятности.
- •§ 10. Вероятность попадания случайной точки в произвольную область
- •§11. Свойства двумерной плотности вероятности
- •§ 12. Отыскание плотностей вероятности составляющих двумерной случайной величины
- •§ 13. Условные законы распределения составляющих системы дискретных случайных величин
- •§ 14. Условные законы распределения составляющих системы непрерывных случайных величин
- •§ 15. Условное математическое ожидание
- •§ 16. Зависимые и независимые случайные величины
- •§ 17. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •§ 18. Коррелированность и зависимость случайных величин
- •§ 19. Нормальный закон распределения на плоскости
- •§ 20. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •§ 21. Линейная корреляция. Нормальная корреляция
- •§ 1. Задачи математической статистики
- •§ 2. Краткая историческая справка
- •§ 3. Генеральная и выборочная совокупности
- •§ 4 Повторная и бесповторная выборки. Репрезентативная выборка
- •§ 5. Способы отбора
- •§ 6. Статистическое распределение выборки
- •§ 7. Эмпирическая функция распределения
- •§ 8. Полигон и гистограмма
- •§ 1. Статистические оценки параметров распределения
- •§ 2. Несмещенные, эффективные и состоятельные оценки
- •§ 3. Генеральная средняя
- •§ 4. Выборочная средняя
- •§ 5. Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •§ 6. Групповая и общая средние
- •§ 7. Отклонение от общей средней и его свойство
- •§ 8. Генеральная дисперсия
- •§ 9. Выборочная дисперсия
- •§ 10. Формула для вычисления дисперсии
- •§11. Групповая, внутригрупповая, межгрупповая и общая дисперсии
- •§ 12. Сложение дисперсий
- •§ 13. Оценка генеральной дисперсий по исправленной выборочной
- •§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
- •§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
- •§ 16. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
- •§ 17. Оценка истинного значения измеряемой величины
- •§ 18. Доверительные интервалы для оценки среднего квадратического отклонения σ нормального распределения
- •§ 19. Оценка точности измерений
- •§ 20. Оценка вероятности (биномиального распределения) по относительной частоте
- •§ 21. Метод моментов для точечной оценки параметров распределения
- •§ 22. Метод наибольшего правдоподобия
- •§ 23. Другие характеристики вариационного ряда
- •§ 1. Условные варианты
- •§ 2. Обычные, начальные и центральные эмпирические моменты
- •§ 3. Условные эмпирические моменты. Отыскание центральных моментов по условным
- •§ 4. Метод произведений для вычисления выборочных средней и дисперсии
- •§ 5. Сведение первоначальных вариант к равноотстоящим
- •§ 6. Эмпирические и выравнивающие (теоретические) частоты
- •§ 7. Построение нормальной кривой по опытным данным
- •§ 8. Оценка отклонения эмпирического распределения от нормального. Асимметрия и эксцесс
- •§ 1. Функциональная, статистическая и корреляционная зависимости
- •§ 2. Условные средние
- •§ 3. Выборочные уравнения регрессии
- •§ 4. Отыскание параметров выборочного уравнения прямой линии среднеквадратичной регрессии по не сгруппированным данным
- •§ 5. Корреляционная таблица
- •§ 6. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным
- •§ 7. Выборочный коэффициент корреляции
- •§ 8. Методика вычисления выборочного коэффициента корреляции
- •§ 9. Пример на отыскание выборочного уравнения прямой линии регрессии
- •§ 10. Предварительные соображения к введению меры любой корреляционной связи
- •§ 11. Выборочное корреляционное отношение
- •§ 12. Свойства выборочного корреляционного отношения
- •§ 13. Корреляционное отношение как мера корреляционной связи. Достоинства и недостатки этой меры
- •§ 14. Простейшие случаи криволинейной корреляции
- •§ 15. Понятие о множественной корреляции
- •§ 1. Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы
- •§ 2. Ошибки первого и второго рода
- •§ 3. Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия
- •§ 4. Критическая область. Область принятия гипотезы. Критические точки
- •§ 5. Отыскание правосторонней критической области
- •§ 6. Отыскание левосторонней и двусторонней критических областей
- •§ 7. Дополнительные сведения о выборе критической области. Мощность критерия
- •§ 8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •§ 9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •§ 10. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- •§ 11( Сравнение двух средних произвольно распределенных генеральных совокупностей (большие независимые выборки)
- •§ 12. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- •§ 13. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности а. Дисперсия генеральной совокупности известна.
- •§ 14. Связь между двусторонней критической областью и доверительным интервалом
- •§ 15. Определение минимального объема выборки при сравнении выборочной и гипотетической генеральной средних
- •§ 16. Пример на отыскание мощности критерия
- •§ 17. Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки)
- •§ 18. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
§14. Точность оценки, доверительная вероятность (надежность). Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше,- точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).
Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно, что Θ* тем точнее определяет параметр Θ, чем меньше абсолютная величина разности |Θ - Θ*|. Другими словами, если δ>0 и |Θ - Θ*|<δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.
Однако статистические методы не позволяют категорически утверждать, что оценка Θ * удовлетворяет неравенству |Θ - Θ*|<δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство |Θ - Θ*|<δ. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что |Θ - Θ*|<δ, равна γ:
Р[|Θ - Θ*|<δ]= γ.
Заменив неравенство |Θ - Θ*|<δ равносильным ему двойным неравенством -δ <Θ - Θ*< δ, или Θ*- δ <Θ< Θ* + δ, имеем
Р[Θ* - δ <Θ< Θ* + δ] = γ.
Это соотношение следует понимать так: вероятность того, что интервал(Θ*-δ, Θ*+δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.
Доверительным называют интервал (Θ*-δ, Θ*+δ), который покрывает неизвестный параметр с заданной надежностью γ.
Замечание. Интервал (Θ*-δ, Θ*+δ) имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения Θ*. Следовательно, от выборки к выборке будут изменяться и концы доверительного интервала, т. е. доверительные границы сами являются случайными величинами - функциями от х1, x2, ..., хn.
Так как случайной величиной является не оцениваемый параметр Θ, а доверительный интервал, то более правильно говорить не о вероятности попадания Θ в доверительный интервал, а о вероятности того, что доверительный интервал покроет Θ.
Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.
§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ.
Будем рассматривать выборочную среднюю как случайную величину(изменяется от выборки к выборке) и выборочные значения признаках1, x2, ...,хn - как одинаково распределенные независимые случайные величины Х1, Х2, ...,Хn (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение - σ.
Примем без доказательства, что если случайная величина X распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. Параметры распределения таковы (см. гл. VIII, § 9):
M()=a, .
Потребуем, чтобы выполнялось соотношение
Р(|Х - а| < δ) = γ,
где γ - заданная надежность.
Пользуясь формулой (см. гл. XII, § 6)
Р(|Х-а| < δ) = 2Ф(δ/σ),
заменив X на и σ на , получим
Р(|Х-а|) <δ) = 2Ф(δ) = 2Ф (t),
где t = δ.
Найдя из последнего равенства , можем написать
Р (|—а | < ) = 2Ф(t).
Приняв во внимание, что вероятность P задана и равна γ, окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )
Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал (, ) покрывает неизвестный параметр а; точность оценки .
Итак, поставленная выше задача полностью решена. Укажем еще, что число t определяется из равенства 2Ф(t) = γ. или Ф(t)= γ /2; по таблице функции Лапласа (см. приложение 2) находят аргумент t, которому соответствует значение функции Лапласа, равное γ /2.
Замечание 1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:
1) при возрастании объема выборки п число δ убывает и, следовательно, точность оценки увеличивается;
2) увеличение надежности оценки γ = 2Ф(t) приводит к увеличению t(Ф (t) — возрастающая функция), следовательно, и к возрастанию δ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.
Пример. Случайная величина X имеет нормальное распределение с известным средним квадратическим отклонением σ = 3. Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним , если объем выборки n = 36 и задана надежность оценки γ= 0,95.
Решение. Найдем t. Из соотношения 2Ф(t)=0,95 получим Ф(t) = 0,475. По таблице приложения 2 находим t=1,96.
Найдем точность оценки:
.
Доверительный интервал таков: (-0,98; + 0,98). Например, если = 4,1, то доверительный интервал имеет следующие доверительные границы:
- 0,98 = 4,1- 0,98 = 3,12; + 0,98 = 4,1 + 0,98 = 5,08.
Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было бы ошибочным написать Р(3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.
Поясним смысл, который имеет заданная надежность. Надежность γ = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.
Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью γ, то минимальный объем выборки, который обеспечит эту точность, находят по формуле
(следствие равенства ).