- •1 Виды и этапы научных исследований
- •1.1Виды научно-исследовательских работ в текстильной промышленности
- •1.2Основные особенности механико-технологических процессов и методов их исследования
- •1.3Этапы научно-исследовательских работ (нир)
- •1.4Выбор темы для исследовательской работы
- •1.5Подготовительный этап нир
- •1.5.1Изучение библиографии
- •1.5.2Методическая программа нир и ее содержание
- •1.5.3Рабочая программа нир и ее содержание
- •1.6Математическое описание технологических процессов. Математические модели
- •1 Число аргументов, от которых зависят параметры процесса или оператор системы:
- •1.7Методы получения математических моделей
- •2Эксперимент как предмет исследования
- •2.1Понятие эксперимента
- •2.2Классификация видов экспериментальных исследований
- •3Краткие сведения из теории вероятностей и математической статистики
- •3.1Случайные величины и параметры их распределений
- •3.2Нормальный закон распределения
- •4 Предварительная обработка экспериментальных данных
- •4.1Вычисление параметров эмпирических распределений. Точечное оценивание
- •4.2Термины и определения в области обработки экспериментальных данных
- •4.3Оценивание с помощью доверительного интервала
- •4.3.1Построение доверительного интервала для математического ожидания
- •4.3.2Построение доверительного интервала для дисперсии
- •4.3.3Отсев грубых погрешностей
- •5 Сравнение числовых характеристик по выборочным данным
- •5.1Понятие о статистических гипотезах и критериях оценки
- •5.2Сравнение дисперсии свойств нового продукта со стандартной дисперсией
- •5.3Сравнение двух дисперсий нормальных генеральных совокупностей
- •5.4Сравнение выборочной средней с теоретически предполагаемым средним или стандартным значением
- •5.5Сравнение двух средних больших независимых выборок
- •5.6Сравнение двух средних из нормально распределенных генеральных совокупностей
4.3Оценивание с помощью доверительного интервала
В отличие от точечной оценки, интервальная оценка позволяет получить вероятностную характеристику точности оценивания неизвестного параметра.
Идея оценивания с помощью доверительного интервала заключается в том, чтобы в окрестности точечной оценки попытаться построить такой интервал (доверительный интервал), который с некоторой, отличной от нуля, вероятностью (доверительной вероятностью) накрыл бы оцениваемый параметр распределения.
Доверительный интервал – интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения.
Доверительная вероятность – вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным.
Оценивание с помощью доверительного интервала – способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.
Предположим, что для оценки параметра Θ удалось найти две функции Θ1*(x1, x2, ..., xn) и Θ2*(x1, x2, ..., xn), такие, что при всех (x1, x2, ..., xn) и при любых значениях Θ выполняется условие
Это означает, что действительное значение параметра Θ находится в интервале значений (Θ1*;Θ2*) с вероятностью P.
Интервал (Θ1*;Θ2*) как раз и называют доверительным интервалом для неизвестного параметра Θ, а соответствующую ему вероятность P{Θ1*≤Θ≤Θ2*} - доверительной вероятностью (или надежностью) P=1-α, где α - уровень значимости. Если, к примеру, α=0,05, то строится доверительный интервал с доверительной вероятностью 0,95 (или 95-процентный доверительный интервал).
Вероятностное утверждение P{Θ1*≤Θ≤Θ2*} не следует понимать таким образом, что параметр Θ есть случайная величина, которая с вероятностью P попадет в интервал между Θ1* и Θ2*.
Любой параметр распределения Θ (в отличие от его оценок) – это детерминированная величина, неизвестная нам, но имеющая строго определенное, фиксированное значение (которое, по крайней мере, теоретически, может быть найдено при исследовании всей генеральной совокупности). Границы Θ1* и Θ2* (как некоторые функции от результатов наблюдений) есть случайные величины. Поэтому утверждение P{Θ1*≤Θ≤Θ2*} = P означает, что для данного доверительного интервала (Θ1*;Θ2*) вероятность содержать значение Θ равна P.
4.3.1Построение доверительного интервала для математического ожидания
Как уже было
отмечено, наилучшей (состоятельной,
несмещенной и эффективной) точечной
оценкой математического ожидания
случайной величины Х с нормальным
законом распределения является ее
выборочное среднее арифметическое
.
Поэтому за основу построения доверительного
интервала для математического ожидания
обычно выбирается именно эта точечная
оценка данного параметра. Задача
получения интервальной оценки в этом
случае заключается в поиске границ
такого интервала, который с заданной
доверительной вероятностью PMx
накроет действительное значение
математического ожидания Mx (Рисунок 6).
Рисунок 6 - Построение доверительного интервала для математического ожидания
При построении любой интервальной оценки, в том числе и для математического ожидания, необходимо знать распределение той точечной оценки (случайной величины), которая берется за основу для построения доверительного интервала.
В математической статистике доказано, что выборочное среднее арифметическое из n независимых результатов наблюдений случайной величины, распределенной нормально с параметрами Mx и σx2, также подчиняется нормальному закону распределения с параметрами:
Подтвердить справедливость первого равенства можно тем, что выборочное среднее арифметическое - это несмещенная оценка математического ожидания, следовательно, по определению, математическое ожидание этой оценки (выборочного среднего арифметического) равно значению оцениваемого параметра (математическому ожиданию).
Логика возникновения второго соотношения: если подсчитать выборочное среднее арифметическое по нескольким выборкам одного и того же объема, а затем найти дисперсию полученных значений, то вероятнее всего предположить, что разброс (дисперсия) выборочных средних арифметических будет меньше, чем разброс (дисперсия) самих опытных данных.
Если заранее известна дисперсия σx2, то доверительный интервал для математического ожидания Mx рассчитывается достаточно просто. Его границы можно найти, например, следующим образом.
Поскольку случайная величина X подчиняется нормальному закону распределения с параметрами M(x) = Mx и σ2(x) = σx2/n , то соответствующая ей приведенная случайная величина
.
имеет нормированный стандартный нормальный закон распределения.
Квантиль
порядка P такой случайной величины,
как
,
определяется как:
Далее
Если в последнем соотношении неравенство, стоящее под знаком вероятности, разрешить относительно Mx, то получим
Если
,
то
и, следовательно,
,
и, аналогично, если
то
и, следовательно,
.
Таким образом, вероятность того, что выполняется неравенство
будет P = P2 – P1 = 1- α.
Если для примера принять P1= 0,025 и P2 = 0,975 (P=0,975–0,025 =0,95; α=0,05), то, поскольку z0,025 = z1-0,975 = - z0,975 ,а z0,975 = 1,96 (Таблица 4 или используя НОРМСТОБР(0,975) = 1,959961), получим
т.е. при многократном извлечении выборок (объемом n каждая) из нормально распределенной генеральной совокупности (с параметрами Mx и σx2) можно построить последовательность соответствующих данным выборкам интервалов, причем примерно 95% этих интервалов будут включать в себя (накрывать) истинное значение математического ожидания Mx.
При построении доверительного интервала для математического ожидания обычно принимают P1= α/2 и P2 = 1 – α/2, т.е. рассматривают симметричные границы относительно выборочного среднего арифметического. В инженерных приложениях для значений α обычно выбирают α = 0,1 или α = 0,05, реже α = 0,01, т.е. строят такие доверительные интервалы, которые в 90 или 95% (реже 99%) случаев накрывают математическое ожидание.
Таблица 4 - Квантили стандартного нормального распределения
Так как z α/2= - z1- α/2, то получаем, что вероятность выполнения неравенства
равна P = 1 – α/2 - α/2 = 1- α.
Следовательно,
интервал является доверительным
интервалом для математического ожидания
Mx случайной величины с
нормальным законом распределения,
построенным с доверительной вероятностью
P = 1- α. Границы этого интервала равны
и
,
а половина его ширины (Рисунок 6)
.
Пример 4.2. Было
проведено исследование длины мотков
пряжи. В процессе исследования рассмотрены
n = 49 мотков и получены следующие данные:
средняя длина мотка
,
σ(x) =26. Необходимо определить доверительный
интервал
с надежностью Р=0,95, объем выборки
n, который необходимо выполнить, чтобы
точность статистических выводов δ ≤
2.
Рассчитаем доверительный интервал:
.
195,72≤ Mx≤ 210,28.
Необходимый объем выборки для δ = 2 составит
На практике, как правило, число измерений конечно и не превышает 10…30. При таком малом числе наблюдений фактическая дисперсия σx2 неизвестна, поэтому при построении доверительного интервала для математического ожидания Mx используют выборочную дисперсию Sx2.
Рассматриваемая величина может и не подчиняться нормальному распределению, а, например, распределению Стьюдента или гамма распределению, в этом случае формула определения доверительного интервала остается прежней за исключением того, что уже используется квантиль соответствующего распределения, а не нормального.
