- •1 Виды и этапы научных исследований
- •1.1Виды научно-исследовательских работ в текстильной промышленности
- •1.2Основные особенности механико-технологических процессов и методов их исследования
- •1.3Этапы научно-исследовательских работ (нир)
- •1.4Выбор темы для исследовательской работы
- •1.5Подготовительный этап нир
- •1.5.1Изучение библиографии
- •1.5.2Методическая программа нир и ее содержание
- •1.5.3Рабочая программа нир и ее содержание
- •1.6Математическое описание технологических процессов. Математические модели
- •1 Число аргументов, от которых зависят параметры процесса или оператор системы:
- •1.7Методы получения математических моделей
- •2Эксперимент как предмет исследования
- •2.1Понятие эксперимента
- •2.2Классификация видов экспериментальных исследований
- •3Краткие сведения из теории вероятностей и математической статистики
- •3.1Случайные величины и параметры их распределений
- •3.2Нормальный закон распределения
- •4 Предварительная обработка экспериментальных данных
- •4.1Вычисление параметров эмпирических распределений. Точечное оценивание
- •4.2Термины и определения в области обработки экспериментальных данных
- •4.3Оценивание с помощью доверительного интервала
- •4.3.1Построение доверительного интервала для математического ожидания
- •4.3.2Построение доверительного интервала для дисперсии
- •4.3.3Отсев грубых погрешностей
- •5 Сравнение числовых характеристик по выборочным данным
- •5.1Понятие о статистических гипотезах и критериях оценки
- •5.2Сравнение дисперсии свойств нового продукта со стандартной дисперсией
- •5.3Сравнение двух дисперсий нормальных генеральных совокупностей
- •5.4Сравнение выборочной средней с теоретически предполагаемым средним или стандартным значением
- •5.5Сравнение двух средних больших независимых выборок
- •5.6Сравнение двух средних из нормально распределенных генеральных совокупностей
4.2Термины и определения в области обработки экспериментальных данных
Наблюдаемая единица – действительный или условный предмет, над которым проводят серию наблюдений.
Результат наблюдения – характеристика свойств единицы, полученная опытным путем.
Генеральная совокупность – множество всех рассматриваемых единиц.
Другими словами, генеральная совокупность - это такое воображаемое, в пределе бесконечно большое число предметов, над которыми можно провести наблюдения при неограниченном числе повторений одного и того же комплекса условий.
В примере 4.1 под генеральной совокупностью можно понимать, допустим, все участки пряжи, в которых в принципе можно было бы замерить прочность, либо вообще все мотки пряжи, которые когда-либо изготавливались или еще будут производиться по соответствующему стандарту.
В распоряжении исследователя никогда нет генеральной совокупности, и он может изучать только ее часть – выборку, причем всегда ограниченного объема.
Выборка – любое конечное подмножество генеральной совокупности, предназначенное для непосредственных исследований.
Объем – количество единиц в выборке.
По выборке невозможно однозначно определить ни функцию распределения, ни плотность распределения, ни параметры распределения (например, математическое ожидание или дисперсию) случайной величины, поскольку для этого потребуется неограниченное (бесконечно большое) количество результатов наблюдений, т.е. необходимо исследовать всю генеральную совокупность, поэтому проводится оценивание случайной величины.
Оценивание – определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений.
Идея оценивания должна быть вполне понятна из соображений ежедневной практики. Ведь для того, чтобы, например, купить пару килограмм яблок, у нас никогда не возникает желание съесть все имеющиеся у данного продавца фрукты (изучить всю генеральную совокупность), мы пробуем дольку только лишь одного яблока (исследуем выборку), определяем ее вкус (оцениваем) и принимаем решение, стоит нам или нет покупать именно эти яблоки.
Исходными данными при оценивании, как и при проверке любых предположений (статистических гипотез), касающихся неизвестного распределения случайной величины могут быть лишь только те результаты наблюдений, которые были получены в ходе проведения опытов (на выборке ограниченного объема). Причем предварительная обработка экспериментальных данных обычно начинается с подсчета тех или иных функций от результатов наблюдений (статистик).
Статистика – функция результатов наблюдений, используемая для оценки параметров распределения и (или) для проверки статистических гипотез.
По выборке невозможно найти параметры распределения случайной величины (поскольку для этого требуется бесконечное количество результатов наблюдений – изучение всей генеральной совокупности), поэтому, имея в своем распоряжении всегда ограниченный объем экспериментальных данных, исследователю остается довольствоваться только лишь получением некоторых оценок.
Оценка – статистика, являющаяся основой для оценивания неизвестного параметра распределения.
Для одного и того же параметра распределения может быть предложено несколько оценок.
В примере 4.1 рассматривалось четыре различных оценки для такого параметра распределения прочности, как математическое ожидание данной случайной величины (выборочное среднее арифметическое, выборочное среднее геометрическое, середина размаха и средний член вариационного ряда).
Поэтому при оценивании всегда возникает проблема выбора наилучшей оценки из всех возможных оценок данного параметра.
Причем, когда формулируются те или иные требования, по которым оценку целесообразно считать наилучшей, прежде всего, учитывается тот факт, что любая оценка – это также случайная величина.
Из тех соображений, что любая оценка Θ* какого-либо параметра распределения Θ случайной величины тоже есть случайная величина, к оценкам предъявляются требования состоятельности, несмещенности и эффективности.
Состоятельная оценка – оценка, сходящаяся по вероятности к значению оцениваемого параметра при безграничном возрастании объема выборки.
где Θ - оцениваемый параметр; Θ* - оценка; n - объем выборки.
Иными словами, для состоятельной оценки Θ* отклонение ее от Θ на малую величину ε и более становится маловероятным при большом объеме выборки.
Исследователей в первую очередь интересуют те оценки, которые хотя бы в пределе (при проведении бесконечно большого количества наблюдений) давали им возможность определить интересующий их параметр распределения, т.е. чтобы оценки прежде всего были состоятельными. Однако следует отметить, что на практике приходится оценивать неизвестные параметры и при малых объемах выборки.
Естественным является требование, при выполнении которого оценка не дает систематической погрешности в сторону завышения (или занижения) истинного значения параметра Θ .
Несмещенная оценка – оценка, математическое ожидание которой равно значению оцениваемого параметра:
M(Θ*)=Θ.
Удовлетворение требованию несмещенности позволяет устранить систематическую погрешность оценки параметра, которая зависит от объема выборки n и в случае состоятельности оценки стремится к нулю при n→∞.
Эффективная оценка – несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.
или
где Θi* – любая другая оценка.
Иными словами, дисперсия эффективной оценки параметра в некотором классе является минимальной среди дисперсий всех оценок из рассматриваемого класса несмещенных оценок.
Из всех состоятельных и несмещенных оценок следует предпочесть такую, которая оказывается наиболее близкой к оцениваемому параметру (эффективной), однако используемые в математической статистике оценки не всегда одновременно удовлетворяют всем трем перечисленным выше требованиям.
После того как исследователь выбрал и подсчитал состоятельную, несмещенную и эффективную оценки интересующего его параметра распределения исследуемой случайной величины, первое и наиболее простое, что он может сделать, так это принять значение оценки за неизвестное значение параметра распределения, т.е. выполнить точечное оценивание.
Точечное оценивание – способ оценивания, заключающийся в том, что значение оценки принимают как неизвестное значение параметра распределения.
Рассмотрим некоторые точечные оценки основных параметров распределения для непрерывной случайной величины, не противоречащей нормальному закону распределения.
Выборочное среднее арифметическое – сумма значений рассматриваемой величины, полученных по результатам испытания выборки, деленная на ее объем.
где n – объем выборки; хi– результат измерения i-й единицы.
В математической статистике доказано, что выборочное среднее арифметическое является наилучшей (состоятельной, несмещенной и эффективной) оценкой математического ожидания случайной величины, подчиняющейся нормальному закону распределения.
В примере 4.1, даже если предположить, что прочность пряжи не противоречит нормальному закону распределения, из четырех полученных оценок предпочтение следует отдать значению (выборочному среднему арифметическому) как наилучшей оценке для математического ожидания данной случайной величины. Три другие рассмотренные в этом примере оценки также являются состоятельными для математического ожидания. Однако среднее геометрическое – это смещенная оценка (она будет наилучшей только тогда, когда случайная величина подчиняется так называемому логарифмически нормальному распределению, т.е. когда закону Гаусса подчиняется не сама случайная величина, а ее логарифм). Середина размаха и средний член вариационного ряда – это хотя и несмещенные оценки для математического ожидания, но их эффективность, как показано в математической статистике, меньше, чем у выборочного среднего арифметического.
Выборочная дисперсия или - сумма квадратов отклонений выборочных результатов наблюдений от их выборочного среднего арифметического в выборке, деленная на n-1 или на n.
или
Оценки
,
и являются состоятельными, несмещенными
и, в случае нормального распределения,
асимптотически эффективными оценками
дисперсии σ2.
Для практических расчетов первое выражение можно преобразовать к виду
В условиях примера
4.1 выборочная дисперсия прочность пряжи
равна
.
Выборочное
среднее квадратичное отклонение
или
–
положительный квадратный корень из
выборочной дисперсии:
или
В примере 4.1 .
Зная выборочное
среднее арифметическое
и выборочное среднее квадратичное
отклонение
,
можно подсчитать меру относительной
изменчивости случайной величины –
выборочный коэффициента вариации
ν - по формуле
или, в процентах,
Для примера 4.1 выборочный коэффициент вариации прочности равен ν=26,98/230= =0,117, или 11,7%.
Через выборочное среднее арифметическое и выборочное среднее квадратическое отклонение могут быть сделаны точечные оценки для любых значений функции распределения, а также для вероятности попадания случайной величины в любой из заданных интервалов.
Так, для какого-либо значения функции нормального распределения, поскольку
в качестве точечной оценки F(x) можно использовать
Точечную оценку вероятности попадания случайной величины Х с нормальным законом распределения в любой из заданных интервалов (х1, х2) можно найти по формуле
Точечная оценка квантили xр порядка р для нормального распределения равна
