- •1. Эксперимент как предмет исследования
- •1.1. Классификация видов экспериментальных исследований
- •1.2. Погрешности результатов исследований
- •2. Краткие сведения из теории вероятностей и математической статистики
- •2.1. Вероятность случайных событий, их характеристики
- •2.2. Нормальный закон распределения
- •3.1. Вычисление характеристик эмпирических распределений
- •3.2. Статистические гипотезы
- •3.3. Отсев грубых погрешностей
- •3.4. Определение доверительных интервалов для исследуемых величин
- •3.4.1. Оценка доверительного интервала для математического ожидания
- •3.4.2. Оценка доверительного интервала для дисперсии
- •3.5. Сравнение двух рядов наблюдений
- •3.5.1. Сравнение средних значений
- •3.5.2. Сравнение двух дисперсий
- •3.5.3. Проверка однородности нескольких дисперсий
- •3.6. Определение необходимого количества измерений
- •3.7. Проверка гипотезы нормального распределения
- •3.8. Преобразование распределений к нормальному
- •4. Анализ результатов пассивного эксперимента. Эмпирические зависимости
- •4.1. Характеристика видов связей между рядами наблюдений
- •4.2. Определение коэффициентов уравнения регрессии
- •4.3. Определение тесноты связи между случайными величинами
- •4.4. Линейная регрессия от одного фактора
- •4.5. Регрессионный анализ
- •4.5.1. Проверка адекватности модели
- •4.5.2. Проверка значимости коэффициентов уравнения регрессии
- •4.6. Линейная множественная регрессия
- •4.7. Нелинейная регрессия
- •5.1. Оценка погрешностей определения величин функций
- •5.2. Обратная задача теории экспериментальных погрешностей
- •5.3.Определение наивыгоднейших условий эксперимента
- •6. Методы планирования экспериментов. Логические основы
- •6.1. Основные определения и понятия
- •6.2. Пример хорошего и плохого эксперимента
- •6.3. Планирование первого порядка
- •6.3.1. Выбор основных факторов и их уровней
- •6.3.2.Планирование эксперимента
- •6.3.3. Определение коэффициентов уравнения регрессии
- •6.3.4. Статистический анализ результатов эксперимента
- •6.3.5. Дробный факторный эксперимент
- •6.3.6. Разработка математической модели гидравлического режима методической печи
- •6.4. Планы второго порядка
- •6.4.1. Ортогональные планы второго порядка
- •6.4.2. Ротатабельные планы второго порядка
- •6.5. Планирование экспериментов при поиске оптимальных условий
- •6.5.1. Метод покоординатной оптимизации (Гаусса - Зейделя)
- •6.5.2. Метод крутого восхождения (Бокса-Уилсона)
- •6.5.3. Симплексный метод планирования
- •7. Компьютерные методы статистической обработки результатов инженерного эксперимента
- •7.1. Статистические функции Microsoft Excel
- •7.2.1. Общая структура системы
- •7.2.2. Возможные способы взаимодействия с системой
- •7.2.3. Ввод данных
- •7.2.4. Вывод численных и текстовых результатов анализа
- •7.2.5. Статистические процедуры системы statistica
- •7.2.6. Структура диалога пользователя в системе statistica
- •7.2.7. Примеры использования системы statistica
3.1. Вычисление характеристик эмпирических распределений
При рассмотрении основных положений теории вероятностей и математической статистики, определении параметров распределения мы исходили из предположения, что осуществляется достаточно большое, в пределе бесконечное число испытаний nN (N), что практически осуществить невозможно. Однако имеются методы, которые позволяют оценить эти параметры по выборке (части) случайных событий.
Генеральнойназывается совокупность всех мыслимых значений наблюдений, которые мы могли бы сделать при данном комплексе условий. Другими словами все возможные реализации случайной величины, теоретически в пределе их может быть бесконечное число (N). Часть этой совокупности nN, т.е. результаты ограниченного ряда наблюдений x1,x2,...,xnслучайной величины, можно рассматривать каквыборочноезначение случайной величины (например, при определении химического состава сплавов, их механической прочности и т.п.). Если все слитки данной марки стали, чугуна, сплава разделать на образцы и исследовать их химический состав, механическую прочность и другие физические характеристики, то имели бы генеральную совокупность наблюдений. Фактически доступно, возможно (целесообразно), исследовать свойства весьма ограниченного числа образцов – это и есть выборка их генеральной совокупности.
По результатам такого ограниченного числа наблюдений можно определить точечные оценкизаконов распределения и их параметров. Оценкой (или выборочной статистикой)* какого-либо параметраназывается произвольная функция*=*(x1, x2,..., xn) наблюдаемых значений x1, x2,..., xn, в той или иной степени отражающая действительное значение параметра.
Если говорить о характеристиках распределений вероятностей, то характеристики теоретических распределений (Mx,x2, Mo, Me) можно рассматривать как характеристики, существующие в генеральной совокупности, а характеризующие эмпирическое распределение – как выборочные их характеристики (оценки). Числовые параметры для оценки Mx,x2и др. – называются иногдастатистиками.
Для оценки математического ожидания используется среднеарифметическое (среднее значение) ряда измерений по выборке:
(3.1)
где хi– реализация либо дискретной, либо отдельная точка для непрерывной случайной величины; n – объем выборки.
Для характеристики разброса случайной величины используется оценка теоретической дисперсии – выборочные дисперсии (см.рис.2.4):
(3.2а)
(3.2б)
Неотрицательное значение квадратного корня из выборочной дисперсии – это выборочное стандартное отклонение(выборочное среднеквадратичное) отклонение
(3.3а)
(3.3б)
Следует отметить, что в любой задаче, связанной с выполнением измерений, возможны два способа получения оценки значения x2.
При использовании первого способа снимается последовательность показаний прибора и путем сравнения полученных результатов с известнымили калиброванным значением измеряемой величины находится последовательность отклонений. Затем полученная последовательность отклонений используется для вычисления среднего квадратичного отклонения по формуле (3.3а).
Второй способ получения оценки значения x2состоит в определениисреднего арифметического, т.к. в этом случае действительное (точное) значение измеряемой величины неизвестно. В этом случае целесообразно использовать другую, формулу для нахождения среднеквадратичного отклонения (3.2б, 3.3б). Деление на (n-1) производится по той причине, что наилучшая оценка, получаемая путем усреднения массива Х, будет отличаться от точного значения на некоторую величину, если рассматривается выборка, а не вся генеральная совокупность. В этом случае сумма квадратов отклоненийбудет несколько меньше, чем при использовании истинного среднего. При делении на (n-1) вместо n эта погрешность будет частично скорректирована. В некоторых руководствах по математической статистике рекомендуется при вычислении выборочного среднеквадратичного отклонения всегда делить на, хотя иногда этого делать не следует.Нужно делить на лишь в тех случаях, когда истинное значение не было получено независимым способом.
Выборочное значение коэффициента вариации, являющееся мерой относительной изменчивости случайной величины, вычисляют по формуле
(3.4а)
или в процентах
(3.4б)
Та из выборок имеет большее рассеяние, у которой вариация больше.
К оценкам , Sx2предъявляются требования состоятельности, несмещенности и эффективности.
Оценка параметра * называетсясостоятельной, если по мере роста числа наблюдений n (т.е. nN в случае конечной генеральной совокупности объема N и при nв случае бесконечной генеральной совокупности) она стремится к оцениваемому теоретическому значению параметра
Например, для дисперсии
(3.5)
Оценка параметра * называетсянесмещенной, если ее математическое ожидание M(*) при любом n асимптотически стремится к истинному значению M(*)=. Удовлетворение требованию несмещенности устраняет систематическую погрешность оценки параметра, которая зависит от объема выборки n и в случае состоятельности стремится к нулю при n. Выше было определены две оценки для дисперсиии. В случае неизвестного значения математического ожидания (истинного значения измеряемой величины) обе оценки состоятельны, но только вторая (3.2б), (3.3б), как было показано ранее, является несмещенной. Требование несмещенности особенно важно при малом числе наблюдений, так как при n.
Оценка параметра 1* называетсяэффективной, если среди прочих оценок того же параметра2*,3* она обладает наименьшей дисперсией.
(3.6)
или
(3.6a)
где i* – любая другая оценка.
Так, если имеется выборка х1, х2,..., хnиз генеральной совокупности, то среднее математическое ожидание можно оценить двумя способами:
(3.7)
где xmax(n), xmin(n) – соответственно максимальное и минимальное значения случайной величины из выборки n.
Обе оценки обладают свойствами состоятельности и несмещенности, однако можно показать, что дисперсия при первом способе оценки равна Sx2/n, а во втором2Sx2/[24ln(n)], т.е. существенно больше. Таким образом, первый способ оценки математического ожидания является состоятельным, несмещенным и эффективным, а второй – только состоятельным и несмещенным. Заметим, что из всех несмещенных и состоятельных оценок следует предпочесть такую, которая оказывается наиболее близкой к оцениваемому параметру.
Заметим, что все сказанное относится к равноточным измерениям, т.е. к измерениям, которые содержат только случайную погрешность, подчиняющуюся нормальному закону распределения.