- •Федеральное агентство по образованию
- •Задачи и тематика контрольно курсовой работы.
- •Цель выполнения контрольно- курсовой работы
- •2.2. Тематика контрольно-курсовых работ
- •3. Краткие теоретические сведения
- •3.1. Первичная обработка результатов испытаний
- •3.2. Вторичная обработка результатов испытаний
- •3.2.1. Оценка генеральных среднего и дисперсии
- •3.2.2. Проверка гипотезы о тождественности эмпирической и теоретической функций распределения
- •3.2.3. Сравнение дисперсий и средних
- •3.2.4. Дисперсионный анализ
- •3.2.5. Корреляционный анализ
- •4. Порядок выполнения работы
- •Объем и оформление контрольно-курсовой работы
- •6. Библиографический список
3. Краткие теоретические сведения
В настоящее время статистическая обработка данных играет огромную роль во всех отраслях науки и техники. Она позволяет достаточно корректно найти закономерности при большом объеме данных в условиях неопределенности и при наличии случайных ошибок. При проведении статистических исследований используется выборочный метод.
Статистическую обработку полученных данных делят на первичную и вторичную. К первичной обработке относят такие процедуры, как сортировка и объединение данных, представление их в виде, удобном для последующей работы, анализ и исключение резко выделяющихся значений. Вторичная обработка представляет непосредственное вычисление параметров случайных величин: оценка средних и дисперсий, корреляционных моментов и коэффициентов регрессии, проверка статистических гипотез.
Выборочный метод в самой общей форме выглядит следующим образом. Пусть имеется некоторая большая совокупность элементов N, называемая генеральной совокупностью. Из нее извлекаются n объектов, которые образуют выборку (число n называется объемом выборки). Эти n объектов подвергаются детальному исследованию, по результатам которого требуется описать всю генеральную совокупность или какие-нибудь ее свойства. Например, с помощью выборочного метода можно установить закон распределения случайной величины и определить параметры этого распределения.
Выборочные параметры являются приближенными оценками соответствующих генеральных параметров. Точность подобных оценок определяется неравенством
![]()
где
-
оценка соответствующего параметра
(среднего, дисперсии),
- квантили
распределения соответствующего
параметра.
Квантилем
распределения случайной величины
с распределением F(x)
называется решение уравнения
,
то есть квантиль
есть такое значение случайной величины,
для которой вероятность
.
Из приведенной зависимости видно, что при γ=1 мы имеем бесконечный интервал для оценки границ параметра. Чтобы избежать этого вводят понятие доверительной вероятности, то есть вероятности, при которой оценка границ изменения параметра будет практически достоверной. В зависимости от конкретных условий принимают γ = 0,95; 0,98; 0,99; 0,999. Соответствующие доверительной вероятности квантильные границы называются доверительными границами, а образуемый ими интервал – доверительным интервалом.
3.1. Первичная обработка результатов испытаний
К первичной обработке результатов опытных данных относят такие процедуры, как сортировка и объединение данных, представление их в виде, удобном для последующей работы, анализ и исключение резко выделяющихся значений.
Совокупность наблюдений при одних и тех же условиях проведения испытаний представляется в виде некоторого статистического ряда, который называется выборкой из генеральной совокупности.
Получаемую при испытаниях выборку располагают в виде упорядоченного или вариационного возрастающего ряда: х1, х2, …, хn;
где х1 < x2 < … < xn.
При больших объемах выборок для облегчения обработки результатов статистические вариационные ряды уплотняются путем построения интервального вариационного ряда. В этом случае весь ряд разбивается на определенное число интервалов (обычно 10-20), для которых подсчитываются частоты попадания в них случайной величины х. При этом принимают, что результаты наблюдений, попавшие в один интервал, обладают одними и теми же значениями, соответствующими середине интервала. Тогда все статистические данные могут быть представлены в виде таблицы 2.
Таблица 2.
|
Интервал |
от х1 до х2 |
от х2 до х3 |
… |
от хn-1 до хn |
|
Частота |
К1 |
К2 |
… |
Kn |
|
Эмпирическая вероятность |
Р(х0
|
Р(х1
|
… |
Р(хn-1
|
При такой процедуре возникает погрешность, которая не должна превосходить половины длины выбранного интервала. По полученным статистическим данным можно получить функцию распределения F(x) и плотность распределения f(x) случайной величины х.
При статистической обработке результатов испытаний в ряде случаев наблюдается резко выделяющиеся (аномальные) значения контролируемых параметров. Природа их может быть самой различной: это и ошибки измерения, и ошибки обслуживающего персонала, и наличие дефектов в исследуемом объекте.
Во всех случаях причины появления аномальных результатов испытаний должны быть тщательно проанализированы, так как наличие резко отклоняющихся параметров, особенно при ограниченном их общем объеме, может существенно исказить результаты испытаний и привести к необъективной оценки надежности изделия. Если при анализе установлено, что имели место грубые ошибки, нарушения условий испытания и т. п., то резко выделяющиеся значения наблюдений из статистической обработке исключаются.
Аномальные наблюдения количественно устанавливаются статистическими методами с помощью различных критериев: Колмогорова, Пирсона, Смирнова и т. п. Наиболее просто это делается при нормальном распределении случайной величины на основе правила «Трех сигм». Так как появление достаточно большой ошибки маловероятно
,
(1)
то все значения
,
превышающие величину3х
можно отнести
к категории грубых, и исключить из
дальнейшего рассмотрения.
При небольшом числе испытаний для более корректного решения этого вопроса можно воспользоваться критерием Смирнова. При этом определяется статистика
,
представляющая
собой модуль разности между оценкой
среднеарифметического величины
и резко выделяющемся значением переменнойхр
отнесенный к оценке среднеквадратического
отклонения
*.
Если для
выбранного числа n
и уровня
значимости
,
величина
превосходит критическое значение
n,
то с вероятностью, большей Р
= 1 -
,можно считать
величину х*
резко выделяющейся и принадлежащей
другой генеральной совокупности.
Значения
n
приведены
в таблицах.
