Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
15_MU_Predvaritelnaya.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
16.4 Mб
Скачать

4 Пример статистической обработки данных

Статобработка состоит в упорядочении выборочных наблюдений и при необходимости в группировке этих наблюдений по достаточно малым интервалам, в вычислении частостей (относительных частот) для каждого интервала, в определении числовых характеристик статистического распределения и графическом представлении результатов в виде гистограмм, полигонов и функций распределения.

После статобработки можно получить различные статистические характеристики (статистики). Среди них важнейшими являются: среднее арифметическое (выборочное среднее, статистическое среднее, средневзвешенное); выборочная дисперсия (статистическая дисперсия); выборочное среднее квадратическое отклонение (выборочное стандартное отклонение, выборочный стандарт).

Используют также такие характеристики: мода – значение случайной величины, имеющее наибольшую вероятность (значение признака, встречающееся с наибольшей частотой); медиана – значение случайной величины, при котором вероятность появления величины Xi , меньших Xср., равна вероятности появления величин, больших X (значение признака, относительно которого эмпирическая совокупность делится на две равные по числу членов части).

Кроме среднего арифметического (статистического начального момента первого порядка) и выборочной дисперсии (статистического центрального момента второго порядка) для оценки асимметрии используют центральный момент третьего порядка, а для характеристики эксцесса (островершинности) – центральный момент четвертого порядка.

Более полными характеристиками выборки, по сравнению с ранее рассмотренными, являются эмпирическая функция распределения, гистограмма и полигон.

Гистограмма является графическим представлением статистического ряда, она показывает количество измерений, попавших в каждый, одинаковый по величине интервал.

Эмпирическая функция распределения (статистическая функция распределения, кумулятивная кривая, функция накопленных частот) является статистическим аналогом распределения генеральной совокупности (теоретической функции распределения).

Если объем выборки увеличивается, то от статистических закономерностей можно перейти к вероятностным, так как при этом эмпирическая функция распределения приближается к теоретической функции распределения генеральной совокупности; среднее арифметическое (выборочное среднее) приближается к математическому ожиданию (которое является генеральной средней), а выборочная дисперсия – к дисперсии генеральной совокупности.

Одной из основных и часто выполняемых задач статистической обработки результатов испытаний (наблюдений) является построение (выбор) такого теоретического (вероятностного) распределения, которое наилучшим образом воспроизводило бы характерные признаки (особенности) экспериментального ряда. Такой переход от статистической модели к вероятностному распределению позволяет использовать информацию об аналогах при расчете надежности проектируемых новых устройств и систем.

Вероятностные законы распределения представляют или в виде функции распределения или в виде плотности распределения.

Функцию распределения иногда называют интегральной функцией, а плотность распределения вероятностей – дифференциальной функцией распределения.

Гистограмма при интегрировании принимает вид плавной кривой, которую называют графиком плотности распределения вероятностей (плотности распределения), а уравнение, описывающее его, законом распределения случайной величины.

Упорядочивание выборочных наблюдений состоит в расположении наблюдавшихся значений в порядке возрастания. Полученный ряд называют вариационным, или ранжированным.

Если число членов вариационного ряда велико, то для удобства его изучения наблюдавшиеся значения группируют по интервалам (классам), образуя интервальный ряд. Длину интервалов обычно берут одинаковой. Интервальный ряд может быть построен как для дискретных, так и непрерывных случайных величин.

Классическим примером, на основе которого были впервые получены многие положения математической статистики, является вычисление выборочных значений характеристик распределения признаков случайно составленной группы сверстников (например, группы новобранцев).

Наглядный пример вычисления Хср, S, S несмещ., моментов и коэффициента вариации можно получить, если использовать данные наблюдения роста группы двадцатилетних юношей-студентов третьекурсников.

Обычно все вычисления в математической статистике производят в табличной форме, которая наиболее удобна, так как обладает наглядностью, обозримостью и позволяет проверять вычисления на каждом этапе (табл. 4.1).

В настоящее время, при наличии настольных компьютеров и карманных калькуляторов, заполнение таких таблиц не вызывает принципиальных трудностей.

В табл. 4.1 приведены цифры, соответствующие росту двадцатилетних юношей. При комплектовании лекционных потоков меньше всего учитывается рост студентов, поэтому выборку можно считать случайной.

Примером грубой ошибки в подобной ситуации было бы вычисление выборочных характеристик с использованием наблюдений роста солдат Преображенского полка царской гвардии.