
2.6.Выравнивание статистических распределений
В связи с ограниченностью числа опытов в статистических распределениях присутствуют элементы случайности, которые сглаживаются лишь при большом числе опытов. Для удобства пользования данными на практике подбирают для данного статистического распределения аналитическую функцию, выражающую лишь существенные черты статистического материала. Такая задача называется задачей выравнивания статистических распределений. Это чаще всего применяется к гистограммам, заменяя их плавной кривой с простым аналитическим выражением для использования в дальнейшем в качестве плотности распределения f(x).
В методе подбора значителен элемент творчества, опыта, интуиции, знания физической сущности изучаемого явления.
Y
* *
* * * *
* * * *
*
0
x
Y
* * *
*
* * *
* * * *
* * * *
* * *
* * *
0
x
Рис. 2.3. Примеры выбора функций для выравнивания статистических распределений
На рисунках показаны примеры выбора функций по статистическим данным измерений. При сглаживании часто используют «метод наименьших квадратов», для которого сумма квадратов отклонений обращается в минимум.
На практике часто бывает, что случайная величина складывается из многих независимых или слабо зависимых слагаемых, сравнимых по порядку влияния на рассеивание суммы. В этом случае естественна в качестве выравнивающей нормальная плотность:
(2.27)
и необходимо
подбирать, исходя из опытных данных
только параметры
и m в этом выражении. Если, например,
случайная величина Х есть расстояние
между соседними событиями потока, то в
качестве выравнивающего закона можно
взять показательный или какой-нибудь
из законов Эрланга.
При этом необходимо иметь ввиду, что любая аналитическая функция f(x), используемая для выравнивания гистограммы, должна обладать основными свойствами плотности:
(2.28)
Параметры, входящие в функцию f(x), подбирают для лучшего согласования статистического и аналитического распределения различными методами, чаще всего – методом моментов, когда совпадают важнейшие моменты: математическое ожидание, дисперсия, иногда высшие моменты (моментами выше четвёртого порядка пользоваться нерационально, т.к. точность вычисления моментов резко падает с увеличением их порядка.
Пример 2.1.
Угол высоты объекта над горизонтом измеряется с помощью секстана, где случайная величина Х – ошибка измерения угла. Для оценки точности прибора произведено 500 измерений ошибки (в тысячных долях радиана). Результаты измерений сведены в группированный статистический ряд:
Х:
Разряды |
(-4)-(-3) |
(-3)-(-2) |
(-2)-(-1) |
(-1)-(0) |
0-1 |
1-2 |
2-3 |
3-4 |
Частоты |
0,012 |
0,050 |
0,144 |
0,266 |
0,240 |
0,176 |
0,092 |
0,020 |
Число попаданий в i-й разряд ni |
6 |
25 |
72 |
133 |
120 |
88 |
46 |
10 |
Здесь ni = n
Построить гистограмму распределения. Выровнять статистическое распределение с помощью нормального закона:
, (2.29)
Подобрав параметры и m так, чтобы сохранить неизменными первые два момента статистического распределения: математическое ожидание и дисперсию.
Решение.
Для этого нужно
знать статистическое среднее
и статистическую дисперсию
случайной
величины Х. Известно, что при большом
числе наблюдений среднее арифметическое
сходится по вероятности к её МО, а среднее
арифметическое их квадратов – ко второму
начальному моменту
.
В данном случае мы не располагаем всеми
500 значениями Х, а если бы и располагали,
процесс вычисления был бы громоздким.
Ограничимся определением так называемых
«грубых» моментов по группированному
ряду. Для этого выбираем в качестве
«представителя» i-го разряда его середину
и этому значению
и приписываем ему частоту
.
Приближённое значение статистического
среднего
найдём как сумму произведений всех
на
:
=-3,5.0,012-2,5.0,050-1,5.0,144-0,5.0,266+0,5.0,240+1,5.0,176+2,5.0,092+3,5.0,020
0,168.
Статистический второй начальный момент:
=(-3,5)2.0,012+(-2,5)2.0,050+(-1,5)2.0,144+
+(-0,5)2.0,266+0,52.0,240+1,52.0,176+2,52.0,092+3,52.0,020 2,126
Вычитая из
квадрат среднего значения (
)2
, получим статистическую дисперсию:
2,098,
откуда
Полагая в выражении
нормальной плотности m=0,168;
,
и пользуясь таблицей значений нормальной
плотности распределения, получим
значения на границах разрядов:
f(-4)=0,0045; f(-3)=0,0256; f(-2)=0,0895; f(-1)=0,1986; f(0)=0,2740; f(1)=0,2343; f(2)=0,1244; f(3)=0,0435.
По этим можно построить гистограмму и выравнивающую её нормальную кривую распределения.
Вопросы для самопроверки
1. Что такое генеральная совокупность, выборка, выбор?
2. Сформулируйте определение простого случайного выбора.
3. Какие существуют виды реальных выборов?
4. Какая выборка называется репрезентативной, однородной?
5. Дайте определение вариационного, статистического ряда.
6.Дайте определения крайних элементов вариационного ряда, размаха, медианы, квартилей.
7.Что такое полигон частот?
8. Дайте определение выборочной функции распределения.
9. Что такое оценка генеральной числовой характеристики?
10. Опишите метод аналогии (подстановки) формирования оценок.
11. Перечислите основные выборочные оценки генеральных числовых характеристик.
12. Что такое группированный статистический ряд?
13. Что такое гистограмма выборки?
14. Объясните суть выравнивания статистических распределений.
15. В чём отличие частоты события от его вероятности?