Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА.doc
Скачиваний:
188
Добавлен:
01.05.2014
Размер:
1.15 Mб
Скачать

2.3. Гистограмма. Эмпирическое распределение результатов наблюдений

Чтобы получить представление о законе распределения измеряемой величины, произ­водят группировку данных. Для этого весь интервал значений вели­чины от xminдоxmax(рис. 2.1) разбивают на несколько равных ин­тервалов, называемых интервалами группировки данных, ширинойΔи центрамиxk, так чтоk-й интервал (k=1, 2…K) имеет границы (xk–Δ/2,xk+Δ/2). Далее, распределяют значенияx1по интервалам. Число точекNk, оказавшихся внутриk-го интервала, даёт число попаданий измеряемой величины в этот интервал. Общее число точек, оказавшихся внутри всех интервалов разбиения, долж­но быть равно полному числуN результатов наблюдений в исходной выборке.

Над каждым интервалом Δk строится прямоугольник высотойfk=Nk/(NΔ), гдеN– общее число наблюдений. Совокупность таких прямоугольников называетсягистограммой(рис. 2.1).

При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими. Так, в первом случае прямоугольники на гистограмме будут иметь примерно одинаковую высоту, а во втором – могут появиться интервалы, в которые не попадет ни одного значения случайной величины. В последнем случае внутри гистограммы будут просветы. Такие гистограммы не дают представления о законе распределения случайной величины.

Чтобы этого не происходило, придерживаются следующих правил. Число интервалов группировки данных Крассчитывают по формуле

К= 1 + 3.2lgN,

где N– объем выборки. Если числоКполучается дробным, тоeго округляют до ближайшего меньшего целого. Ширину интервалов берут равной

Δ = (xmaxxmin)/K

Высоты и площади прямоугольников на гистограмме имеют следующий смысл. Учитывая, что согласно 2.2 относительные частоты Pk=Nk/Nприближенно равны вероятности попадания результата каждого отдельного наблюдения в данный интервал, высота каждого прямоугольника на гистограммеfk =Nk/NΔ=Рk/Δ есть вероятность, приходящаяся на единицу длины интервала разбиения илиплотность вероятностипопадания случайной величины в интервал Δkс центром в точкеxk.

Площадь каждого прямоугольника fkΔ=Nk/N=Рk есть вероятность попадания результата в интервал Δk.. Сумма площадей прямоугольников, основания которых находятся внутри некоторого интервала [x1, x2], равна вероятности для каждого отдельного наугад взятого результата попасть в этот интервал.

Нетрудно убедиться, что сумма площадей всех прямоугольников равна единице:

. (2.3.1)

Это означает, что попадание значений измеряемой величины в какой-либо из интервалов разбиения в промежутке (xmax,xmin) есть достоверное событие.

Из рис. 2.1 видно, что результаты наблюдений распределены около некоторого значения, абсцисса которого соответствует цен­тру самого высокого прямоугольника на гистограмме, по обе стороны которого расположены прямоугольники убывающей высоты и площа­дей. Учитывая, что высоты прямоугольников fkимеют смысл плотности вероятности попадания измеряемой величины в интервал Δk, можно сказать, что гистограмма дает представление о законе распределения измеряемой величины.

Используя значения координат центров интервалов разбиения xkи числа попаданияNkзначений измеряемой величины в интервалы, можно найти среднее значение измеряемой величиныи величину, характеризующую разброс результатов наблюдений около среднего значения, которые рассчитывают по формулам

(2.3.2)

где при большом объеме выборки . Величинуназываютэмпирической дисперсией, асреднеквадратическим отклонениемрезультатов наблюдений от среднего (СКОx). ПараметрSxхарактеризует ширину распределения значений случайной величины около среднего значения.

Если число измерений взять очень большим (), то есть от выборки перейти к генеральной совокупности, а ширины интервалов разбиения очень маленькими, то ломаная огибающая гистограммы перейдет в плавную кривую. Эту кривую, называемуюфункцией плотности распределения вероятности измеряемой величины, мы будем обозначатьf(x).

В этом случае суммы (2.3.1), (2.3.2) заменятся интегралами, а вероятности Pk– вероятностямипопадания случайной величины в интервал (). Если случайная величина распределена в интервале (a,b) (заметим, что границы интервала могут быть и бесконечными:), то эти интегралы будут иметь вид

(2.3.3)

(2.3.4)

(2.3.5)

где есть плотность вероятности распределения случайной величины или просто плотность вероятности,,– генеральные среднее и дисперсия, величинаназываетсястандартным отклонением.

Закон распределения случайной величины может быть найден не только эмпирически, но и из теоретических соображений. Функция плотности вероятности в этом случае определяется с точностью до некоторого постоянного множителя, значения которого находят при использовании интеграла (2.3.3), который в этом случае называют условием нормировкифункции плотности вероятности. Это условие требует, чтобы площадь под графиком функции вероятности всегда была равна единице.