Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа 1a v1.2.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
642.56 Кб
Скачать

Вариационный ряд, диаграмма накопленных частот и гистограмма выборки

Пусть имеется набор (выборка) экспериментальных данных x1, x2, …, xn. Вариационный ряд (или ряд распределения) z1, z2, …, zn получают из исходных данных путем расположения xm (m=1,2, …,n) в порядке возрастания от xmin до xmax.

Например, пусть имеется выборка объема 5:

x1=5, x2=2, x3=4, x4=5, x5=7.

Вариационный ряд для данной выборки будет таким:

z1=2, z2=4, z3=5, z4=5, z5=7.

Диаграмма накопленных частот Pn(x) является эмпирическим аналогом интегрального закона распределения P(X) и ее строят в соответствии с формулой

где μn(x) – число элементов в выборке, для которых значение xi < x.

Стоится диаграмма накопленных частот следующим образом. На оси абсцисс указывают значения наблюдений xm (или zm). Значение по оси ординат равно нулю левее точки xmin; в точке xmin и далее во всех других точках xm диаграмма имеет скачок, кратный 1/n. Если существует k совпадающих значений xm, то в этом месте на диаграмме происходит скачок, равный k/n. Таким образом, в точке x = xmax значение диаграммы накопленных частот достигает 1. Отметим, что если n→∞, то Pn(x) → P(x).

Для рассмотренной выше выборки из пяти элементов диаграмма накопленных частот выглядит следующим образом.

Рис.1. Диаграмма накопления частот

Гистограмма выборки fn(x) является эмпирическим аналогом функции плотности распределения f(x). Она позволяет наглядно изобразить распределение случайной величины.

Последовательность построения гистограммы такова. Диапазон изменения случайной величины (xmin; xmax) разбивается на некоторое количество N (обычно 10-20) частей (или промежутков). Гистограмма, составленная на основе разбиения со слишком маленькими интервалами, обычно многовершинная и не отражает наглядно существенных свойств распределения. С другой стороны, разбиение по слишком крупным интервалам может привести к потере ясного представления о характере распределения. Желательно разбивать так, чтобы в один такой промежуток попало хотя бы одно выборочное значение xi, но и не более 15−20 % всех значений.

Далее определяют длину таких промежутков (интервалов):

Δx = (xmax − xmin)/N

Середину области изменения выборки (центр распределения)

(xmax − xmin)/2

принимают за центр некоторого промежутка, после чего находят границы и окончательное количество указанных интервалов так, чтобы в совокупности они перекрывали всю область от xmin до xmax. Далее подсчитывают количество попавших в данный промежуток случайных величин k(xm) и нормируют на число элементов в выборке n

k(xm)/n

Наконец, строят гистограмму, представляющую собой ступенчатую кривую, значение которой в пределах m-го интервала (xm, xm + Δx) (m = 1, 2, …, N) постоянно и равно k(xm)/n. Зачастую гистограмму изображают не в виде ступенчатой кривой, а с помощью столбцов (Рис. 2).

Рис.2. Гистограмма выборки

2. Алгоритмы моделирования случайных чисел Линейный конгруэнтный метод.

Чтобы получить представление о свойствах функции , попытаемся представить вид её графика на плоскости (x, y) Будем для определённости иметь в виду равномерное распределение случайных чисел на отрезке Тогда график функции будет расположен внутри квадрата со стороной равной единице (Рис.1). По обеим осям будут отложены фактически одни и те же равномерно распределённые точки. Это означает, что график должен как можно более равномерно заполнять квадрат 1×1.

Рис. 2 Функция

Оказывается, очень просто можно получить функцию, обладающую таким свойством. В частности, им обладает функция:

(2.1)

Здесь значок означает дробную часть. Рис. 2, построенный для m=8 поясняет принцип алгоритма (2.1). На самом деле, надо использовать в качестве – большое число. На этой идее основан метод получения случайных чисел, предложенный Д. Лемером. Сейчас он чаще всего называется «линейный конгруэнтный метод». Его исследованию посвящена обширная литература.

Наиболее часто линейный конгруэнтный метод применяется в следующем виде: Выбирают четыре целых положительных числа:

  1. Множитель a;

  2. Сдвиг c;

  3. Модуль m;

  4. Первое число последовательности x0.

Последовательность случайных чисел определяется формулой:

(2.2)

где индекс n пробегает значения 0, 1, 2, ... Символ b mod m означает остаток от деления числа b на m. Очевидно, что b mod m < m. Поэтому все числа последовательности xn удовлетворяют неравенству xn < m. Последовательность чисел yn, равномерно распределенных в интервале от нуля до единицы, получается по формуле:

(2.3)

Далеко не любой выбор четырех исходных чисел ведет к хорошим результатам. Заметим прежде всего, что последовательность чисел xn неизбежно должна быть периодической, причем период не может быть больше, чем m. Действительно, так как все xn – целые числа, причем xnm, количество различных чисел не может превышать m. Поэтому, начиная, по крайней мере, с n = m, появится число, которое уже встречалось, и все повторится заново.

Однако получить последовательность с максимально возможным периодом L = m далеко не просто. Если выбирать исходные числа не задумавшись, то, как правило, будут получаться последовательности с маленьким периодом.

Итак, чтобы получить генератор с максимально возможным периодом L, нужно взять в качестве m самое большое число, с которым может оперировать данная ЭВМ, и выбрать остальные числа в соответствии с следующей теоремой.

Теорема. Если последовательность определяется формулой (2.2) с c ≠ 0, то ее период равен m тогда и только тогда, когда выполнены следующие условия:

а) c и m – взаимно простые числа (не имеют общих делителей, кроме единицы);

б) b = k–1 кратно p для любого простого числа p, являющегося делителем m;

в) b кратно 4, если m кратно 4.

Разработана сложная система тестов, которая позволяет определить качества генератора случайных чисел. Поэтому рекомендуется использовать только проверенные генераторы. При выборе генератора свойства ЭВМ важны не только для того, чтобы выбрать максимально возможный период. От выбора параметров генератора зависит скорость генерации случайных чисел. При этом оказывается, что для ЭВМ разных конструкций оптимальными являются разные генераторы. В частности, приводятся данные для генератора, работающего на основе линейного конгруэнтного метода с периодом 238 ≈ 2,75 × 1011.

За последнее время получили распространение генераторы случайных чисел, основанные на другой идее.