Скачиваний:
11
Добавлен:
28.03.2019
Размер:
874.21 Кб
Скачать

Рис. 2.17. График ПАКФ при p 7; f (x) x

3

x

2

5 x 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На рис. 2.17 представлен график ПАКФ при

p 7;

f (x) x

3

x

2

5

x 2

. Значение

 

 

главного лепестка равно 1, а значения боковых лепестков стремится к 0, кроме лепестков в точках S/6, S/3, S/2, 2S/3 и 5S/6 (в данном случае это точки 57, 114, 171, 228 и 285), значение которых равно 0.245, 0.5, ≈(-0.258), 0.5 и 0.245 соответственно.

На основании данного графика можно сделать следующий вывод: данная ПАКФ является четырехуровневой.

Порядок выполнения работы

1.Изучить теоретический материал по данной теме.

2.Используя систему GENERATO.EXE. смоделировать работу генератора ПСЧ, основанного на регистре сдвига. В качестве исходных данных рекомендуется задать

структуру ГПСЧ, отобранную по итогам лабораторного занятия №2.

Результат выполнения данного пункта – файл ПСЧ.

3.Используя программный ГПСЧ, созданный на лабораторном занятии №3, создать второй файл ПСЧ.

4.Применяя систему ANALYZE.EXE, проанализировать качество аппаратного и программного генераторов ПСЧ (по двум файлам чисел).

5.Проанализировав результаты исследований, сделать вывод о качестве созданных Вами аппаратного и программного ГПСЧ, отобрать лучший из них для дальнейшего применения в статистическом моделировании.

6.Удалить созданные Вами в процессе работы файлы данных.

7.Результаты исследований по двум файлам оформить в отчет по лабораторной

работе.

Замечание. Формируемые в п.2,3 файлы должны содержать не менее 5000-10000 чисел. Файлы рекомендуется создавать на диске b: и сопровождать расширением *.dat.

Лабораторная работа №9

Статистические тесты

Цель работы: изучение основных методов статистического тестирования последовательностей случайных чисел и анализ качества полученных последовательностей случайных чисел.

Эффективность статистического моделирования и достоверность получаемых результатов находятся в прямой зависимости от качества используемых в модели случайных последовательностей. Под качеством здесь понимается соответствие чисел последовательности заданной функции распределения (или плотности распределения) и ее параметрам (математическому ожиданию, дисперсии, медиане и т.д.); независимость чисел последовательности друг от друга, т.е. отсутствие автокорреляции в последовательности случайных чисел (если не выставлено требование коррелированности); стохастичность последовательностей. Параметры определяются по формулам математической статистики, качество чисел – по различным статистическим тестам.

Определение выборочных оценок

Выборочное среднее

~

представляет собой несмещенную состоятельную оценку

M

математического ожидания M случайной величины. Для выборки случайных величин x1, x2,…, xn объемом n:

~

1

n

M x

 

xi

 

n i 1

~

Выборочная дисперсия D есть несмещенная состоятельная оценка для теоретического значения дисперсии D случайной величины, определяемая следующим образом:

~

1

n

 

~

 

 

 

 

i

x

 

 

D

 

 

(x

M

 

)

2

n 1

 

 

 

 

i 1

 

 

 

 

 

Корреляционный момент – это характеристика зависимости между числами последовательности. Он зависит от расстояния между элементами последовательности.

Выборочный корреляционный момент для двух последовательностей x1, x2,…, xn и y1, y2,…, yn

определяется по формуле:

 

 

~

 

 

1

n

 

~

 

 

~

 

 

 

 

 

 

 

(x

 

)( y

 

)

 

 

k

xy

 

M

x

M

y

 

 

 

 

n 1

i

 

i

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

~

 

 

 

 

 

 

 

 

 

где

Mx

и

My

– выборочные средние для приведенных последовательностей.

Рассмотрим выборку x1, x2,…, xn, xn+1,…, xn+τ объемом n+τ. Введя обозначение y1=x1+τ, y2= x2+τ,…, yn=xn+τ, получаем, что выборочный автокорреляционный момент определяется зависимостью вида:

~

1

 

n

 

~

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x

 

)(x

 

)

 

 

 

 

 

 

 

 

 

 

 

k

 

 

M

x

M

x

 

 

 

 

 

 

 

 

 

 

 

 

n 1

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

 

последовательности

 

независимы,

то

момент

~

 

 

Нормированный

 

 

K ( ) 0 .

корреляционный

выборочный

момент

~

характеризует

как

независимость

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~

~ ~

 

~

~

 

 

последовательностях,

 

 

 

 

 

 

 

 

k /

Dx Dx

, где

Dx и

Dx

так и рассеяние и определяется как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выборочные дисперсии в последовательностях x1,…,xn

и x1+τ,…, xn+τ.

 

 

 

 

 

 

 

Если τ≠0, а n достаточно большое и выполняется соотношение |

~

 

1/(n )

, то

( ) |

это означает, что с доверительной вероятностью β рассматриваемая последовательность удовлетворяет гипотезе корреляционной независимости.

Критерии согласия

Для того, чтобы решить вопрос о согласовании теоретической функции распределения,

которой должны подчиняться получаемые последовательности случайных чисел, и

статистической функции распределения, которая может быть определена построением гистограммы для полученной последовательности, применяют критерии согласования.

Наиболее распространенные из них – критерии хи-квадрат и критерии Колмагорова.

Гистограмма

Гистограмма находится по следующему алгоритму:

1.

2.

3.

В выборочной последовательности x1, x2,…,xn определяют минимальное и максимальное значение чисел A=min(x1, …,xn); B=max(x1, …,xn) и диапазон выборки

разбивают на М равных интервалов длиной H=(B-A)/M. Обычно

разбиение

производится на 20-30 интервалов.

 

 

Для каждого интервала определяется количество попаданий Si,

i 1, M

, где Si равно

тому количеству чисел из последовательности, значения которых принадлежат i-му

 

M

 

 

интервалу. Очевидно, что

Si n . Массив Si' Si / n представляет собой набор

 

i 1

 

 

частот для каждого интервала.

Статистическая функция плотности распределения

f*(x) определяется по формуле

'

 

f * (x) Si , где i – номер того интервала, которому

принадлежит х. Графическое изображение f*(x)называется гистограммой.

 

Статистическая функция

распределения F*(x)строится следующим

образом:

 

k

, k 1,M , по которому строится F*(x)=Gk,

 

 

'

где k –

определяется массив Gk Si

 

i 1

 

 

номер того интервала, которому принадлежит х.

Критерий хи-квадрат

Проверку гипотезы о согласованности эмпирической функции распределения и теоретической с помощью этого критерия производят по следующему алгоритму.

1.Строят гистограмму, осуществляя разбиение всего диапазона выборки таким образом, чтобы S1≥10, i 1,M .

2. Определяют теоретические вероятности pi,

i 1, M , попадания в каждый из

интервалов: если f(x) – непрерывная функция плотности распределения и границы i-

го интервала равны E и Q, то

i

 

Q

 

 

 

 

p

 

f (x)dx

 

 

E

 

3. Вычисляют величину

r(Si

i1l

np )

2

 

i

 

/ npi

: при достаточно больших n эта величина

имеет хи-квадрат распределения с M-1 степенью свободы.

4.Задаются уровнем значимости q (например, q=0,05) и для заданного числа степеней свободы по таблице хи-квадрат распределения находят критическое значение rкр.

5.Если r<rкр, то с вероятностью, равной 1-q, считают, что статистическое распределение согласуется с теоретическим.

Критерий Колмагорова

В качестве примера расхождения между теоретической функцией распределения F(х) и

статической F*(x) рассматривается величина

L

n max | F * (x) F(x) | . Величина L имеет

закон распределения Колмагорова. Алгоритм проверки гипотезы о соответствии статистической функции распределения теоретической по критерию Колмагорова следующий:

1. В выборке х1, x2,…,xn, пользуясь алгоритмом упорядочения, расположить элементы в порядке возрастания:

х1< x2<…<xn.

2. Определить L

n max |

1

n

 

x j

3. По заданному уровню Колмагорова определить Lкр.

4. Если L<Lкр, то гипотеза о равной 1-q.

F(x j ) | ,

j 1, n .

значимости q из таблиц для функции распределения

соответствии распределения принимается с вероятностью,

Подавляющее большинство генераторов последовательностей случайных чисел используют в качестве базовых последовательностей равномерно распределенных чисел.

Поэтому особое значение приобретает использование качественных генераторов равномерно распределенных чисел. После удовлетворения критериям согласия такие генераторы следует проверить на равномерность, случайность и периодичность.

Проверка равномерности

Тест комбинаций

Тест комбинаций заключается в подсчете количества единиц в l старших разрядах случайных чисел. Для случайной выборки х1, х2,…,хn получают случайную выборку целых чисел k1,k2,…,kn, где ki равно количеству единиц в старших разрядах двоичного представления числа хi. Теоретический закон появления j единиц в l разрядах двоичного числа описывается биномиальным законом распределения

p( j,l) cl j p j (1 p)l j cl j 0,5l ,

где p=1/2 – вероятность появления единицы в отдельном разряде.

Алгоритм проверки чисел тестом комбинаций следующий:

1.Определить последовательность k1,k2,…,kn.

2.По заданному уровню значимости протестировать последовательность k1,k2,…,kn

критериями согласия.

Тест пар

Тест пар состоит в подсчете количества единиц для каждого разряда случайного числа.

Для равномерно распределенных чисел теоретическая вероятность p появления единицы в

разряде равна 1/2 (противоположное событие – появление нуля, его вероятность равна 1/2).

Алгоритм проверки по этому тесту следующий:

1.

Получить последовательность х1, х2,…,хn.

2.

Поочередно выделяя в каждом числе очередной двоичный разряд, подсчитать

 

количество единиц в данном разряде среди всех n значений данного разряда.

3.

Для каждого разряда определить величину r1,r2,…,rl (l – количество разрядов), каждая

 

из которых имеет хи-квадрат распределение с одной степенью свободы, по формуле:

r

(k

 

np)

2

/( p(1 p)n).

i

 

i

 

 

 

 

4.

Оценить полученные результаты по критерию хи-квадрат.

Тест многомерности

Тест многомерности проверяет равномерность заполнения m-мерного гиперкуба km

группами равномерно распределенных чисел.

Алгоритм проверки чисел тестом многомерности следующий:

1.Исходную последовательность чисел х1, х2,…,хn разбивают на n/m групп по m чисел в каждой группе (n должно быть кратно m) следующим образом:

х1, х2,…,хm

хm+1, хm+2,…,х2m

xn-m+1, хn-m+2,…,хn

2.Каждое ребро m-мерного гиперкуба разбивают на k равных интервалов, получая при этом km гиперкубиков. При этом необходимо выполнение условия: n/(mkm)>10+20.

3.Каждая из групп чисел попадет в один из гиперкубиков. Определяют количество

попаданий для каждого гиперкубика Ri, i 1, K m .

4. Зная теоретическую вероятность pi=1/Km,

i

1, K

m

 

, попадания в каждый гиперкубик

и определив соответствующую статистическую вероятность

критерий хи-квадрат с (Km-1) степенью свободы, где

pi*

Ri

/

n m

, применяют

 

 

 

n

K

m

( p

*

p )

2

 

 

 

 

r

2

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

m

i 1

 

 

p

i

 

 

 

 

 

 

 

 

 

Тест «Наибольшее из t»

Этот тест считается одним из наиболее критичных, алгоритм имеет вид:

1.Исходную последовательность чисел х12,…,хn разбивают на подпоследовательности по t чисел в каждой.

2.Из каждой подпоследовательности выбирают наибольшее число и заносят его в величину уi, i 1,n / t (например уi=max(х12,…,хt).

3.Случайные числа у12,…уn/t, имеющие функцию распределения F(y)=yt проверяют по критерию Колмогорова.

Проверка случайности

Тест серий

Этот тест проверяет случайность попадания чисел в интервалы [0;0,5) и [0,5;1).

Алгоритм имеет вид:

1) в соответствие исходной последовательности х12,…,хn ставят бинарную последовательность r1, r2,…rn, где

r

0,если x 0,5

 

i

 

1,если x 0,5

 

 

2) в последовательности r1, r2,…rn определяют количество серий S, состоящих из знаков одного вида.

3) задают доверительную вероятность и определяют выполнение неравенства:

n 2 2

t

n1 2

< S <

n 2 2

t

n1 2

Тест монотонности

Этим тестом проверяется случайность по следующему алгоритму:

1.Тестируемая последовательность разбивается на следующие друг за другом группы, каждая из которых состоит из неубывающей подпоследовательности.

2.В величины t1, i=1,6 заносят количество групп, состоящих из i чисел (группы, состоящие из шести и более чисел, относят к i=6).

3.Строят величину

6

6

V n (ti bi )(t j bj )aij ,

i 1

j 1

где bi, bj и aij- числовые коэффициенты; величина V имеет хи-квадрат распределения с 6 степенями свободы.

4. Задают доверительную вероятность и применяют критерий хи-квадрат.

Проверка периодичности

Периодичность проверяется только для псевдослучайных чисел.

При этом для тестируемой последовательности х12,…,хn отыскивают такой номер L, что xL+1=x1; xL+i+1=xi+1 и т.д.; величина L называется периодом. Если в пределах тестируемой последовательности L найти не удается, то констатируют тот факт, что L>n.

Описанные выше методы оценки качества последовательностей ПСЧ лежат в основе функционирования автоматизированной системы исследования статистической информации ANALYZE.EXE. В данной лабораторной работе используется следующие функциональные возможности системы:

-аппроксимация статистического распределения теоретическим, проверка их согласованности по критериям хи-квадрат и Колмогорова

-оценка для равномерно распределенных чисел точечных характеристик, равномерности, случайности и независимости.

Порядок выполнения работы

1.Изучить теоретический материал по данной теме.

2.Используя систему GENERATO.EXE. смоделировать работу генератора ПСЧ, основанного на регистре сдвига. В качестве исходных данных рекомендуется задать

структуру ГПСЧ, отобранную по итогам лабораторного занятия №2.

Результат выполнения данного пункта – файл ПСЧ.

3.Используя программный ГПСЧ, созданный на лабораторном занятии №3, создать второй файл ПСЧ.

4.Применяя систему ANALYZE.EXE, проанализировать качество аппаратного и программного генераторов ПСЧ (по двум файлам чисел).

5.Проанализировав результаты исследований, сделать вывод о качестве созданных Вами аппаратного и программного ГПСЧ, отобрать лучший из них для дальнейшего применения в статистическом моделировании.

6.Удалить созданные Вами в процессе работы файлы данных.

7.Результаты исследований по двум файлам оформить в отчет по лабораторной

работе.

Замечание. Формируемые в п.2,3 файлы должны содержать не менее 5000-10000 чисел. Файлы рекомендуется создавать на диске b: и сопровождать расширением *.dat.

Лабораторная работа №10 – 11

Тесты Д. Кнута. Тесты Diehard

Тесты DIEHARD.

Тесты DIEHARD были разработаны Джорджем Марсальей (англ.) в течение нескольких лет и впервые опубликованы на CD-ROM, посвящённом случайным числам. Они рассматриваются как один из наиболее строгих известных наборов тестов.

Тесты Д. Кнута

Тесты Кнута основаны на статистическом критерии . Вычисляемое значение статистики сравнивается с табличными результатами, и в зависимости от вероятности появления такой статистики делается вывод о ее качестве. Среди достоинств этих тестов — небольшое их количество и существование быстрых алгоритмов выполнения. Недостаток — неопределенность в трактовке результатов. Вот краткое описание этих тестов:

Проверка

несцепленных

серий.

Последовательность

разбивается

на m непересекающихся серий и строится распределение для частот появления каждой возможной серии.

Проверка интервалов. Данный тест проверяет равномерность распределения символов

висследуемой последовательности, анализируя длины под последовательностей, все элементы которых принадлежат определённому числовому интервалу.

Проверка комбинаций. Последовательность разбивается на под последовательности определённой длины, и исследуются серии, состоящие из различных комбинаций чисел.

Тест собирателя купонов. Пусть — последовательность длины n и

размерности m. Исследуются под последовательности определённой длины, содержащие каждое m-разрядное число.

Проверка перестановок. Данный тест проверяет равномерность распределения символов в исследуемой последовательности, анализируя взаимное расположение чисел в под последовательностях.

Проверка на монотонность. Служит для определения равномерности исходя из анализа невозрастающих и неубывающих под последовательностей.

Проверка корреляции. Данный тест проверяет взаимозависимость элементов последовательности.

Порядок выполнения работы

1.Изучить теоретический материал по данной теме.

2.Используя систему GENERATO.EXE. смоделировать работу генератора ПСЧ,

основанного на регистре сдвига. В качестве исходных данных рекомендуется задать структуру ГПСЧ, отобранную по итогам лабораторного занятия №2.

Результат выполнения данного пункта – файл ПСЧ.

3.Используя программный ГПСЧ, созданный на лабораторном занятии №3, создать второй файл ПСЧ.

4.Применяя систему ANALYZE.EXE, проанализировать качество аппаратного и программного генераторов ПСЧ (по двум файлам чисел).

5.Проанализировав результаты исследований, сделать вывод о качестве созданных Вами аппаратного и программного ГПСЧ, отобрать лучший из них для дальнейшего применения в статистическом моделировании.

6.Удалить созданные Вами в процессе работы файлы данных.

7.Результаты исследований по двум файлам оформить в отчет по лабораторной работе.

Лабораторная работа №12

Разработка и тестирование генератора с заданными свойствами