Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Обработка эксперим данных Роганов

.pdf
Скачиваний:
23
Добавлен:
22.05.2015
Размер:
1.37 Mб
Скачать

 

 

 

ηλ

 

 

 

 

1

 

x

ε

2

 

 

 

 

 

f2

(x)=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

γ +ηln

 

 

 

 

 

,

 

 

 

 

 

2π (x ε)(λ

x +ε)

2

λ x +ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

η

 

 

 

1

 

x ε

 

x

ε 2

 

 

2

(8.15)

f3

(x)=

 

 

 

 

+

+1

 

 

(x ε)2

×exp

 

γ

+ηln

λ

 

 

λ

 

 

 

 

 

 

2π

+ λ2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эти функции получили названия SB и SU семейства распределений Джонсона соответственно. Они имеют два параметра формы γ и η, параметр

ε характеризует центр, λ – масштаб распределения.

Возможности распределений Джонсона по описанию статистических данных практически эквивалентны распределениям Пирсона. Функции распределения Джонсона в явном виде представить нельзя, да в этом и нет необходимости, так как расчет значений функций распределения осуществляется на основе нормального распределения.

Чтобы определить одно из трех семейств распределений для аппроксимации полученной совокупности ЭД, можно воспользоваться следующим подходом. По экспериментальным данным находят значения оценок первых четырех центральных моментов, затем значения оценок параметров асимметрии β12 = μ32 / μ23 и эксцесса β2 = μ4 / μ22 распределения.

Если точка с координатами β12 , β2 находится вблизи линии с координатами

b2

= (ω 1)(ω + 2)

 

1

 

(8.16)

b2 =ω 4 + 2ω3 + 3ω 2 3

 

то выбирается семейство распределений SL, рис. 8.7. Если точка лежит выше этой линии, то выбирается семейство SB, если ниже – то SU распределение Джонсона. Точки для описания линии, разделяющей области аппроксимации, находят путем решения первого уравнения (8.16) относительно ω и подстановкой найденного значения во второе уравнение. Некоторые значения параметра ω и соответствующие ему значения b12 и b2 представлены в табл. 8.5 и на рис. 8.7.

Таблица 5.5

141

ω

1,00

1,05

1,10

1,15

1,20

1,25

1,30

1,35

1,40

1,45

1,50

 

 

 

 

 

 

 

 

 

 

 

 

b12

0,00

0,15

0,31

0,47

0,64

0,81

0,99

1,17

1,36

1,55

1,75

 

 

 

 

 

 

 

 

 

b2

3,00

3,84

4,76

5,76

6,85

8,04

9,32

10,71

12,21

13,83

15,56

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 8.7. Области аппроксимации распределениями Джонсона

Определение моментов или построение функции правдоподобия для распределений Джонсона достаточно трудоемко. Для целей аппроксимации проще использовать метод квантилей. Количество используемых квантилей и соответственно уравнений равно количеству определяемых параметров распределения.

Уравнения для нахождения неизвестных параметров для SL, SB, SU распределений Джонсона имеют соответственно вид:

u

= γ +ηln

(x

 

ε), i =

 

 

где γ = γ ηln λ;

 

1,3,

 

αi

 

 

αi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xαi

ε

 

 

 

 

 

 

 

u

= γ +ηln

 

 

 

, i =

 

 

 

 

 

 

 

1,4;

(8.17)

 

 

 

 

 

 

αi

 

 

λ

+ε

 

 

 

 

 

 

 

 

 

 

xαi

 

 

 

 

 

 

 

 

 

x

ε

 

 

 

 

 

 

 

 

 

αi

 

 

 

 

 

 

u

= γ +ηarcsh

 

 

λ

 

, i =1,4.

 

αi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Первая система уравнений допускает решение в аналитическом виде. Для этого целесообразно в качестве одной из квантилей взять 0,5-ю квантиль (квантиль уровня 0,5 функции стандартизованного нормального распределения равна нулю), а в качестве двух других взять симметричные значения хα и х1– α , например х0,35 и х0,65. Значения таких квантилей uα

142

функции стандартизованного нормального распределения равны по величине, но различаются знаком. Тогда оценки параметров SL распределения:

 

 

 

 

 

x

 

x

0,5

 

1

 

 

ηˆ = u

 

ln

1α

 

 

 

 

,

 

 

 

x

 

x

 

 

 

 

 

 

1α

 

 

0.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

 

 

 

 

 

1 exp(u

1α

/ηˆ)

 

 

γˆ =ηˆ ln

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x0.5 xα

 

 

 

 

 

(8.18)

 

 

 

 

 

 

 

 

 

 

 

 

εˆ =

x0,5

 

 

γˆ

/

ηˆ

).

 

 

 

 

 

 

 

 

exp(

 

 

 

 

 

 

 

 

 

 

 

Решение систем уравнений для двух других семейств возможно только на основе численных методов. При этом основная сложность состоит в определении начальных приближений для искомых параметров.

Завершающим этапом аппроксимации с использованием семейств распределений Джонсона должна быть проверка согласованности подобранного распределения и ЭД.

Пример 8.3. Необходимо подобрать распределение Джонсона для описания ЭД, представляющих интервалы времени между поступлениями запросов к базе данных (таблица 8.6). Проверку согласованности провести с использованием критерия Мизеса при уровне значимости α = 0,1.

Таблица 8.6

i

1

2

3

4

5

6

7

8

 

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

xi, мс

1,77

3,03

3,17

5,18

6,22

9,14

9,94

10,25

10,85

15,68

23,90

35,91

 

 

 

Решение. Определим вид семейства распределений Джонсона. Для

этого вычислим значения оценок:

 

 

 

 

 

 

 

 

 

моментов

μ1=11,25,

μ 2=98,18,

μ 3=1614,33,

μ 4=44140,97. Оценка

третьего момента имеет положительное значение, поэтому плотность распределения характеризуется положительной асимметрией;

коэффициентов асимметрии и эксцесса β12 = 2,75, β2 = 4,58.

На основе полученного значения величины β12 в соответствии с первым уравнением (8.16) определим значение вспомогательного параметра

143

ω = 5,24. Этому значению ω соответствует точка линии с координатой b2 = 1125,7. Так как β2 << b2, то выборку целесообразно аппроксимировать распределением SU Джонсона, рис. 8.7.

Для подбора значений параметров распределения SU Джонсона воспользуемся методом квантилей. Возьмем четыре квантили, соответствующие области максимальных значений плотности распределения,

например: х4/12 = 5,18; х5/12 = 6,22; х6/12 = 9,14; х7/12 = 9,94. Этим квантилям исходной выборки соответствуют квантили стандартизованного нормального распределения: u4/12 = – 0,4307; u5/12 = – 0,2104; u6/12 = 0,0; u7/12 = 0,2104.

Приравнивая квантили, получим систему уравнений:

0,4307 =γ +η arcsh((5,18 ε)/ λ),

0,2104 =γ +η arcsh((6,22 ε)/ λ), 0,0000 =γ +η arcsh((9,14 ε)/ λ), 0,2104 =γ +η arcsh((9,94 ε)/ λ),

Воспользуемся пакетом символьной математики MathCAD для нахождения параметров, отвечающих указанной системе уравнений. Результаты вычислений зависят от начальных условий, поэтому потребуется выполнение ряда итераций:

первоначально зададим начальные значения оцениваемых параметров, например, равными единице;

применяя средства решения системы нелинейных уравнений и функцию Minerr, найдем приближенные значения параметров;

подставим найденные значения как начальные приближения и получим уточненные значения параметров. Последние два этапа повторим несколько раз до тех пор, пока корни уравнений перестанут существенно отличаться от начальных приближений. В результате получим приближенные значения искомых величин: γ = – 0,2; η = 0,188; λ = 1,046; ε =

7,809. Преобразование Джонсона примет вид

 

u = - 0,2 + 0,188 arcsh ((x - 7,809)/1,046).

(8.19)

144

В целях проверки качества аппроксимации ЭД подобранным законом

распределения по аналогии с примером 3.3 построим табл. 8.7.

Таблица 8.7

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

1,77

3,03

3,17

5,18

6,22

9,14

9,94

10,3

10,9

15,7

23,9

35,9

 

 

 

 

 

 

 

 

 

 

 

 

 

Fn (xi)

0,04

0,12

0,21

0,29

0,36

0,46

0,54

0,63

0,71

0,79

0,88

0,96

 

 

 

 

 

 

 

 

 

 

 

 

 

ui

–0,66

–0,65

–0,61

–0,51

–0,43

0,00

0,08

0,10

0,14

0,31

0,44

0,55

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф(ui)

0,25

0,26

0,27

0,31

0,33

0,50

0,53

0,54

0,55

0,62

0,67

0,71

 

 

 

 

 

 

 

 

 

 

 

 

 

i

0,045

0,017

0,004

0,000

0,002

0,002

0,000

0,007

0,024

0,029

0,041

0,062

 

 

 

 

 

 

 

 

 

 

 

 

 

В этой таблице:

Fn(xi)=(i–0,5)/12 – значения эмпирической функции распределения; ui – значения аргумента в соответствии с преобразованием (8.19);

Ф(ui) – значения функции нормального распределения стандартизованной величины ui;

i = [Fn (xi) – Ф(ui)] 2 .

12

Значение критерия Мизеса пω 2=1/(12× 12)+ i = 0,241. Критическое

i=1

значение этого критерия при уровне значимости α = 0,1 составляет 0,347, табл. П.2. Расчетное значение меньше критического, следовательно, подобранное распределение Джонсона не противоречит ЭД и его можно использовать для аппроксимации.

Таким образом, универсальные методы аппроксимации, обеспечивая высокую гибкость решения задачи подгонки распределений к ЭД, требуют существенных вычислительных затрат на свою реализацию и применения специализированных пакетов обработки данных.

Следует учитывать, что рассмотренные универсальные способы аппроксимации не являются всеобъемлющими – существуют случайные величины, распределение которых плохо описывается указанными зависимостями. В первую очередь к ним относятся случайные величины с усеченными законами распределения. Например, распределение времени

145

ожидания заявок в очереди к одноканальной системе массового обслуживания при пуассоновском входном потоке и экспоненциальном времени обслуживания (теоретическая функция распределения имеет вид усеченного слева экспоненциального распределения F(t) = 1 - p exp( - μ(1 - p)t), где ρ – загрузка системы, μ – интенсивность обслуживания заявок). Аппроксимация универсальным распределением дает существенные погрешности в области малых значений аргумента t, хотя и может применяться в области больших значений этого аргумента.

146

Глава 9 Экспериментальные исследования

§1. Методика проведения экспериментальных исследований

Важнейшей составной частью научных исследований является эксперимент, основой которого является научно поставленный опыт с точно учитываемыми и управляемыми условиями. Само слово эксперимент происходит от лат. experimentum – проба, опыт. В научном языке и исследовательской работе термин «эксперимент» обычно используется в значении, общем для целого ряда сопряженных понятий: опыт, целенаправленное наблюдение, воспроизведение объекта познания, организация особых условий его существования, проверка предсказания. В это понятие вкладывается научная постановка опытов и наблюдение исследуемого явления в точно учитываемых условиях, позволяющих следить за ходом явлении и воссоздавать сто каждый раз при повторении этих условий. Само по себе понятие «эксперимент» означает действие, направленное на создание условий в целях осуществления того или иного явления и по возможности наиболее частого, т. е. не осложняемого другими явлениями. Основной целью эксперимента являются выявление свойств исследуемых объектов, проверка справедливости гипотез и на этой основе широкое и глубокое изучение темы научного исследования.

Особое значение имеет правильная разработка методики эксперимента. Методика – это совокупность мыслительных и физических

операций, размещенных в определенной последовательности, в соответствии с которой достигается цель исследования. При разработке методик проведения эксперимента необходимо предусматривать: проведение предварительного целенаправленного наблюдения над изучаемым объектом или явлением с целью определения исходных данных (гипотез, выбора варьирующих факторов); создание условий, в которых возможно экспериментирование (подбор объектов для экспериментального воздействия, устранение влияния случайных факторов); определение преде-

147

лов измерений; систематическое наблюдение за ходом развития изучаемого явления и точные описания фактов; проведение систематической регистрации измерений и оценок фактов различными средствами и способами; создание повторяющихся ситуаций, изменение характера условий и перекрестные воздействия, создание усложненных ситуаций с целью подтверждения пли опровержения ранее полученных данных; переход от эмпирического изучения к логическим обобщениям, к анализу и теоретической обработке полученного фактического материала.

Важным этапом подготовки к эксперименту является определение его целей и задач. Количество задач для конкретного эксперимента не должно быть слишком большим (лучше 3...4, максимально 8...10).

Перед экспериментом надо выбрать варьируемые факторы, т.е. установить основные и второстепенные характеристики, влияющие на исследуемый процесс, проанализировать расчетные (теоретические) схемы процесса. На основе этого анализа все факторы классифицируются и составляется из них убывающий по важности для данного эксперимента ряд. Правильный выбор основных и второстепенных факторов играет важную роль в эффективности эксперимента, поскольку эксперимент и сводится к нахождению зависимостей между этими факторами. Иногда бывает трудно сразу выявить роль основных и второстепенных факторов. В таких случаях необходимо выполнять небольшой по объему предварительный поисковый опыт.

Основным принципом установления степени важности характеристики является ее роль в исследуемом процессе. Для этого процесс изучается в зависимости от какой-то одной переменной при остальных постоянных. Такой принцип проведения эксперимента оправдывает себя лишь в тех случаях, когда таких характеристик мало – 1...3. Если же переменных величин много, целесообразен принцип многофакторного анализа, рассматриваемый ниже.

148

Методы измерений должны базироваться на законах специальной науки — метрологии, изучающей средства и методы измерений.

При экспериментальном исследовании одного и того же процесса (наблюдения и измерения) повторные отсчеты на приборах, как правило, неодинаковы. Отклонения объясняются различными причинами – неоднородностью свойств изучаемого тела (материал, конструкция и т.д.), несовершенностью приборов и классов их точности, субъективными особенностями экспериментатора и др. Чем больше случайных факторов, влияющих на опыт, тем больше расхождения цифр, получаемых при измерениях, т. е. тем больше отклонения отдельных измерений от среднего значения. Это требует повторных измерений, а, следовательно, необходимо знать их минимальное количество. Под потребным минимальным количеством измерений понимают такое количество измерений, которое в данном опыте обеспечивает устойчивое среднее значение измеряемой величины, удовлетворяющее заданной степени точности. Установление потребного минимального количества измерений имеет большое значение, поскольку обеспечивает получение наиболее объективных результатов при минимальных затратах времени и средств.

В методике подробно разрабатывается процесс проведения эксперимента, составляется последовательность (очередность) проведения операций измерений и наблюдений, детально описывается каждая операция в отдельности с учетом выбранных средств для проведения эксперимента, обосновываются методы контроля качества операций, обеспечивающие при минимальном (ранее установленном) количестве измерений высокую надежность и заданную точность. Разрабатываются форумы журналов для записи результатов наблюдений и измерений.

Важным разделом методики является выбор методов обработки и анализа экспериментальных данных. Обработка данных сводится к систематизации всех цифр, классификации, анализу. Результаты экспериментов должны быть сведены в удобочитаемые формы записи – таблицы,

149

графики, формулы, номограммы, позволяющие быстро и доброкачественно сопоставлять полученное и проанализировать результаты. Все переменные должны быть оценены в единой системе единиц физических величии.

Особое внимание в методике должно быть уделено математическим методам обработки и анализу опытных данных, например, установлению эмпирических зависимостей, аппроксимации связей между варьирующими характеристиками, установлению критериев и доверительных интервалов и др. Диапазон чувствительности (нечувствительности) критериев должен быть стабилизирован (эксплицирован).

Результаты экспериментов должны отвечать трем статистическим требованиям: требование эффективности оценок, т.е. минимальность дисперсии отклонения относительно неизвестного параметра; требование состоятельности оценок, т. е. при увеличении числа наблюдений оценка параметра должна стремиться к его истинному значению; требование несмещённости оценок – отсутствие систематических ошибок в процессе вычисления параметров. Важнейшей проблемой при проведении и обработке эксперимента является совместимость этих трех требований.

После разработки и утверждения методики устанавливается объем и трудоемкость экспериментальных исследований, которые зависят от глубины теоретических разработок, степени точности принятых средств измерений (чем чётче сформулирована теоретическая часть исследования, тем меньше объем эксперимента).

§ 2. Вычислительный эксперимент

Отдельно необходимо остановиться на понятии вычислительный эксперимент, которое широко используется в последнее время в специальной научной и технической литературе. Вычислительным экспериментом называется методология и технология исследований, основанные на применении прикладной математики и электронно-вычислительных машин как технической базы при использовании математических моделей. Таким

150