Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТеорПрактНаучнИссл_Устименко

.pdf
Скачиваний:
19
Добавлен:
03.03.2016
Размер:
2.48 Mб
Скачать

71

Задачи к разделу 3

1. Рассматривается техническая система с шестью факторами и одним откликом.

Обосновать и выбрать вид плана для получения модели второго порядка вида

= 0 + 1 1 + 2 2 + 3 3 + 4 4 + 5 5 + 6 6 + 11 12 + 22 22 + 33 32 + 44 42 + 55 52 + 66 62

Искомыми являются коэффициенты функции.

2. Построить план в виде таблицы EXEL. Экспериментальные данные сгенерировать следующим образом: ′ = + , где - расчетная величина, а

– случайная, имеющая нормальный закон распределения с параметрами (0,1).

В таблице 3.10 указаны варианты коэффициентов для построения в виде уравнения

′ = 0 + 1 1 + 2 2 + 3 3 + 4 4 + 5 5 + 6 6 + 11 12 + 22 22 + 33 32 + 44 42 + 55 52 + 66 62 +

0

1

2

3

4

5

6

11

22

33

44

55

66

 

вариан

 

 

 

 

 

 

 

 

 

 

 

 

 

 

та

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.

10

1

2

3

4

5

6

11

-8

13

-6

12

-9

(0;1,1)

1.

9

5,5

11

8,5

5,4

7,4

6,5

12,4

8,5

11

-8

10

8,7

(0;1,2)

2.

11,5

6,6

13

8,7

4,6

7,9

5,5

13,7

-6,5

1,4

-5

13

-4

(0;1,6)

3.

10,1

7,7

14

6,7

6,6

-6

-3

12,9

6,9

1,4

-7

9

-6

(0;1,1)

4.

5,6

8,6

12,5

9,8

7,7

1,1

2,6

14,8

3,4

1,6

-5

10

-8

(0;1,3)

5.

15,8

9,4

9,0

5,8

5,9

-7

7,1

13,0

11,5

6,7

-1

11

-9

(0;1,2)

6.

12

6,8

13,2

7,8

4,7

4,5

-5

12,9

13,9

7,9

-4

7

-5

(0;1,6)

7.

3,6

8,3

6,7

7,5

3,8

7,8

-8

14,6

-5,8

8,5

-5

12

-4

(0;1,5)

8.

12,4

2,5

5,2

8,4

7,6

3,8

6,9

11,3

10,8

7,8

-3

9

-8

(0;1,4)

9.

10,3

11

7,9

4,6

8,8

-8

9,5

12,9

13,7

9,5

-7

6

-5

(0;1,3)

10.

12,8

14

11,5

8,9

5,9

6,4

9,7

-6

18,4

3,8

-8

10

-3

(0;1,2)

11.

11,1

15

7,4

6,3

8,8

5,5

3,8

10,4

14,9

5,8

-4

11

-8

(0;1,1)

12.

14,5

12,5

8,4

9,2

5,7

7,3

7,5

13,6

15,3

6,7

-6

4

-8

(0;1,2)

13.

10,2

11,1

6,4

3,9

4,9

6,7

6,9

12,9

-6,7

8,9

-5

11

-4

(0;1,7)

14.

13,3

10,2

12,8

9,9

5,6

5,9

5,9

-8

12,0

8,4

-8

15

-4

(0;1,2)

15.

15,1

7,4

11,1

7,4

7,7

6,9

9,7

10,4

11,8

7,4

-4

10

-8

(0;1,5)

16.

13,2

8,9

12,3

6,9

5,7

2,8

4,6

12,5

15,9

3,9

-7

15

-6

(0;1,4)

17.

11,7

5,7

15,2

2,9

5,8

5,7

3,3

-9

13,4

5,7

-6

12

-9

(0;1,3)

18.

12,8

3,4

11,1

7,5

9,6

8,9

7,7

11,2

17,9

6,4

-9

11

-3

(0;1,2)

19.

11,9

9,8

15,6

6,3

8,4

-7

4,9

13,2

19,8

6,3

-6

13

-7

(0;1,5)

20.

10,5

6,7

8,9

5,8

3,8

9,6

5,3

10,4

9,4

9,6

-5

14

-3

(0;1,3)

21.

13,1

4,7

6,7

8,4

6,7

5,5

6,2

-3

11,5

4,6

-2

12

-4

(0;1,4)

22.

15,7

12,6

10,4

9,6

7,4

4,8

6,0

12,5

17,4

3,9

-7

15

-8

(0;1,5)

23.

14,3

6,4

12,1

5,8

8,8

-8

3,9

12,9

13,8

5,7

-8

12

-5

(0;1,6)

24.

13,2

5,7

11,3

9,6

5,7

3,9

6,4

10,9

-4

7,4

-9

10

-7

(0;1,3)

25.

16,3

12,5

9,5

8,8

7,6

-5

5,9

11,2

14,3

6,8

-6

11

-3

(0;1,4)

72

Пример выполнения задания

1-й этап Строим таблицу, соответствующую плану эксперимента. Т.к. для построения

модели необходимо определить 13 коэффициентов, то для того, чтобы план был насыщенным количество опытов не должно быть меньше 13. По задания необходимо построить модель 2-ого порядка, то наиболее эффективным является рототабельное планирование. Следовательно, для ядра плана возможно использование дробнофакторного планирования (ДФЭ 26−2 ), а звездная часть будет представлять собой рототабельное планирование с

6−2

величиной звездного плеча = 2 4 .

Примем в качестве генерирующих соотношений 5 = 1 2 3, 6 = 2 3 4. Проверку на наличие связей между факторами с помощью определяющих контрастов выполнить самостоятельно.

Используем EXEL для построения матрицы планирования. 2-й этап

Для гененрирования результатов эксперимента воспользуемся коэффициентами многочлена, приведенными в строке таблицы, соответствующей номеру варианта(в нашем случае 0).

Для генерирования ошибки эксперимента воспользуемся пунктом меню «Анализ данных» (На вкладке «Анализ»). Если данный сервис не установлен, то необходимо нажать главную кнопку в левом верхнем углу окна программы EXEL (MS OFFICE версии 2007 и выше). В меню выбрать «Надстройки», в списоке открывшегося справа окна выбрать «Пакет анализа» и нажать кнопку «Перейти», в новом окне поставить галочку в строке «Пакет анализа» и нажать «ОК». Для генерирования воспользуемся вкладкой «Данные», в меню «Анализ данных» выбираем «Генерация случайных чисел» и задаем «число переменных»=1, в нашем случае число случайных чисел =16+13=29, выбираем нормальное распределение, указываем его параметры, соответсвующие варианту, задаем в параметрах вывода «Выходной интервал», соответствующий столбцу EXEL-таблицы.

73

3-й этап Создаем последний столбец, как сумму столбцов и . После чего

результирующая таблица с планом эксперимента и экспериментальными данными примет вид

и будет пригодна для дальнейшей работы при изучении обработки экспериментальных данных.

Вопросы для самопроверки

74

4. Статистический анализ результатов эксперимента

4.1. Этапы статистического анализа

При выполнении измерений экспериментатор пытается определить значение той или иной величины. И как только начинаются измерения, он сталкивается с интересной ситуацией: если использовать достаточно точные приборы, то можно увидеть, что повторное измерение одной и той же величины приводит иногда к результатам, слегка отличающимся от результатов первоначального измерения. Это явление характерно как для простых, так и для сложных измерений.

Почему существует разброс, откуда берется изменение? Ответ на этот вопрос очевиден: условия проведения эксперимента все время меняются, и в условиях реального эксперимента от них избавиться невозможно. Мы «обречены» выполнять измерения величин, которые никогда не остаются постоянными. Поэтому постановка вопроса о значении некоторой величины может быть некорректной, нужна постановка такого вопроса, который отражал бы это свойство изменчивости.

Решение состоит в том, чтобы характеризовать физическую величину не одним значением, а вероятностью найти в эксперименте то или иное значение. Для этого используется функция, называемая распределением вероятности обнаружения физической величины, которая показывает, какие значения чаще встречаются в эксперименте.

Функция распределения в большинстве экспериментов является достаточно простой и имеет две характеристики. Первая – среднее значение физической величины, вторая – показывает область вокруг этой средней величины, в которой сосредоточено большинство результатов эксперимента. Она характеризует ширину этого распределения и называется погрешностью. Эта ширина имеет строгую интерпретацию в терминах теории вероятностей, т.е. можно указать, с какой вероятностью определяется истинное значение в заданной области вокруг измеренного среднего значения. Назовем эту погрешность естествен-

ной.

Для экспериментатора построение функции распределения требует проведения многократных (бесконечного числа) измерений, что бывает дорого и никому не нужно. Поэтому приходится ограничиваться конечным числом измерений, что привносит дополнительную погрешность.

Возникает и другая проблема: в каждом эксперименте присутствует измерительный прибор, который вносит изменения в начальную функцию распределения, приводя к дополнительной приборной погрешности.

Разделение погрешности на естественную и приборную достаточно условное, оно позволяет лучше понять природу погрешности.

75

Экспериментатор должен всегда задавать себе два вопроса: как измерить физическую величину, т.е. как определить ее характеристики – среднее значение и ширину интервала, и до какой степени удастся разумно уменьшить погрешность эксперимента? Поэтому важно понимать взаимосвязь между тремя составляющими погрешности:

-естественную погрешность можно уменьшить, изменяя условия проведения эксперимента,

-погрешность, связанную с конечностью числа измерений – увеличивая их число,

-приборную – используя более точные методы и инструменты измерений. Вместе с тем невозможно уменьшить погрешность до нуля. Для нее суще-

ствует нижний предел, оценка которого – принципиальный физический вопрос. Поэтому нашей задачей является определить те экспериментальные методы, которые адекватны желаемой и достижимой точности. В зависимости от желаемой точности могут возникнуть различные ситуации:

- если мы хотим получить порядок измеряемой величины, то и погрешность должна оцениваться грубо;

- если мы хотим получить точность в несколько процентов, тогда необходимо и более аккуратно определять погрешности;

- если необходимо получить точность, сравнимую с точностью эталонных измерений, то проблема определения погрешности может стать более важной и сложной, чем проблема измерения самой величины.

Кроме указанных в эксперименте могут иметь место и другие источники ошибок, которые вызывают так называемые систематические ошибки. Выявление их и анализ намного сложнее, чем случайных. Можно указать три основных источника систематических ошибок: методика, выбранная для проведения эксперимента, плохая работа измерительных приборов, и, наконец, ошибки самого экспериментатора.

Поскольку отклик из-за влияния неконтролируемых факторов является случайной величиной, то при обработке результатов эксперимента широко используется аппарат математической статистики, теоретической основой которого является теория вероятностей. Основными задачами обработки экспериментальных данных, решаемыми с помощью математической статистики, являются:

1 – упорядочение экспериментальных данных, представление их в удобном для анализа виде;

2 – оценки вероятностных характеристик исследуемой физической величины;

76

3 – проверка статистических гипотез, т.е. решение вопроса согласования оценивания с опытными данными (например, проверка гипотезы о том, что наблюдаемая случайная величина подчиняется нормальному закону).

При статистическом анализе результатов эксперимента возможна следующая последовательность этапов:

1 - анализ объекта эксперимента, суть которого сводится к разработке для него модели «черный ящик», т.е. к определению набора входных и выходных параметров модели.

2 - составление плана получения данных состоит в расчете массива зна-

чений входных параметров = ( 1, 2, … , ), которые будут использованы при проведении эксперимента (раздел 3).

3 - получение экспериментальных данных, которые сохраняются, как правило, в персональном компьютере.

4 - первичная обработка экспериментальных данных с целью получения статистических оценок параметров модели, выдвижение и проверка гипотез о о законах распределения и их параметрах

5 - определение статистических зависимостей (анализ стохастических свя-

зей) между входными X и выходными = ( 1, 2, … , ) параметрами модели, что предполагает проведение дисперсионного, корреляционного и регрессионного анализов. Дисперсионный анализ занимается оценкой влияния на выходные параметры модели неколичественных параметров с целью выбора среди них наиболее важных. Корреляционный анализ занимается оценкой значимости влияния на выходные параметры Y контролируемых параметров = ( 1, 2, … , ). Регрессионный анализ определяет аналитическую зависимость между контролируемыми параметрами и выходными параметрами . Анализ стохастических связей приводит к различным постановкам задач статистического исследования зависимостей, которые упрощенно можно классифицировать следующим образом:

Задачи корреляционного анализа – исследование наличия взаимосвязей между отдельными группами переменных;

Задачи регрессионного анализа – задачи, связанные с установлением аналитических зависимостей между переменным у и одним или несколькими переменными х12,…,хк , которые носят количественный характер;

Задачи дисперсионного анализа – задачи, в которых переменные х12,…,хк носят качественный характер, а исследуется и устанавливается степень их влияния на у.

Стохастические зависимости характеризуются формой, теснотой связи, численными значениями коэффициентов уравнения регрессии.

6 – интерпретация результатов эксперимента с соответствующими статистическими выводами

77

4.2. Первичная статистическая обработка

На практике исследователь обладает лишь ограниченным объемом значений случайной величины, представляющим собой некоторую выборку из генеральной совокупности. Совокупность всех возможных (мыслимых) результатов наблюдений в данных условиях называется генеральной совокупностью. Выборкой называется конечный набор значений случайной величины в результате конкретного наблюдения: 1, 2, … , , где - объем выборки. Вариационным рядом называется пронумерованная ранжированная, т.е. расположенная в порядке возрастания значений, выборка (1) < (2) < < ( ).

При анализе непрерывной случайной величины (например, температура, давление) под наблюдаемыми значениями случайной величины понимают такие дискретные значения, разделенные определенным интервалом времени, при котором произведенные замеры можно считать независимыми.

Выборка называется репрезентативной, если она дает достаточно полное представление о генеральной совокупности.

Вматематической статистике доказано (теорема Гливенко), что при достаточно большой выборке функцию распределения вероятностей генеральной совокупности можно заменять функцией распределения выборки. Смысл статистических методов заключается в получении оценок параметров случайной величины по выборке объема , которые позволяют судить обо всей генеральной совокупности.

Числовые характеристики, определенные при ограниченном объеме информации, называются оценками.

Вкачестве оценки используют т.н. статистики некоторые функции от элементов выборки. Статистики бывают точечные, которые состоят из одного значения, и интервальные. Сами по себе статистики являются случайными величинами, т.е. их значения могут меняться от выборки к выборке.

4.2.1. Точечные статистики

Пусть является точечной оценкой параметра .

К точечным оценкам числовых характеристик предъявляются следующие требования:

1.Состоятельность при увеличении числа опытов оценка сходит-

ся

по

вероятности

к оцениваемому параметру, т.е. выполняется условие

 

 

< = 1

при увеличении объема выборки .

 

 

 

 

 

 

2.

Несмещенность – математическое ожидание оценки равно оцени-

ваемому параметру, т.е. при увеличении объема выборки ее математическое

ожидание стремится к оцениваемому параметру:

 

= при увеличении .

 

 

3.Эффективность несмещенная оценка должна обладать мини-

мальной дисперсией по сравнению с другими оценками, т.е.

= .

 

 

78

Все точечные оценки можно разделить на три группы - средние статистики, статистики рассеяния и статистики отклонения формы распределения. Средние статистики. Средние статистики определяют центр распределения случайной величины, около которого группируется большая ее часть, т.е. измеряют центральную тенденцию выборки. Средние величины отражают закономерный результат воздействия главных возмущающих факторов.

Выборочное среднее (среднее арифметическое). Является наиболее часто употребляемой оценкой математического ожидания ( ), вычисляется как

=

1

 

 

(4.1)

 

 

=1

 

 

 

 

 

 

 

 

Медиана. Оценка вычисляется как среднее значение вариационного ряда. Медиана делит вариационный ряд на две, равные по объему выборки, в силу чего равновероятно, что случайная величина будет больше или меньше значения медианы.

= , = 2 − 1

1= 2 ( + ( +1)), = 2

Квантиль выборки представляет собой число хр, ниже которого находится р-я часть (доли) выборки.

Например, квантиль 0,25 для некоторой переменной - это такое ние( ), ниже которого находится 25% значений переменной.

Аналогично квантиль 0,75 - это такое значение, ниже которого попадают 75% значений выборки.

Квартили (от слова кварта - четверть). Нижняя и верхняя квартили, равны соответственно 25-й и 75-й процентилям распределения.

25-я процентиль переменной - это значение, ниже которого располагаются 25% значений переменной. Аналогично, 75-я процентиль равна значению, ниже которого расположено 75% значений переменной.

Итак, три точки: нижняя квартиль, медиана и верхняя квартиль делят выборку на 4 равные части. При этом, 1/4 наблюдений лежит между минимальным значением и нижней квартилью; 1/4 - между нижней квартилью и медианой; 1/4 - между медианой и верхней квартилью; 1/4 - между верхней квартилью и максимальным значением выборки.

Мода. Оценка Mo вычисляется как значение выборки, наблюдаемое наибольшее число раз. На графике кривой функции плотности распределения мода соответствует точке локального максимума.

В случае симметричного распределения медиана совпадает с модой и математическим ожиданием.

79

Статистики рассеяния. Статистики рассеяния отражают результат воздействия возмущающих факторов.

Выборочная дисперсия. На первый взгляд она должна оцениваться форму-

лой

2

=

 

( − )2

,

1

 

=1

 

 

Но эта оценка получается несколько смещенной:

− 1

12 = .

Поэтому для оценки дисперсии используется несмещенная оценка:

2 = 2

 

=

 

( − )2

( − 1).

 

=1

1 −1

 

 

 

Уменьшение знаменателя на единицу непосредственно связано с тем, что величина , относительно которой берутся отклонения, сама зависит от объема выборки. Каждая величина, зависящая от элементов выборки и входящая в формулу, называется связью. В статистике доказывается, что знаменатель выборочной дисперсии всегда равен разности между объемом выборки и числом связей , наложенных на эту выборку. Эта разность

= −

называется числом степеней свободы выборки. В практических вычислениях для оценки дисперсии часто используется более удобная формула:

 

 

1

 

 

 

 

2

 

 

 

 

 

2

=

 

 

2

=1

 

.

 

 

 

 

 

 

− 1

 

 

 

 

 

=1

Преимущество этой формулы в том, что в ней нет операций вычитания близких чисел, приводящих к потере точности.

Обычно при N 50можно считать, что 12 2.

Выборочное среднеквадратическое отклонение. Дисперсия случайной ве-

личины имеет размерность квадрата случайной величины; для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Поэтому часто используется среднее квадратическое отклонение (СКО или стандарт), равное квадратному корню

из дисперсии и обозначаемое , , а его оценка вычисляется как

 

 

 

 

 

 

 

 

 

=

 

1

( − )2

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

=

 

( − )2

 

 

 

 

 

 

 

 

 

 

− 1

 

 

 

 

=1

80

Коэффициент вариации. Его оценка вычисляется как = 100%

Принято считать, что при значениях оценки > 40% разброс значений исследуемого параметра значителен, а при > 100% наблюдения неоднородны. При значениях , близких к 0, коэффициент не используют. Оценка используется обычно для сравнения двух выборок.

Размах варьирования. Оценка вычисляется как разница между максимальным и минимальным значениями в выборке. Является упрощенной оценкой рассеяния.

Статистики отклонения формы распределения используются для характе-

ристики вида кривой распределения.

Коэффициент асимметрии служит для характеристики асимметрии (скошенности) распределения. Если распределение симметрично относительно математического ожидания, то все центральные моменты1 нечетного порядка (если они существуют), равны нулю. Поэтому наиболее логично принять 3-й центральный момент, а чтобы получить безразмерную характеристику, его делят на куб среднего квадратического отклонения. Оценка асимметрии= 33,где 3 – третий центральный момент, вычисляется как

= 33

.Коэффициент асимметрии характеризует отклонение функции плотности рас-

f(x)

A1>0

A2<0

Mo1

Mo2

x

Рисунок 4.1- К понятию коэффициента асимметрии

пределения от симметричной формы относительно выборочного среднего значения . Если в вариационном ряду преобладают варианты, меньшие , то асимметрия называется левосторонней, при этом , < 0, > , при значении

1 Центральные моменты k-ого порядка определяются по формуле

 

=

 

(

− ) ), так

3

- центральный

 

 

 

1

 

 

=1

 

 

 

выборочный момент 3-го порядка, оценивается как

 

=

( − )3

 

 

 

 

3

 

 

 

 

 

 

 

−1