Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТеорПрактНаучнИссл_Устименко

.pdf
Скачиваний:
19
Добавлен:
03.03.2016
Размер:
2.48 Mб
Скачать

101

2.По результатам экспериментальных измерений и предположению нормального закона их распределения определяется расчетное значение критерия Пирсона.

3.Определяют число степеней свободы m, задаются уровнем значимости

α и определяют теоретическое значение критерия Пирсона 2

.

 

 

;

 

4. Если 2 < 2

 

, то нуль-гипотеза о нормальном законе распределения

;

 

 

экспериментальных

данных принимается с доверительной вероятностью

= 1−. В противном случае нуль-гипотеза отвергается и принимается альтернативная.

Критерий согласия Колмогорова. Колмогоров доказал, что независимо от функции распределения вероятностей при неограниченном возрастании числа

независимых наблюдений вероятность неравенства

 

стремится к

пределу

 

 

 

 

 

 

 

 

= 1 −

(−1) −2 2 2

 

 

 

=−

Значения этой вероятности табулированы.

Суть критерия согласия Колмогорова заключается в следующем. Устанавливается максимальная величина модуля разности между статистической и теоретической функциями распределения вероятностей

= 0 − ( )

и определяется величина

= √

где n – число независимых наблюдений, и по таблице находится вероятности ( ).

Величина этой вероятности ( ) свидетельствует о том, что за счет случайных причин вероятность максимального расхождения между функциями распределения будет не меньше ( )

Если вероятность мала, гипотезу следует отвергнуть, при больших значениях вероятности эту гипотезу следует считать, как не противоречащую опытным данным.

102

4.4.Построение однофакторных эмпирических зависимостей

В области исследования технических систем довольно часто возникает задача определения зависимости, как изменение одной величины, к примеру,влияет на другую = ( ). Если построение функции ( ) теоретическим путем невозможно, например, из-за недостатка информации о процессах, происходящих в объекте, то данную зависимость определяют экспериментально. Целью проведения такого эксперимента является установление вида функциональной зависимости = ( ) и для этого должны одновременно определяться как значения так и соответствующие им значения , а задачей эксперимента является построение математической модели исследуемой зависимости. Фактически речь идет об установлении связи между двумя рядами наблюдений (в нашем случае, измерений), т.е. эксперимент в данном случае будет однофакторным.

Из всего многообразия связей обычно выделяют следующие два вида: функциональные связи (или зависимости) – при изменении одной величины другая изменяется так, что каждому значению соответствует совершенно определенное (однозначное) значение yi

а) б) в)

Рис.4.4.1 - Функциональная и стохастическая связь

Однако, на практике такой вид связей встречается достаточно редко. Влияние отдельных случайных факторов может быть достаточно мало, но в совокупности они могут существенно влиять на результаты эксперимента. В этом случае отмечаем наличие стохастической (вероятностной) связи между переменными.

Стохастические связи характеризуются тем, что переменная y реагирует на изменение другой переменной (переменных) Х изменением своего закона распределения. В результате зависимая переменная принимает не одно конкретное значение, а несколько из возможного множества значений; повторяя

= 0, 0 ≤ ≤

103

испытания, будем получать другие значения функции отклика, и одному значению в различных реализациях будут соответствовать различные значения у.

На рис.4.4.1. б) – кривая зависимости, проходящая по центру полосы экспериментальных точек (математическому ожиданию), которые могут и не лежать на искомой кривой = ( ), и занимают некоторую полосу вокруг нее. Эти отклонения вызваны погрешностями измерений, неполнотой модели и учитываемых факторов, случайным характером самих исследуемых процессов и т.п.

Форма связи устанавливает вид функциональной зависимости = ( ) и характеризуется уравнением регрессии. Если уравнение связи степнное, имеем зависимость вида:

=

+

 

 

(4.1)

0

 

=1

 

 

где ,

, … – коэффициенты уравнения.

0

1

 

 

 

Следует отметить, что задача выбора функциональной зависимости – неформальная. Решение о выборе той или иной математической модели остается за исследователем. Только экспериментатор знает, для какой цели создается, и как в дальнейшем будет использоваться создаваемая модель.

В наш компьютерный век построение модели не является сложной задачей, если исследователь четко представляет цель и задачи исследования. Поэтому для уяснения сущности и упрощения выкладок остановимся на рассмотрении метода, который лежит в основе построения стохастических зависимостей - метода наименьших квадратов.

4.4.1. Метод наименьших квадратов

Данный метод определения неизвестных коэффициентов уравнения регрессии был разработан Лежандром и Гауссом почти 200 лет назад.

Определение коэффициентов bj методом наименьших квадратов основано на выполнении требования, чтобы сумма квадратов отклонений экспериментальных точек от соответствующих значений уравнения регрессии была минимальна. Математическая запись этого требования выглядит следующим образом:

, , … ,

=

 

, , , … ,

2 → min

 

0 1

 

=1

0 1

 

 

 

где n - число экспериментальных точек в рассматриваемом интервале изменения аргумента.

Необходимым условием минимума функции 0, 1, … , является выполнение равенства

или

104

 

 

 

 

 

( )

 

 

 

 

 

 

 

 

 

 

 

, , , … ,

 

 

= 0, 0 ≤ ≤

 

 

 

 

0

1

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

После преобразования получим

 

 

 

 

 

 

 

 

 

 

 

( )

 

 

( )

 

 

 

 

 

 

 

, , , … ,

 

 

 

= 0.

 

 

 

 

0

1

 

 

 

 

 

 

 

=1

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

Система уравнений ( ) содержит столько же уравнений, сколько неизвестных коэффициентов 0, 1, … , , входит в уравнение регрессии, и называется в мате-

матической статистике системой нормальных уравнений.

Поскольку ≥ 0 при любых 0, 1, … , величина обязательно должна иметь хотя бы один минимум. Поэтому, если система нормальных уравнений имеет единственное решение, оно и является минимумом для этой величины.

Расчет регрессионных коэффициентов методом наименьших квадратов можно применять при любых статистических данных, распределенных по любому закону.

4.4.2. Определение тесноты связи между случайными величинами

Определив уравнение теоретической линии регрессии, необходимо дать количественную оценку тесноты связи между двумя рядами наблюдений. Линии регрессии, изображенные на рис.4.4.1 (б и в) качественно по-разному выражают связь между переменными.

При корреляционном анализе предполагается, что факторы и отклики носят случайный характер и подчиняются нормальному закону распределения.

Тесноту связи между случайными величинами характеризуется корреляционным отношением . Рассмотрим физический смысл этого показателя, для чего необходимо ввести некоторые понятия:

Остаточная дисперсия (остатки) 2 ост - характеризует разброс экспери-

ментально наблюдаемых точек относительно линии регрессии и представляет собой показатель ошибки предсказания параметра у по уравнению регрессии:

2 ост = 1

 

 

 

1

 

 

 

 

 

2

=

 

− ( , , , … , ) 2

,

 

 

 

 

 

 

 

− 1

 

0 1

 

 

=1

 

 

=1

 

 

 

 

 

 

 

 

 

 

где = + 1 - число коэффициентов уравнения модели.

Общая дисперсия (общий) 2 -характеризует разброс экспериментального

материала относительно среднего значения, т.е. линии С (см.рис.6.2)

2

=

1

 

 

 

2

,

 

 

 

 

 

−1

=1

 

 

 

 

 

 

 

где =

1

 

.

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

105

Средний квадрат отклонения линии регрессии от среднего значения линии С (средний) :

2

=

1

 

2 =

1

, , , … ,

2.

 

 

 

 

 

 

 

 

 

 

 

0 1

 

 

 

 

 

 

=1

 

 

=1

 

 

 

 

 

Очевидно, что общая дисперсия

2

(сумма квадратов относительно средне-

 

 

 

 

 

 

 

 

 

 

 

 

го значения) равна остаточной дисперсии

2

(сумма квадратов относительно

 

 

 

 

 

 

 

ост

 

 

 

 

линии регрессии) плюс средний квадрат отклонения линии регрессии 2

(сумма

 

 

 

 

 

 

 

 

 

 

 

 

квадратов, обусловленная регрессией).

2 = 2 ост + 2

Разброс экспериментально наблюдаемых точек относительно линии регрессии характеризуется безразмерной величиной – выборочным корреляционным отношением, которое определяет долю, которую привносит величина Х в общую изменчивость случайной величины у.

 

2

2

ост

 

2

 

 

 

=

 

=

 

=

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проанализируем свойства этого показателя.

1. В том случае, когда связь является не стохастической, а функциональной, корреляционное отношение равно 1, так как все точки корреляционного поля

оказываются на линии регрессии, остаточная дисперсия равна 2

ост

= 0 , а

 

 

2 = 2.

2.Равенство нулю корреляционного отношения указывает на отсутствие ка-

кой-либо тесноты связи между величинами х и у для данного уравнения регрессии, поскольку разброс экспериментальных точек относительно среднего значе-

ния и линии регрессии одинаков, т.е. 2 = 2 ост .

3. Чем ближе расположены экспериментальные данные к линии регрессии, тем теснее связь, тем меньше остаточная дисперсия и тем больше корреляционное отношение.

Следовательно, корреляционное отношение может изменяться в пределах от

0 до 1.

106

4.4.3. Регрессионный анализ

Как и корреляционный анализ, регрессионный включает в себя построение уравнения регрессии (например, методом наименьших квадратов) и статистическую оценку результатов.

При проведении регрессионного анализа принимаются следующие допуще-

ния:

1.Входной параметр х изменяется с весьма малой ошибкой. Появление ошибки в определении у объясняется наличием в процессе не выявленных переменных и случайных воздействий, не вошедших в уравнение регрессии.

2.Результаты наблюдений выходной величины – независимые нормально распределенные случайные величины.

3. При проведении параллельных опытов выборочные дисперсии должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений, а это возможно осуществлять при наличии однородных дисперсий (т.е. принадлежности экспериментальных данных к одной генеральной совокупности).

После того, как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в установлении адекватности уравнения и проверке значимости коэффициентов уравнения.

4.4.4. Проверка адекватности модели

Регрессионная модель называется адекватной, если предсказываемые по ней значения у согласуются с результатами наблюдений. Так, построив линейную модель, мы хотим убедиться, что никакая другая модель не даст значительного улучшения в описании предсказания значений у. В основе процедуры проверки адекватности модели лежат предположения, что случайные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковыми дисперсиями.

Сформулируем нуль-гипотезу Н0: «Уравнение регрессии адекватно». Альтернативная гипотеза Н1: «Уравнение регрессии неадекватно».

Для проверки этих гипотез принято использовать F-критерий Фишера. При

этом общую дисперсию (дисперсию выходного параметра) 2 сравнивают с оста-

точной дисперсией 2 ост . Определяется экспериментальное значение F- крите-

рия:

107

 

2

 

 

 

 

=

 

 

,

 

 

 

 

2

 

 

 

 

 

 

 

ост

 

 

 

 

Который в данном случае показывает, во сколько раз уравнение регрессии

предсказывает результаты опытов лучше,

чем среднее =

1

 

= = .

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

Если > ; 1, 2 то уравнение регрессии адекватно.

Чем больше значение

превышает ; 1, 2 для выбранного α

и числа степеней

свободы 1 = −

1, 2 = − , тем эффективнее уравнение регрессии.

 

 

 

 

Рассмотрим случай, когда для повышения надежности и достоверности осуществляется не одно, а m параллельных опытов (примем, что это число одинаковым для каждого фактора). Тогда общее число экспериментальных значений величины у составит N=n*m.

В этом случае оценка адекватности модели производится следующим обра-

зом:

1.

определяется среднее из серии параллельных опытов: =

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

рассчитываются значения параметра по уравнению регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.

рассчитывается дисперсия адекватности: 2

=

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

ад

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.

определяются

выборочные дисперсии для

параллельных опытов

2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5.

Определяется

дисперсия воспроизводимости

2

 

=

 

2

. Число

 

=1

 

 

 

 

 

 

 

 

 

воспр

 

 

 

 

 

 

степеней свободы этой дисперсии равно = − 1 ;

 

 

 

 

 

 

 

 

6.

Определяется

экспериментальное значение

критерия

Фишера:

=

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ад

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

воспр

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.

Определяется теоретическое значение критерия Фишера ; 1, 2, где

1 = − ; 2 = − 1 .

 

 

 

 

 

 

 

 

 

 

 

 

8.

Если < ; 1, 2 , то уравнение регрессии адекватно, в противном слу-

чае – нет.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.4.5. Проверка значимости коэффициентов уравнения регрессии

Надежность оценок уравнения регрессии можно охарактеризовать их доверительными интервалами ∆ , в которых с заданной вероятностью находится истинное значение этого параметра.

108

Наиболее просто построить доверительные интервалы для коэффициентов линейного уравнения регрессии, т.е. коэффициенты .

Для линейного уравнения среднеквадратическое отклонение i-ого коэффици-

ента уравнения регрессии можно определить по закону накопления ошибок

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При условии, что 2

= 2

= = 2 = 2

 

, получим для простейшего

1

 

2

 

 

 

 

 

воспр

 

 

 

уравнения регрессии = 0 + 1 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

=

 

восп

 

=1

 

 

 

,

 

 

 

 

 

 

 

 

 

 

2

 

0

 

 

 

2

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

=

 

 

 

восп

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

2

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

=1

 

 

 

 

Проверка значимости коэффициентов выполняется по критерию Стьюдента. При этом в качестве нуль-гипотезы проверяется: i-ый коэффициент уравнения регрессии отличен от нуля.

Построим доверительный интервал для коэффициентов уравнения регрессии

∆ = ;− ,

где число степеней свободы в критерии Стьюдента определяется по соотношению n-l. Потеря l=k+1 степеней свободы обусловлена тем, что все коэффициенты рассчитываются зависимо друг от друга.

Тогда доверительный интервал для каждого из коэффициентов уравнения регрессии составит − ∆ ; + ∆ . Чем уже доверительный интервал, тем с большей уверенность можно говорить о значимости этого коэффициента.

Основное правило при построении доверительного интервала для коэффици-

ентов: «Если абсолютная величина коэффициента регрессии больше, чем его доверительный интервал, то этот коэффициент значим». Другими словами,

если > ∆ , то коэффициент значим, в противном случае – нет. Незначимые коэффициенты исключаются из уравнения регрессии, а осталь-

ные коэффициенты пересчитываются заново, так как они зависимы и в формулы для их расчета входят разноименные переменные.

Задача сводится к определению критерия, позволяющего установить, принадлежать ли эти выборки одной генеральной совокупности?

109

4.5. Построение модели с помощью факторного эксперимента

Процесс построения многофакторной эмпирической математической модели технического объекта включает следующие исследовательские этапы:

1.Формирование цели исследования;

2.Выбор факторов и отклика, интересующих исследователя в его предметной области;

3.Выбор вида предполагаемой функции отклика;

4.Выбор типа плана эксперимента;

5.Выбор числа повторений опытов на каждом уровне;

6.Проведение эксперимента по разработанному плану;

7.Обработка результатов эксперимента с использованием статистических методов;

8.Проверка однородности дисперсий;

9.Расчет и оценка статистической значимости коэффициентов математической модели;

10.Проверка адекватности полученной эмпирической модели экспериментальному материалу;

11.Если получена адекватная модель, то переходим к следующему пункту12. Если адекватность модели не является удовлетворительной, необходимо по полученным данным принять решение, либо прейти к пункту 5 для уточнения модели, либо к пункту 3 для изменения вида предполагаемой функции отклика. После чего последовательность процесса повторяется.

12.Представление и анализ результатов исследований.

Рассмотрим основные вопросы статистической обработки данных многофакторного эксперимента.

В общем случае отклик объекта является случайным, поэтому в каждой точке факторного пространства выполняется опытов, которые называются параллельными. Дублирование опытов позволяет:

Проверить воспроизводимость эксперимента;Проверить адекватность модели и исследуемого процесса.

В качестве отклика принимается среднее арифметическое из измере-

ний.

Всего матрица планирования описывает опытов.

Выполнение опыта в - ой точке факторного пространства производится следующим образом:

110

1.По кодированным значениям факторов для i- ой строки плана определяются натуральные значения координаты ;

2.Факторы поочередно выставляются на уровни, соответствующие строкам матрицы планирования;

3.Измеряется отклик . После проведения всех Параллельных опытов производится оценка выборочной дисперсии каждого отклика

2

=

1

 

 

 

( − )2

,

 

 

 

 

 

−1

=1

 

 

 

 

 

 

 

 

 

 

 

где =

1

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

Проверка воспроизводимости опыта. Удачный эксперимент предполагает

воспроизводимость, что означает одинаковость дисперсий функции отклика в каждой точке опыта.

Проверка воспроизводимости проводится по критерию Кохрена об однородности дисперсий, который основан на законе распределения отношения максимальной оценки дисперсии к сумме всех сравниваемых оценок дисперсий. (см.стр. )

Процедура проверки следующая:

1. Среди всех дисперсий множества откликов определяется максимальное значение 2 ;

2.Вычисляется отношение для вычисления статистики критерия

 

 

 

2

 

 

Кохрена =

 

 

,

= 1 … количество строк матрицы планирования

 

2

 

 

 

 

 

 

=1

 

 

 

3.

Определяется число степеней свободы 1 = − 1, 2 = ;

4.Выбирается уровень значимости для - распределения. Обычно это = 0.05;

5.По таблице - распределения Кохрена определяется критическое значение т;

6.Сравнивается значение вычисленное с критическим значени-

ем т;. Если т; то дисперсии однородны и эксперимент обладает воспроизводимостью. Если > т, то эксперимент повторяют по 2-м возможным вариантам:

- увеличивают число параллельных опытов ; - отбрасывают резко выделяющиеся значения отклика путем проверки на наличие грубых ошибок (см. ).