- •5.1. Эвристика как наука. Задачи эвристического подхода к достижению идеального конечного результата
- •5.2. Коллективное творчество
- •5.3. Морфологический анализ. Программное решение технических задач
- •5.4. Ассоциативные методы
- •5.5. Метод контрольных вопросов
- •5.6. Синектка
- •6.1. Общая характеристика методов исследования
- •6.2. Математические методы синтеза радиоэлектронных систем
- •6.3. Теоретико-игровой синтез сложных систем в конфликтных ситуациях
- •6.4. Реализация пропускной способности систем и минимаксные свойства распределений
- •7.1. Общие вопросы измерений в электронике
- •7.2 Погрешности в радиотехнических измерениях.
- •8 1. Методология эксперимента
- •8 2. Разработка плана-программы эксперимента
- •8.3. Статистические методы оценки измерений в экспериментальных исследованиях
- •8.4. Определение законов распределения случайных величин на основе опытных данных
- •9.1. Исходные предпосылки и постановка задачи
- •9.2. Максимум экономического эффекта как функция цели и фактор времени
- •9.3. Закон экономии времени – важнейший социальный закон
- •9.4. Экологическая стратегия и стратегия интенсификации
- •9.5. Технико-экономическая эффективность внедрения научных
- •Заключение
7.2 Погрешности в радиотехнических измерениях.
7.2.1. Абсолютная и относительная погрешности, точность измерений.
Абсолютной
погрешностью измерения
называется алгебраическая
разность между измеренным
и
истинным
значениями
измеряемой величины:
.
(7.1)
Абсолютная
погрешность
может быть положительной и отрицательной;
в тех случаях, когда знак погрешности
неизвестен, перед
ставят знак ±.
Отношение абсолютной погрешности к истинному значению измеряемой величины называют относительной погрешностью, которая выражается в долях измеряемой величины либо в процентах:
або
. (7.2)
Относительная погрешность обычно играет более существенную роль в метрологии, чем абсолютная, так как первая связана с характеристикой точности измерений.
Точностью
измерений характеризуется близость
результатов
измерений к истинному значению измеряемой
величины. Количественно точность
измерений определяется величиной,
обратной относительной погрешности
.
Так, если относительная погрешность
,
то точность измерений составляет
.
7.2.2. Систематические погрешности.
Как уже отмечалось, в метрологии разделяют погрешности измерения на:
1) систематические;
2) случайные;
3) грубые (промахи).
К систематическим погрешностям измерения относятся составляющие погрешности, которые входят с постоянной величиной и знаком в данную серию измерений (опытов) или закономерно изменяются при повторных измерениях одной и той же величины.
Систематическую погрешность, например, вносит смещение нулевой точки шкалы миллиамперметра: если стрелка шкалы при отсутствии тока стоит на делении 1.2 мА, то во все измерения на этом приборе входит систематическая погрешность 1.2 мА.
Согласно источнику происхождения, можно разделить систематические погрешности на следующие разновидности.
Инструментальные погрешности обусловливаются средствами измерения (приборами). Эти погрешности возникают вследствие свойств измерительной аппаратуры (недостатки конструкции, технологии, неточности градуировки шкал приборов и пр.).
Установочные погрешности обусловливаются специфическим расположением средств измерения (отклонение гальванометров от вертикального направления, влияние ориентации магниточувствительных приборов относительно магнитного поля Земли и др.).
Методические
погрешности возникают в результате
упрощения расчетной формулы для
измеряемой величины,
а также вследствие ограниченной точности
физических
констант, входящих в расчеты. Так,
например,
при использовании известных постоянных
и
,
которые являются округленными значениями
дуговой меры и основания натуральных
логарифмов. Более точные значения этих
констант соответственно равны
3.141593;
2,718282.
Погрешности вычислений обусловлены приближенными вычислениями: округлением результатов вычислений; применением линеаризации, аппроксимации, интерполяции.
Внешние погрешности возникают в результате влияния на результат измерений свойств внешней среды и внешних условий: вибрации, тряски, электромагнитных помех, влажности и давления воздуха, температуры окружающей среды и др.
Личные, или субъективные, погрешности вносятся в процесс измерений человеком-оператором (наблюдателем) и обусловлены особенностями психофизиологического восприятия сигнала-раздражителя (чувствительность органов слуха и зрения, степень утомляемости, быстрота реакции и пр.).
По характеру изменения систематические погрешности делятся на постоянные и прогрессивные. Постоянную систематическую погрешность невозможно обнаружить по результатам идентичных измерении. Полученные, например, результаты измерения частоты: 15.3; 15.6; 15.4 МГц не позволяют выявить систематическую погрешность. Для ее обнаружения необходимо провести специальные контрольные измерения этих частот с использованием, например, первичного эталона частоты. При этом сравнительный анализ результатов обнаружит наличие систематической погрешности у неэталонного частотометра. Прогрессивные погрешности в данной серии измерений (опытов, экспериментов) непрерывно возрастают или убывают, как, например, погрешность, обусловленная постепенным уменьшением напряжения источника питания в измерительной цепи.
Для уменьшения систематических погрешностей применяют следующие способы:
тщательную регулировку и юстировку средств измерений, устранение внешних влияний путем экранирования, термостатирования и т. д.;
расчет систематической погрешности и введение поправки, которую алгебраически добавляют к неверному значению измеряемой величины;
организацию процесса измерений таким образом, чтобы в среднем результате происходила компенсация различных систематических погрешностей измерения (применение экспертных оценок, рандомизация последовательности опытов и пр.).
7.2.3. Случайные погрешности. Статистические характеристики результатов измерения.
Кроме постоянно действующих причин, обусловливающих появление систематических погрешностей, на результат измерения влияют разнообразные случайные факторы, которые меняются от измерения к измерению: колебания климатических условий (давления, влажности, температуры), случайное положение глаза человека-оператора при отсчете результата измерения по шкале (ошибки на параллакс) и др. В результате влияния случайных факторов вносится случайная погрешность. Случайной погрешностью называется составляющая погрешности измерения, значение которой меняется случайным образом при повторных измерениях одной и той же величины.
Случайные погрешности в радиотехнике, вызванные различного рода шумами самих элементов радиоприемного устройства, атмосферными, ионосферными, галактическими и т. д., помехами естественного и искусственного происхождения, также требуют оценки и учета при проектировании и эксплуатации различного назначения радиотехнических систем.
Случайная погрешность обнаруживается в процессе измерений лишь тогда, когда измерительный прибор обладает достаточно высокой чувствительностью для выявления влияния случайных факторов. Предположим, например, что при измерении чувствительности радиоприемного устройства результаты трех измерений оказались равными соответственно 1.30; 1.25; 1.35 мкВ. Случайными факторами, приведшими к рассеянию результатов, могли оказаться: нестабильность частоты генератора стандартных сигналов; неточность установки лимбов «напряжение» и «частота» вследствие оптического параллакса; воздействие внешних помех в результате плохой экранировки эквивалента антенны радиоприемника; флуктуации источников питания экспериментальной установки. Изучение случайных погрешностей основано на применении теории вероятностей и математической статистики.
Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания; они представляют собой математическое выражение реальных закономерностей, фактически существующих в массовых случайных явлениях природы. Каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Оперируя такими понятиями, как события и их вероятности, случайные величины, их законы распределения и числовые характеристики, теория вероятностей дает возможность теоретическим путем определять вероятности одних событий через вероятности других, законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характеристики других. Такие косвенные методы позволяют значительно экономить время и средства, затрачиваемые на эксперимент, но отнюдь не исключают самого эксперимента. Каждое исследование в области случайных явлений, как бы отвлеченно оно ни было, корнями своими всегда уходит в эксперимент, в опытные данные, в систему наблюдений.
Разработка методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений, составляет предмет специальной науки – математической статистики.
Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму.
Охарактеризуем вкратце некоторые типичные задачи математической статистики, часто встречаемые на практике.
. Задача определения закона распределения случайной величины по статистическим данным
Закономерности, наблюдаемые в массовых случайных явлениях, проявляются тем точнее и отчетливее, чем больше объем статистического материала. При обработке обширных по своему объему статистических данных часто возникает вопрос об определении законов распределения тех или иных случайных величин. Теоретически при достаточном количестве опытов свойственные этим случайным величинам закономерности будут осуществляться сколь угодно точно. На практике нам всегда приходится иметь дело с ограниченным количеством экспериментальных данных; в связи с этим результаты наблюдений и их обработки всегда содержат больший или меньший элемент случайности. Возникает вопрос о том, какие черты наблюдаемого явления относятся к постоянным, устойчивым и действительно присущи ему, а какие являются случайными и проявляются в данной серии наблюдений только за счет ограниченного объема экспериментальных данных. Естественно, к методике обработки экспериментальных данных следует предъявить такие требования, чтобы она, по возможности, сохраняла типичные, характерные черты наблюдаемого явления и отбрасывала все несущественное, второстепенное, связанное с недостаточным объемом опытного материала. В связи с этим возникает характерная для математической статистики задача сглаживания или выравнивания статистических данных, представления их в наиболее компактном виде с помощью простых аналитических зависимостей.
. Задача проверки правдоподобия гипотез
Эта
задача тесно связана с предыдущей. При
решении такого рода
задач мы обычно не располагаем настолько
обширным статистическим
материалом, чтобы выявляющиеся в нем
статистические закономерности
были в достаточной мере свободны от
элементов случайности.
Статистический материал может с большим
или меньшим правдоподобием
подтверждать или не подтверждать
справедливость той
или иной гипотезы. Например, может
возникнуть такой вопрос: согласуются
ли результаты эксперимента с гипотезой
о том, что данная
случайная величина подчинена закону
распределения
?
Другой
подобный вопрос: указывает ли наблюденная
в опыте тенденция
к зависимости между двумя случайными
величинами на наличие действительной
объективной зависимости между ними или
же она
объясняется случайными причинами,
связанными с
недостаточным
объемом
наблюдений? Для решения подобных задач
математическая статистика выработала
ряд специальных приемов.
Задача нахождения неизвестных параметров распределения
Часто при обработке статистического материала не возникает вопрос об определении законов распределения исследуемых случайных величин. Обычно это бывает связано с недостаточным объемом экспериментального материала. Иногда же характер закона распределения качественно известен до опыта, из теоретических соображений; например, часто можно утверждать заранее, что случайная величина подчинена нормальному закону. Тогда возникает более узкая задача обработки наблюдений – определить только некоторые параметры (числовые характеристики) случайной величины. При небольшом числе опытов задача более или менее точного определения этих параметров не может быть решена; в этих случаях экспериментальный материал содержит в себе неизбежно значительный элемент случайности; поэтому случайными оказываются и все параметры, вычисленные на основе этих данных. В таких условиях может быть поставлена только задача об определении так называемых оценок для искомых параметров, т. е. таких приближенных значений, которые при массовом применении приводили бы в среднем к меньшим ошибкам, чем всякие другие. С задачей отыскания оценок числовых характеристик тесно связана задача оценки их точности и надежности.
Таков далеко не полный перечень основных задач математической статистики. Мы перечислили только те из них, которые наиболее важны для нас по своим практическим применениям. В настоящем разделе и в разделе 8 мы вкратце познакомимся с некоторыми, простыми, элементарными задачами математической статистики и с методами их решения.
Оценка
измеряемого параметра.
Если
предположить, что
при прямом измерении искомого параметра
случайная
погрешность намного больше систематической
погрешности средств измерения, исходя
из постулата о
среднем арифметическом, согласно
которому наивероятнейшим
значением
из
ряда независимых наблюдений
при нормально распределенных ошибках
будет их среднее арифметическое
:
, (7.3)
где
– общее
число наблюдений (объем выборки).
Из
теории вероятностей известно, что
среднее арифметическое
ряда наблюдений нормально распределенной
величины X
есть также
нормальная величина с тем же математическим
ожиданием
и со
среднеквадратическим отклонением (СКО)
,
где
–
СКО
отдельного наблюдения (опыта). Последнее
означает, что область рассеивания
среднего арифметического в
разных рядах наблюдений по
наблюдений
в каждом будет
в
раз меньше области рассеивания результатов
отдельного
наблюдения. Зона рассеивания случайной
величины характеризуется дисперсией
и СКО
.
Среднее арифметическое (7.3) обеспечивает наилучшую оценку среднего значения только при нормальном распределении, наиболее распространенном среди случайных процессов, особенно при достаточно большом числе независимых случайных величин с одинаковым распределением вероятностей (закон больших чисел). Для других распределений ошибок среднее арифметическое не дает наилучшую, оценку. Так, например, при равномерном распределении наилучшей оценкой среднего значения является полусумма крайних членов:
.
Оценка СКО группы наблюдений.
Оценка среднеквадратического отклонения группы отдельных наблюдений находится по формуле
. (7.4)
Оценка СКО среднего арифметического результата измерения.
Если
определяет СКО
отдельных наблюдений, то
– рассеивание
результатов измерений, т. е. выборочное
среднее арифметическое,
получаем как
. (7.5)
В случае большого числа наблюдений эмпирические оценки по формулам (7.4), (7.5) близки к истинным.
В тех случаях, когда погрешность средств измерения намного превосходит случайную погрешность, за предельную погрешность однократного или совпадающих многократных прямых наблюдений, а также за погрешность измерений, в которых случайная составляющая намного меньше систематической, следует принять предел систематической погрешности средства измерения.
Если систематическая и случайная погрешности измерения соизмеримы, то предел суммарной погрешности результата измерений можно определить как
,
(7.6)
где
– оценка
СКО результатов наблюдений по формуле
(7.4);
случайная составляющая погрешности
измерения;
– параметр Стьюдента, равный
при
доверительной вероятности
,
характеризующей точность измерений
(В табл. Б2
додатку Б приведены квантили распределения
Стьюдента);
– соответственно нижняя и верхняя
границы
интервала;
– предельное значение систематической
погрешности.
7.2.4. Статистические характеристики результатов косвенных измерений.
В
радиотехнике во многих случаях
используются косвенные измерениияя.
Например, чтобы найти сопротивление
некоторого резистора
,
к нему прикладывают напряжение
,
измеряют ток
,
протекающий через резистор и определяют
сопротивление
как
.
Это самый простой пример косвенных
измерений.
Вправа 7.2
Наведіть 2 –3 приклади непрямих вимірів у радіотехніці і телекомунікації.
В
связи с этим часто важно при выполнении
НДР проводить анализ статистических
характеристик оценок погрешностей
косвенных
измерений. При косвенных измерениях
искомая величина
не
измеряется непосредственно, а
рассчитывается
по формуле
,
которая
связывает
ее с величинами
,
оценки которых можно получить прямыми
измерениями.
В тех случаях, когда результаты прямых
измерений
содержат случайную погрешность, функция
является
также случайной. Ниже приводятся
расчетные
формулы для оценки числовых характеристик
при косвенных
измерениях.
Оценка среднего значения функции.
,
где
–
среднее арифметическое аргумента
.
Оценка СКО случайной составляющей погрешности.
Если
–
оценка СКО среднего арифметического
,
определяемая
по формуле (7.5), то СКО случайной
составляющей
погрешности будет
,
где
–
частная производная функции по аргументу
,
в
выражение которой подставлены значения
средних
арифметических
.
В последующих главах данного раздела приведены основы теории планирования экспериментов, где могут быть использованы рассмотренные методы оценки погрешностей измерения. Прежде, чем рассмотреть основы теории планирования экспериментов, необходимо хотя бы кратко ознакомиться с некоторыми правилами отбора и простыми (традиционными) алгоритмами планирования экспериментов, базирующихся на методах математической статистики.
7.3. Простые правила и алгоритмы планирования экспериментов [19, 20]
7.3.1. Способы отбора.
Применение методов математической статистики к обработке наблюдений основано на глубокой аналогии между производством наблюдений и отбором из некоторой генеральной совокупности. При этом в качестве генеральной совокупности рассматривается чисто гипотетическая совокупность всех возможных результатов наблюдений при данном комплексе условий испытания. Отбор данных из этой совокупности производится в процессе наблюдений независимо от нашей воли. Из-за этого основным фактором отбора наблюдений всегда является случайность, что и позволяет применять для обработки наблюдений основные положения теории вероятностей.
Отбор данных, происходящий помимо нашей воли, можно назвать естественным отбором; именно таким является отбор данных при наблюдениях. Однако при производстве наблюдений и при дальнейшей их обработке часто возникает необходимость и в других, искусственных способах отбора. Например, при анализе вещества приходится делать пробы из разных участков, чтобы нейтрализовать возможную неоднородность материала; отбор проб при этом находится целиком в нашем распоряжении. При контроле за производством приходится выбирать образцы из общей продукции. При различных экономических и демографических исследованиях также нужен предварительный отбор объектов для изучения. Примеры таких случаев, когда исследователь вынужден делать сознательный выбор, можно еще долго продолжать; отметим лишь в заключение, что даже заготовленный уже цифровой материал может нуждаться в дополнительном отборе в целях сокращения объема, в целях удаления неподходящих данных и в целях проверки правильности и добросовестности полученных данных и подготовительных расчетов – подобный отбор также производится исследователем целиком по его воле.
Существует много способов искусственного отбора. Выбор того или иного способа зависит от цели отбора, от поставленной задачи. В самом общем плане способы отбора делятся на две группы: пристрастные и репрезентативные.
Пристрастными называются такие способы отбора, при которых отбираются элементы по какому-либо заранее намеченному признаку; при этом проверке подлежат все элементы совокупности, из которой делается отбор. Например, из совокупности чисел отбираются самых больших или отбираются все числа, не достигающие нужной величины. Пристрастный отбор применяют и для того, чтобы изъять все наблюдения, например, с нарушенными условиями испытания и является важной стадией эксперимента; его задача при этом состоит обычно в том, чтобы устранить все заметные нарушения условий испытания. С помощью пристрастного отбора нередко удается ликвидировать те или иные доминирующие (несимметричные) факторы, нарушающие нормальность распределения.
Пристрастный отбор всегда является сознательным с ясной характеристикой данных, подлежащих отбору, поэтому он редко вызывает затруднения. Сложнее обстоит дело со второй группой способов отбора.
Способы отбора называются репрезентативными, если отобранная группа элементов достаточно полно характеризует всю совокупность, из которой был сделан отбор. Разумеется, как бы ни был удачен отбор, в суждениях о всей совокупности будет элемент случайности. Более того, некоторые особенности всей совокупности вообще не отразятся на отобранной группе элементов, поэтому «репрезентативность» отбора, вообще говоря, является относительной и связана с конкретной числовой характеристикой совокупности, которая изучается с помощью отобранных элементов,
Фактически
репрезентативный отбор применяется
тогда,
когда судить о характеристиках
совокупности, используя
все ее элементы, невозможно (либо слишком
трудно или дорого) из-за
того, что эта совокупность чересчур
велика, а возможно, и не вся доступна
анализу. Если объем
этой
совокупности
очень велик, то его практически можно
считать бесконечным.
В этом случае заданную совокупность
можно рассматривать
как генеральную,
а отобранные элементы как
выборку, применяя в дальнейшем все
достижения общего
выборочного метода. Если же
не
очень велико по сравнению
с количеством
отобранных
элементов (скажем,
),
то с числом
нужно
считаться при интерпретации
результатов отбора.
Количество
отбираемых элементов можно определить,
если
известна дисперсия
изучаемой характеристики (по каким-либо
предыдущим данным). Это количество будет
зависеть
от той точности, с которой мы хотим
получить значение
характеристики. Если эта точность задана
допустимой
дисперсией
,
то
определяется
из формулы
, (7.7)
которая при очень больших принимает вид
(7.8)
Эту формулу легко объяснить: есть как бы генеральная дисперсия, а есть дисперсия среднего выборки из элементов, которая всегда в раз меньше «одиночной» дисперсии.
Рассмотрим пример.
Приклад 7.3
Пусть
из предыдущих анализов
известна дисперсия, связанная с
неоднородностью некоторого вещества
и равная
.
Допустим, что нам нужно знать содержание
вещества с дисперсией
причем
на методику анализа приходится дисперсия
(ошибка воспроизводимости). Это значит,
что на долю
неоднородности допускается оставить
дисперсию
.
Розв‘язання.
Если в нашем распоряжении измерений, то искомое число проб определится из равенства
,
т. е. равно четырем.
Выбор того или иного способа репрезентативного отбора зависит от степени знаний о всей совокупности. Если, например, известно, что элементы в совокупности расположены случайным образом, то можно применять механический отбор – отбирать каждый пятый или каждый десятый и т. п. элемент. Если же в последовательности элементов имеется некоторая ритмичность, то нужно применять аритмичный отбору например, в первой десятке брать первый элемент, во второй десятке – второй и т. д. Скажем, анализируя раз в день качество работы оборудования, мы не должны брать пробы в одно и то же время дня. Иногда вся совокупность заведомо разбивается на отдельные части, которые желательно равномерно учесть. В этом случае применяют типический отбор, т. е. отдельно отбирают элементы из каждой части и только сводят их в общую группу.
В тех случаях, когда о всей совокупности ничего не известно, единственной гарантией репрезентативности может служить случайный отбор. Для того чтобы отбор был случайным, нужно все элементы совокупности пронумеровать; номера отобранных элементов должны образовывать случайную последовательность чисел. В данном случае речь идет о том, чтобы создать случайную последовательность, собственной волей имитировать случай.
Имитация случая является весьма трудной задачей. Как бы вы ни старались, выписывая числа, делать их случайными, в них обязательно проявится (особенно при больших объемах) какой-то бессознательно выбранный вами план. На помощь приходит ЭВМ. При выполнении лабораторной работы №4 вы познакомитесь с тем, как можно генерировать псевдослучайные числа с заданным законом распределения.
7.3.2. Выбор числа наблюдений.
Увеличение
числа параллельных
наблюдений
является
основным способом повышения точности
статистического анализа. Действительно,
среднее выборки объема
имеет
дисперсию в
раз
меньше, чем одиночные наблюдения. Поэтому
для определения необходимого
числа наблюдений достаточно знать
генеральную дисперсию наблюдений
и допустимую дисперсию результата
;
при этом
.
Увеличивая , можно неограниченно повышать точность найденного результата, лишь бы только в процессе наблюдений не менялись условия испытания. Именно этим приемом пользуются, чтобы уменьшить доверительный интервал при неизменной доверительной вероятности.
Сложнее
обстоит дело с выбором числа наблюдений
при проверке
гипотез. Это число должно одновременно
служить двум целям: уменьшать вероятность
ошибки
первого рода (отклонение
правильной гипотезы) и вероятность
ошибки второго
рода (принятие неверной гипотезы). Первая
вероятность
совпадает с принятым уровнем значимости
.
Вторая
вероятность зависит от многих факторов
и в первую очередь
от того, насколько неверна принимаемая
гипотеза. Поэтому
под
понимают обычно наибольшую
возможную вероятность
ошибки второго рода
при любых отклонениях от правильной
гипотезы. Контроль
за ошибками второго рода является
трудной задачей, требуя специальных
методов проверки гипотезы. Общий
принцип такого контроля поясним на
примере конкретной
гипотезы. Але спочатку визначимо одну
важливу для подальшого величину:
квантіль.
Квантіль
– у розподілі частот це точка, що поділяє
дані у заданому співвідношенні, тобто
квантілем
розподілу випадкової величини
з функцією розподілу
звуть розв‘язання рівняння
.
Іншими словами, квантіль
є таким значенням випадковою величини
,
що
.
Квантілі стандартного нормального
розподілу (
)
позначають
.
Їх лего знайти за таблицею Б1 додатку
Б. Квантіль
загального нормального розподілу з
параметрами
і
визначається допомогою квантілів
:
.
Поняття квантіль використовують не тільки для нормального розподілу, але й для розподілів інших типів.
Рассмотрим пример.
Приклад 7.4
Пусть
изучается
нормально распределенная случайная
величина
с дисперсией
.
Высказывается гипотеза, что генеральное
среднее этой величины
(односторонняя
гипотеза). Требуется проверить эту
гипотезу по одному
наблюдению
.
Розв‘язання.
Если
мы хотим, чтобы вероятность ошибки
первого рода была не больше
,
мы должны считать гипотезу
неверной только, если
,
где
– квантиль
стандартного нормального распределения.
Действительно,
с доверительной вероятностью
справедлива односторонняя
оценка
,
которая позволяет утверждать, что
лишь
при
.
Если
окажется, что
,
то мы
будем вынуждены рассматриваемую
гипотезу признать справедливой, хотя,
возможно,
допустим при этом ошибку второго рода.
Вероятность
неравенства
зависит
от того, каким на самом деле является
.
Если обозначить через
функцию нормального
распределения со средним
и
дисперсией
,
то
или, используя функцию Лапласа (див.
коментар до табл. Б1 у додатку Б),
. (7.9)
Если
,
то гипотеза неверна. Однако в принципе
может быть сколь угодно близким к нулю,
а это значит, что
будет сколь угодно близка к
.
Вправа 7.3
Доведіть справедливість цієї рівності.
Таким образом, максимальная вероятность ошибки второго рода равна
(7.10)
Вправа 7.4
Доведіть справедливість цієї рівності.
Например,
при обычном уровне значимости
вероятность ошибки второго рода будет
,
т. е. мы почти всегда ошибемся и примем
неверную гипотезу.
Итак,
желая застраховать себя от несправедливого
отклонения
верной гипотезы, мы впадаем в другую
крайность, объявляя
правильными почти сплошь нев
Рис.
7.1
.
А это значит, что большой стянет
вероятность
,
но по-прежнему равная
.
Соотношение вероятностей
и
наглядно представлено на рис. 7.1, где
эти вероятности выражаются
площадями участков под нормальной
кривой. Площадь, расположенная вправо
от критического значения, равна
,
расположенная влево равна
.
Стараясь уменьшить
,
мы сдвигаем это критическое значение
вправо, стараясь уменьшить
– влево. Ясно, что с помощью единого
критического значения невозможно даже
добиться того, чтобы обе эти вероятности
были меньше
.
На
практике обычно вероятности ошибок
обоих родов задаются заранее и являются
малыми числами (не больше 0.1).
В этом случае при проверке гипотезы
приходится пользоваться
одновременно
двумя
критическими значениями: считать
гипотезу верной, если
,
и
неверной, если
.
Такой
подход обеспечивает заданный уровень
вероятностей
ошибок первого и второго рода, однако
при этом
появляется участок
неопределенности
.
Длина
этого участка
(7.11)
называется неопределенностью критерия. Вопрос о том, какой вывод делать в случае, если попадет на участок неопределенности, решается применительно к условиям задачи; чаще всего в этом случае гипотеза объявляется сомнительной и подвергается повторному анализу.
Неопределенность критерия существенно ухудшает эффект статистического анализа гипотез. Поэтому ее всячески пытаются, если не устранить вообще (мы уже видели, что это невозможно), то по крайней мере сделать как можно меньше. Непосредственно из (7.11) следует, что это можно сделать и при неизменных заданных и , если уменьшать дисперсию .
Уменьшать
дисперсию можно, повышая точность
методики.
Но более универсальным и надежным
средством является
увеличение числа параллельных наблюдений.
Действительно,
если вместо одиночного провести
параллельных
наблюдений и рассмотреть их среднее
,
то
его дисперсия
.
Проверяя гипотезу по значению
,
мы
должны
будем принять ее, если
,
и отвергнуть, если
.
Неопределенность
станет теперь равной
,
т. е.
уменьшится в
раз.
В практических задачах допустимая неопределенность критерия задается обычно заранее, наряду с вероятностями и . Это позволяет сразу же определить необходимое число параллельных наблюдений (повторностей):
. (7.12)
Проиллюстрируем сказанное конкретным примером.
Приклад 7.5 [20]
Лаборатория
химического завода проверяет выпускаемую
продукцию,
чтобы содержание вредной примеси не
превышало
0.04%. Ошибка воспроизводимости одиночного
анализа
.
Требуется, чтобы вероятность пропустить
бракованную
продукцию не превышала
.
Вместе с тем
анализ не должен браковать хорошую
продукцию. Разумеется,
если содержание примеси в продукции
«на пределе», какие-либо гарантии дать
трудно. Но можно, например,
потребовать, чтобы вероятность забраковать
продукцию
с содержанием примеси ниже
(достаточно хорошая
продукция) не превышала
.
Нужно определить
количество параллельных анализов
,
которое позволило бы
удовлетворить всем поставленным
требованиям.
Розв‘язання.
Чтобы
использовать проведенные ранее
теоретические рассуждения,
будем в качестве случайной величины
рассматривать
отклонение результата анализа примеси
от заданного
предела 0.04. Генеральное среднее
величины
даст
истинное значение этого отклонения.
Предположение «продукция
годна» совпадает с гипотезой
.
Вероятности
и
заданы в явном виде, допустимую
неопределенность критерия легко найти:
.
Отсюда согласно (7.12) находим:
Ч
исленные
значения квантилей найдем из таблицы
Б1.
Вправа 7.5
Поясніть, як знайдено оцінки 2.05 і 1.64.
Таким образом для выполнения всех требований задачи нужно делать четыре анализа (повтора). Продукция будет при этом признана безоговорочно годной, если среднее отклонение по результатам этих четырех измерений будет удовлетворять условию
т. е. если по результатам четырех анализов содержание примеси (в среднем) окажется меньше 0.038%.
Если результат анализа будет больше, чем 0.038%, то продукция является или сомнительной (в пределах участка неопределенности), или бракованной. Обычно участок неопределенности присоединяют к участку непригодной продукции, считая продукцию бракованной всегда, как только результат анализа окажется больше 0.038%. Связано это с тем, что завод при выпуске продукции никогда не работает «на пределе», поэтому вероятность продукции с содержанием примеси, близким к 0.04%, достаточно мала.
Описанная схема анализа предполагает, что число параллельных наблюдений выбирается до опыта и в дальнейшем не меняется. Однако если бы первый же анализ из рассмотренного примера показал содержание примеси 0.02%, вряд ли стоило бы продолжать анализы. Иными словами, выбранное заранее всегда достаточно для получения заданных вероятностей и , но отнюдь не всегда необходимо.
До
сих пор во всех наших рассуждениях
проверялась гипотеза
.
Гипотеза
проверяется
аналогично, только
теперь ее нужно принимать, если
Обе эти гипотезы односторонние и проверяются с помощью односторонних критериев.
Если
же проверяется двусторонняя гипотеза
(ни
больше,
ни меньше), то для проверки нужно применить
двусторонний критерий. Пусть, по-прежнему,
вероятность отклонить
верную гипотезу равна
,
а вероятность принять гипотезу,
в то время как на самом деле
,
равна
.
Тогда число наблюдений определяется
формулой
. (7.13)
Мы рассмотрели вопрос о выборе числа параллельных наблюдений, когда дисперсия наблюдений известна заранее. Если же заранее неизвестна, то для оценок нужно применять критерий Стьюдента. Выбор числа наблюдений при этом существенно усложняется и мы здесь такую задачу рассматривать не будем.
7.3.3. Последовательный анализ.
Число наблюдений можно сократить, если по ходу анализа учитывать уже сделанные наблюдения. Обобщением этой идеи служит разработанный Вальдом метод последовательного анализа. В этом методе после каждого нового наблюдения решают, принять гипотезу, отклонить или продолжать испытания. Последовательный анализ позволяет сокращать число необходимых наблюдений в среднем в два раза по сравнению с обычными методами, фиксирующими число наблюдений заранее.
Последовательный
анализ используется при решении многих
задач, в частности, статистической
радиотехники. Мы
рассмотрим его применение только к
анализу генерального среднего
наблюдаемой
случайной величины. Допустим,
что нам нужно сделать выбор между
гипотезами
и
(предполагается,
что
).
Вероятность принять гипотезу
,
когда в действительности
,
это
.
Вероятность
противоположной ошибки, т.
е. принятия гипотезы
,
когда в действительности
,
это
.
Числа
и
обычно малы и задаются
заранее.
Основная
идея последовательного анализа
заключается в следующем. При каждой
совокупности наблюдений
мы можем
найти вероятность
того, что эти наблюдения
получены из совокупности с генеральным
средним
и
вероятность
того,
что они получены из совокупности
с генеральным средним
.
На
практике обычно осуществляются события
с максимальной вероятностью. Это значит,
что
при
нужно
считать более правдоподобным значение
(а с ним и
всю гипотезу
).
Если же
,
то предпочтение
нужно отдать второй гипотезе
.
Итак,
все определяется отношением
правдоподобия
,
а именно, будет
ли оно больше или меньше единицы. Ясно,
однако, что
в случае, когда отношение правдоподобия
лишь немного отличается
от единицы, предпочтение соответствующей
гипотезе
будет весьма сомнительным и лучше всего
продолжить
испытания. Точные показатели, насколько
должно отношение правдоподобия отличаться
от единицы, чтобы между
гипотезами можно было сделать уверенный
выбор, определяются
заданными вероятностями
и
.
Было показано,
что гипотезу
можно принять,
если
и гипотезу можно принять, если
Если же
,
то испытания надо продолжать.
При каждом новом наблюдении границы для отношения правдоподобия не меняются, меняется лишь само отношение. Это облегчает применение последовательного анализа, позволяет его свести к простым алгоритмам.
Если наблюдаемая случайная величина имеет нормальное распределение с заранее известной дисперсией , то условие продолжения испытаний можно преобразовать к виду
,
(7.14)
где
(7.15)
(7.16)
.
(7.17)
Константы
и
подсчитываются
сразу же по исходным данным,
благодаря чему дальнейшая проверка
ведется только
по сумме проделанных наблюдений и их
числу.
Рис.
7.2
.
Испытания нужно продолжать, пока эти
точки будут находиться в полосе между
прямыми
и
(рис. 7.2). Если же хоть одна точка окажется
ниже этой полосы, анализ нужно прекращать
и принимать гипотезу
.
Точно так же
гипотеза
принимается, как только
хоть одна точка окажется
выше указанной полосы.
Рассмотрим пример.
Приклад 7.6
В
магазин, в лабораторию или цех партиями
поступает некоторая продукция, например,
резисторы. К партии предъявляются
достаточно жесткие требования: количество
бракованной продукции не должно превышать
5% с вероятностью 0.95, если это условие
не выполняется, партия бракуется; чтобы
не впадать в другую крайность – браковать
хорошие изделия, ставится еще одно
требование – партия, в которой бракованных
изделий не больше, чем 4.5% принимается
с вероятностью 0.90. Кроме того, в связи
с погрешностями измерений и неоднородностью
партии появляется СКО результатов,
известная по большому числу предыдущих
измерений равная
.
Для оценки качества партии из нее берутся
пробы. Возникает вопрос: сколько проб
нужно взять из партии, чтобы убедиться
в том, что она удовлетворяет сформулированным
требованиям. Воспользуемся
методом последовательного анализа.
Розв‘язання.
Согласно
условия задачи
.
Вероятности
ошибок первого и второго рода
и
,
соответственно.
Из того, что по условию задачи случайная величина характеризуется только двумя параметрами и , делаем вывод: случайная величина подчиняется нормальному закону распределения. Следовательно, можно воспользоваться выражениями (7.14) – (7.17).
Первое, что нужно сделать, это определить область продолжения испытаний. Для этого сначала найдем константы и .
;
;
.
Таким образом, область продолжения анализа будет ограничена прямыми
и
.
Эти прямые построены на графике рис. 7.3. Область продолжения анализа между ними выделена цветом.
Теперь можно приступить собственно к последовательному анализу.
Предположим,
что анализ первой пробы из партии дал
результат
Рис.
7.3
.
Ему соответствует на рис. 7.3 точка с
абсциссой
и
ординатой
.
Точка,
находится
в «полосе продолжения
испытаний», поэтому берем в
,
что соответствует точке с абсциссой
и ординатой
.
Испытания снова нужно продолжать. Третий
анализ дал значение
,
ему соответствует точка с
абсциссой
и ординатой
.
Четвертому анализу с результатом
соответствует точка
.
Пятая точка, соответствующая
анализу с результатом
,
имеет координаты
.
Шестая проба дала результат
.
Координаты соответствующей точки на
графике рис. 7.3 такие:
.
На графике рис. 7.3 эта точка, кажется,
лежит на нижней границе области
продолжения испытаний. Проверим это.
Подставим в уравнение нижней границы
и получим
а
Это значит, что точка с координатами
принадлежит область
продолжения анализа. Седьмой замер дал
результат
,
координаты соответствующей точки
таковы:
.
Точка с такими координатами вышла за
границы области продолжения испытаний
и анализ партии изделий на этом можно
считать оконченным. На рис. 7.3 нанесена
еще и восьмая точка (
),
координаты которой определены как и
для предыдущих измерений. Для этого
измерения соответствующая точка на
графике явно находится вне области
продолжения. Может показаться,
что можно принять гипотезу: партия
изделий является доброкачественной
уже из первого анализа. К
сожалению, такой вывод поспешен,
так как из-за высокого значения
мы не можем гарантировать
заданные вероятности ошибок
и
.
Для решения поставленной задачи с помощью метода последовательного анализа нам понадобилось семь наблюдений. Если же мы захотели бы определить число наблюдений заранее по формуле (7.12), то получили бы
Вправа 7.6
Поясніть,
як знайдено оцінки квантілів
і
Таким образом классический метод потребовал бы выполнения 34-х анализов, а метод последовательного анализа – только 7-ми. Преимущества последовательного анализа неоспоримы.
Рассмотрим простой пример, в котором продемонстрируем еще одно важное преимущество, которое обеспечивается при грамотном планировании эксперимента.
Приклад 7.7 [1]
Необходимо
измерять сопротивление каждого из трех
последовательно включенных резисторов
.
Розв‘язання.
Если
пользоваться традиционным
и, казалось бы, очевидным методом, нужно
измерить каждое в
отдельности сопротивление
и,
предварительно выполнив еще одно
измерение, с замкнутыми накоротко
выводами измерительного прибора для
установки нуля его показаний. Схему
такого эксперимента, состоящего из
четырех опытов,
можно представить матрицей планирования
,
столбцы которой отражают операцию
измерения сопротивлений
и для общности математических выражений
обозначенных
.
Зависимая
переменная представлена вектором
.
Тогда
где
знак «+» указывает, что резистор подключен
к измерительному
прибору, а знак «–» означает, что значение
сопротивления
резистора не измеряется. Значение
сопротивления
оценивается по результатам двух
измерений:
установки нуля прибора и непосредственного
измерения
величины сопротивления. Значение
каждого
из
сопротивлений получаем
перемножением элементов вектора
на элементы столбцов
матрицы
.
При
этом получаем следующие
величины сопротивлений:
Вправа 7.7
Поясніть, як було отримано ці визази.
Дисперсия результатов измерения
,
где
–
СКО.
Аналогично получим:
Вправа 7.8
Поясніть, як було отримано ці оцінки дисперсії результатів вимірів.
Таким
образом, дисперсия результатов измерений
сопротивления всех трех резисторов
одинакова и равна
.
Измерение этих же последовательно включенных сопротивлений можно провести по-другому в соответствии со следующей матрицей планирования
Как и в предыдущем случае, измеряется каждое из сопротивлений в отдельности, а в последнем четвертом опыте измеряется полное сопротивление всех трёх резисторов, предварительная установка нуля измерительного прибора не производится. Значение каждого из сопротивлений получаем так же, как и в предыдущем случае. Учтем только то, что в данном эксперименте измерение каждого из сопротивлений выполнено дважды. Для этого в соответствующие выражения введен коэффициент 0.5. Таким образом, находи:
Дисперсия результатов измерения в этом случае
Очевидно, что
Вправа 7.9
Наведіть обґрунтування формул обчислення оцінок опору резисторів і дисперсій цих оцінок.
Таким образом, новая схема измерений дает уменьшение дисперсии вдвое по сравнению с традиционным методом при одинаковом количестве измерений. Чтобы получить такую же точность традиционным методом, необходимо количество измерений увеличить вдвое. Повышение точности получено благодаря тому, что значение каждого сопротивления по второй схеме измерялась во всех четырех опытах, а по первой схеме – только в двух.
Рассмотренный пример показывает, что даже сравнительно простые эксперименты могут быть спланированы лучше, чем они выполнялись традиционно. С усложнением экспериментов эффективность их планирования возрастает. Объектом исследования с применением теории планирования эксперимента могут быть любые радиосистемы и радиоустройства или их отдельные элементы.
7.4. Математические методы планирования экспериментов.[1, 2, 10, 11]
7.4.1. Сущность теории планирования эксперимента
Математизация исследований, а следовательно, и тех областей знания, к которым принадлежат эти исследования, предполагает в первую очередь получение математической модели исследуемого процесса, достаточно точно, адекватно, его описывающей. При наличии такой модели возникает возможность дальнейшее исследование процесса заменить анализом его математической модели для получения решения поставленных .конкретных задач.
Применение вероятностно-статистических методов для изучения сложных технических систем развивается в двух направлениях.
Статистический анализ полученных экспериментальных данных с. целью определения однородности собранного материала, его достоверности и точности с позиций принятого уровня значимости, его достаточности для принятия тех или иных решений.
Разработка математико-статистических моделей, используемых в дальнейшем для оптимального управления процессом или оптимального конструирования объекта и т. д.
Мы кратко на уровне идей рассмотрим оба эти направления, причем первое направление в основном охарактеризовано частично в подразделах 7.2, 7.3 и частично в разделе 8. Методы математического планирования эксперимента позволяют получить математические модели исследуемого процесса в реализованном диапазоне изменения многих факторов, влияющих на функционирование объекта исследования, наиболее экономичным и эффективным способом.
О месте методов математического планирования экспериментов можно получить ясное представление, если рассмотреть общую схему научного экспериментального исследования объекта с недостаточно раскрытым механизмом процессов, происходящих в этом объекте.
Методам экспериментальных исследований посвящен раздел 8. Здесь мы только перечислим основные этапы научного экспериментального исследования объекта или процесса.
– изучение сведений об исследуемом объекте (процессе, устройстве, системе и др.);
– формулирование систем предпосылок, призванных ограничить объект в пространстве и времени, выделить главные черты объекта, упростить схему взаимодействия элементарных процессов внутри объекта и объекта с окружающей средой;
– создание модели объекта, которой может быть:
а) сам объект, ограниченный в пространстве и времени, с упрощенной схемой взаимодействия элементарных процессов внутри объекта и объекта с окружающей средой,
б) дубликат объекта, уменьшенный или увеличенный по сравнению с натурным объектом, созданный на основе применения теории подобия;
– исследование модели объекта на основе применения наиболее экономичных и эффективных методов математического планирования экспериментов, современных приборов и методик;
– анализ экспериментальных данных методами математической статистики и формализация этих данных, т. е. создание адекватной математической модели объекта;
– использование математической модели объекта для дальнейшего его исследования с целью решения поставленных конкретных задач (например, определение оптимальных условий функционирования исследуемого объекта);
– экспериментальная проверка полученного решения;
– составление отчета по научному исследованию.
Методы математического планирования обеспечивают выполнение на современном научном уровне этапов , и , сокращая одновременно в большой степени трудоемкость и стоимость самого исследования.
Эффективность и экономичность методов математического планирования экспериментов объясняет тот факт, что число публикаций по теоретическим и прикладным вопросам, связанным с развитием и практическим применением методов математического планирования экспериментов, удваивается за 2.5 года, в то время как общее число научных публикаций удваивается приблизительно за 10 лет.
Традиционно
измерение параметров как отдельных
элементов и узлов радиоаппаратуры, так
и достаточно
сложных радиосистем осуществляется
последовательным
определением исследуемых зависимостей
при изменении
одной величины и постоянстве остальных.
Так,
изучение функции двух переменных
проводится
сначала при фиксированном
(при
этом получают
,
а затем при фиксированном
(измеряют
).
Например,
при определении вида
амплитудной характеристики любого
устройства в
зависимости от частоты изменяют амплитуду
входного гармонического
сигнала на определенной фиксированной
частоте и регистрируют значение выходного
сигнала. Затем
измерения повторяют на другой частоте
и т. д.
Если в сравнительно простых измерениях c достаточной для практики точностью можно пользоваться традиционными методами, то серьезные экспериментальные исследования с многими изменяющимися параметрами и входными величинами без планирования эксперимента просто невозможны.
Рассмотрим
основные определения, сущность и задачи
планирования экспериментов. Входные
величины
объектов исследования могут качественно
отличаться
друг от друга, например, амплитуда и
частота
сигнала, входная и выходная проводимости,
стабильность питающего напряжения и
т. д., поэтому в теории
планирования эксперимента входные
параметры
принято
именовать общим названием факторы.
В целях упрощения обозначений и вычислений
целесообразно
пользоваться нормированными переменными:
,
где
При
такой нормировке получается, что
соответствует
,
а
соответственно
.
Вправа 7.10
Доведіть, що це дійсно так і є.
Выходные
величины
также
могут быть качественно
различными, например, передаточная
функция,
уровень выходного сигнала или его
спектральных составляющих,
помехоустойчивость, надежность и
т. д. – они получили название отклик
(функция цели, параметр
оптимизации).
Модель
объекта представляет собой аналитическую
зависимость
отклика от факторов. Чаще всего эта
зависимость
неизвестна, известными являются факторы
и выходные
величины отклика
.
Чаще
встречается задача
исследования одной выходной величины
как
функции
нескольких факторов:
. (7.18)
Вид этой зависимости определяется из физической сущности, а параметры вычисляются в соответствии с результатами эксперимента. Поэтому такая модель называют также эмпирической. Следует отметить, что модель объекта может быть иногда построена исходя из теоретически обоснованного понимания сущности процессов, происходящих в объекте, например, протекания тока в цепях и активных элементах, выделения спектральных составляющих, образования фазовых сдвигов между входными и выходными параметрами и др. Созданную таким образом модель называют теоретической. Например, работу преобразователя частоты можно описать как выделение отклика суммарной или разностной частоты гармонических составляющих входных факторов при их перемножении.
Планирование эксперимента позволяет решать следующие задачи: исследование механизма физического явления, отыскание экстремума отклика, определение модели объекта и т. п. Исследовать механизм явления означает определить аналитическое выражение
,
(7.19)
которое
достаточно точно описывало бы неизвестную
зависимость
(7.18) в пределах области возможных значений
факторов
,
называемую
областью определения факторов,
или факторным
пространством,
и обозначаемую
.
Область
определения двух факторов
представляет
собой часть плоскости
в
декартовой
системы координат
и называется двухфакторным
пространством,
а эксперимент – двухфакторным
экспериментом.
Могут быть также одно- и многофакторные
эксперименты.
Эксперименты, направленные на раскрытие
механизма
исследуемого явления и определяющие
аналитическую зависимость (7.19), называют
также интерполяционными
или
регрессионными.
Эксперименты, позволяющие
находить экстремум отклика в области
его определения
,
называют экстремальными.
7.4.2. Выбор факторов и определение факторного пространства
Сведения
о действующих факторах и факторном
пространстве во многом определяют план
эксперимента. Начинают планирование
эксперимента с определения
количества действующих факторов и
влияния их
на выходную величину
,
устанавливают
зависимость факторов
между собой, уточняют, какие из факторов
являются управляемыми по заданию
экспериментатора, а
какие неуправляемыми и, наконец, учитывают
точность аппаратуры, используемой для
измерения значений
факторов
и
отклика
.
Как
правило, точность
измерения факторов должна быть примерно
на порядок
выше, чем измерение отклика.
Факторы следует определить так, чтобы они были независимыми. Если же между некоторыми из них имеется функциональная, или корреляционная связь, то их следует объединить в один обобщенный фактор.
Наибольшее распространение получили планы экспериментов с двумя уровнями для каждого фактора. В подразделе 7.4.6. мы такие планы подробно рассмотрим.
Важно с самого начала планирования эксперимента определить интервал варьирования факторов, т, е. величины их верхнего и нижнего значений (подробнее см. подраздел 7.4.6.).
Наиболее важным является требование адекватности модели, т. е. аппроксимирующая функция (7.19) должна достаточно точно приближаться к зависимости (7.18). Существуют критерии проверки условия адекватности, применяемые в процессе проведения экспериментов и использующие дисперсионный анализ и другие методы математической статистики.
7.4.3. Регрессионный анализ.
Если
каждому значению независимой переменной
х соответствует
определенное значение
,
то между
ними имеет место детерминированная
связь. Если
же между
и
существует
связь, но не вполне определенная, так
что одному значению
соответствует
совокупность
значений
в виде
статистического ряда, то такую связь
называют регрессионной, или корреляционной,
т.е.
регрессионные зависимости характеризуются
вероятностной связью. Экспериментально
установить
такую зависимость можно путем выполнения
статистических
измерений. Модель процесса или
объекта в этом случае представляет
собой регрессионное выражение (7.19),
связывающее факторы с откликом.
В теории планирования эксперимента
стремятся
модели представить в виде конечной
суммы степенного
ряда. Для одного фактора линейная модель
,
квадратичная
модель
,
кубическая
модель
и т.д.
В общем случае для переменных факторов модель второго порядка в виде функции цели (отклика) записывается в -мерном пространстве выражением
,
(7.20)
где
–
независимые факторы;
–
коэффициенты регрессии,
характеризующие влияние фактора
на
функцию
цели;
–
коэффициенты, характеризующие двойное
влияние факторов
и
на
функцию цели. Оценки коэффициентов
находят, как правило, с помощью метода
наименьших квадратов
(МНК).
Процедура вычисления коэффициентов
регрессии и составляет сущность
регрессионного анализа.
В подразделе 7.4.5. мы рассмотрим МНК и
получим формулы для вычисления
коэффициентов регрессии.
7.4.4. Полный факторный эксперимент.
Полным
факторным называется такой эксперимент,
в котором реализуются все возможные
комбинации (наборы) уровней факторов.
Варьирование
факторов
на двух уровнях дает
наборов,
на трех уровнях составляет
наборов и т. д. Если имеется
факторов,
каждый из
которых устанавливается на
уровнях, то
для
реализации полного факторного эксперимента
требуется выполнить
опытов. Наибольшее распространение
получили планы типа
,
например, двухфакторные
и трехфакторные
.
При
резко возрастает
количество наборов, а следовательно, и
опытов в
проводимом эксперименте, поэтому такие
планы используются
чрезвычайно редко.
Мы здесь упомянули только несколько простых планов. На самом деле их существует очень много.
Мы рассмотрели основные идеи математического планирования экспериментов и интерпретации их результатов. Ясно, что этих знаний недостаточно для грамотного использования их при решении практических задач. В следующих подразделах этого раздела мы на примерах рассмотрим планирование и обработку результатов простых экспериментов. Начнем с самого простого эксперимента.
7.4.5. Планирование и обработка результатов однофакторных экспериментов
7.4.5.1. Формализация экспериментальных данных методом наименьший квадратов.
Влияние
какого-либо фактора на выход процесса
может быть
выражено зависимостью
.
Если
конкретному значению
соответствует
единственное значение
,
то
такая зависимость
называется функциональной.
Эту зависимость получают
путем строгих логических доказательств,
не нуждающихся в
опытной проверке.
Если остается неизменным в то время, как изменяется, то не зависит от .
Если для оценки величин и используются данные наблюдений – величины случайные, то функциональная зависимость между ними существовать не может.
Между двумя случайными величинами может существовать так называемая стохастическая связь, при которой с изменением одной величины меняются параметры распределения другой.
К формализации экспериментальных данных, т. е. к построению по ним описывающей процесс зависимости, исследователь прибегает, когда не может составить эвристическую (детерминированную) математическую модель процесса из-за недостаточного понимания механизма процессов или их чрезмерной сложности. Полученная в результате формализации экспериментальных данных эмпирическая математическая модель имеет меньшую ценность, чем отражающая механизм процесса эвристическая математическая модель, которая может предсказать поведение объекта за пределами изученного диапазона изменения переменных.
Приступая к эксперименту с целью получения эмпирической математической модели, исследователь должен определить необходимый объем опытных данных с учетом числа принятых к исследованию факторов, воспроизводимости процесса, предполагаемой структуры модели и обеспечения возможности проверки адекватности уравнения.
Если
по двум точкам (измерениям) получено
линейное однофакторное
уравнение
,
то
построенная по этому равенству прямая
обязательно пройдет через эти
экспериментальные точки. Следовательно,
для
того чтобы проверить, насколько хорошо
эта зависимость описывает процесс, надо
поставить опыт хотя
бы еще в одной точке. Этот дополнительный
опыт дает одну
степень свободы, необходимую для
обеспечения корректности
процедуры проверки адекватности
уравнения. Однако проверку
обычно проводят не по одной дополнительной
точке, которая
не участвовала в определении коэффициентов
уравнения,
а по всем экспериментальным точкам,
число которых
должно
превышать число коэффициентов уравнения
.
Так
как
,
решение такой системы требует специального
подхода, что видно из следующего
простейшего пример.
Приклад 7.8
В
результате исследования влияния на
процесс некоторого параметра
получены данные
,
приведенные в таблице 7.1. Требуется
описать эти данные линейным уравнением
.
Н
Таблиця
7.1
1
2
3
4
5
6
7
8
9
10
11
10
12
14
16
18
20
22
24
26
28
30
8.38
12.12
13.05
15.00
19.36
21.42
22.74
23.87
24.62
29.50
29.31
Рис.
7.4
Для нахождения двух неизвестных коэффициентов можно ограничиться результатами двух опытов.
Рассчитаем
и
по результатам первых двух опытов.
Запишем систему двух уравнений и найдем
ее решение.
Таким
образом, если учесть только два измерения
(два первых крестика на графике рис.
7.4), получим
– прямая 1 на рисунке.
Очевидно, если, например, взять результаты второго и третьего измерений (опытов), получим другое уравнение и, следовательно другую прямую на графике.
Вправа 7.11
На рис. 7.4 наведено пряму, яка проходить через дві крайні (першу і одинадцяту) – пряма 2. Знайдіть рівняння цієї прямої.
Рассмотренный пример показал, что вычислительная процедура должна основываться на использовании всех экспериментальных данных. Алгоритм нахождения неизвестных коэффициентов уравнения в такой «переопределенной» задаче можно построить, если базироваться на признании вероятностной природы экспериментальных данных.
Ошибка в предсказании по найденному уравнению результата -го опыта характеризуется величиной невязки
,
где
–
предсказанное значение выхода процесса;
–
полученное в
-том
опыте
значение выхода процесса.
Примем,
что невязка
подчиняется нормальному закону
распределения, то есть плотность
вероятности появления любой
-той
невязки
имеет вид
.
Произведение плотностей вероятности появления невязок, вычисленных для каждого из N опытов эксперимента, называется функцией правдоподобия
Чем больше величина функции правдоподобия, тем более точно уравнение описывает экспериментальные данные.
Совокупность коэффициентов уравнения, которая максимизирует функцию правдоподобия, наилучшей из всех других совокупностей при заданной структуре уравнения.
Функция
правдоподобия достигнет максимума при
минимизации суммы квадратов
невязок. Следовательно, минимизация
суммы квадратов невязок и будет условием
получения максимально правдоподобных
оценок коэффициентов аппроксимирующего
уравнения при нормальном законе
распределения вероятности результата
измерений. Реализация этого условия
при получении оценок коэффициентов
уравнения названа методом
наименьших квадратов
(МНК).
МНК дает оценки коэффициентов аппроксимирующей зависимости, обладающие рядом оптимальных свойств независимо от закона распределения случайной величины. Иными словами, МНК может применяться и в тех случаях, когда экспериментатор не может на данном этапе исследования доказать нормальность закона распределения.
МНК позволяет сгладить влияние случайных причин на экспериментальные данные и получить математическую модель процесса в виде полинома той или иной степени.
Предположим, что исследуемый процесс будет описываться линейным уравнением
.
Минимизируемая функция
Чтобы
найти экстремум этой функции,
продифференцируем ее по
и по
и приравняем две эти производные нулю.
Решив систему двух уравнений с двумя неизвестными ( и ), найдем те значения, которые обеспечивают минимум суммы квадратов невязок.
Вправа 7.12
Доведіть,
що знайдені коефіцієнти забезпечать
саме мінімум функції
.
Систему так называемых нормальных уравнений можно записать следующим образом:
В этом простейшем случае решение системы не вызывает больших трудностей
(7.21)
Вправа 7.13
Виведіть формули (7.21).
Приклад 7.9
Используя данные примера 7.8, определить коэффициенты линейной зависимости методом наименьших квадратов (число повторностей в каждом из 11 опытов одинаково).
Розв‘язання.
Запишем из (7.21) выражения для коэффициентов и .'
и
Предварительно по данным таблицы из примера 7.8 вычислим:
Подставим
эти значения в соответствующие формулы
и получим:
и
.
Следовательно, уравнение прямой,
полученное с помощью МНК, имеет вид
.
На рис. 7.4 построен ее график (прямая 3). Как и следовало ожидать из трех прямых на графике именно эта, полученная с учетом всей информации наилучшим образом представляет экспериментальные данные.
Легко убедиться, что решение систем нормальных уравнений существенно упрощается, если при планировании эксперимента, будет обеспечено равенство
. (7.22)
Это свойство МНК, как мы убедимся ниже, широко используется при планировании эксперимента. Поэтому, для линейной и квадратичной моделей выпишем соответствующие формулы.
Линейная модель.
При выполнении условия (7.252 система нормальных уравнений линейной модели принимает вид
. (7.23)
Квадратичная модель.
Коэффициенты
квадратичной модели
при выполнении (7.22) вычисляются по
формулам:
. (7.24)
В литературе по обработке данных и планированию эксперимента (см., например, [10]) приведены соответствующие формулы и для моделей более высоких порядков.
Анализ формул для расчета коэффициентов приводит к выводу о том, что лишь для линейного уравнения такой план эксперимента дает независимые оценки коэффициентов уравнения. В квадратичном уравнении независимым образом определяется лишь линейный коэффициент , а в кубическом ни один из коэффициентов не определяется независимым образом. Это означает, что исключение из уравнения какого-либо из этих коэффициентов как незначимого вызывает необходимость пересчета оценок связанных с ним коэффициентов.
Применение МНК в значительной степени облегчается и имеет четкий алгоритм, если аппроксимирующая зависимость представляет собой полином любой степени. К сожалению, характер экспериментальных данных во многих случаях не дает возможности успешно применить полиномиальную модель. Однако многие виды зависимостей могут быть приведены к полиномиальной структуре логарифмированием или заменой переменных.
7.4.5.2. Симметричный план однофакторного эксперимента
План однофакторного эксперимента, составленный с учетом выполнения условия (7.22), является симметричным относительно центра эксперимента, т. е. переменная будет иметь как положительное, так и отрицательное значение. Этот план дает возможность независимым образом определить коэффициенты линейного уравнения (формулы (7.23)), т. е. будет ортогональным относительно коэффициентов линейного уравнения. Симметричный план предусматривает равномерное изменение исследуемого фактора от опыта к опыту:
,
где
–
значение фактора в
-м
опыте в натуральной размерности;
– то же, для
последующего опыта;
– интервал
варьирования фактора; величина
должна обеспечивать
значимое различие откликов в соседних
опытах плана.
Если
представить значение фактора в
безразмерном выражении
и за точку
отсчета принять
,
то связь между
и
будет
определяться соотношением
,
(7.25)
где – центр эксперимента (середина диапазона изменения фактора) то есть
Л
Таблица
7.2
1
2
3
4
5
6
7
9
11
13
15
17
19
21
18
19
21
26
27
29
32
-3
-2
-1
0
1
2
3
Приклад 7.10
Осуществить методом наименьших квадратов линейную аппроксимацию экспериментальных данных, приведенных в табл. 7.2:
Розв‘язання.
Интервал
варьирования
,
центр эксперимента
.
Рассчитаем
значения фактора в безразмерном
выражении по (7.25):
и
т. д.
Запишем
полученные результаты в последнюю
строку (
)
таблицы. Условие (7.22) выполняется,
следовательно, можно воспользоваться
формулами (7.23). Подсчитав
предварительно
и подставив эти данные в (7.23), получаем:
.
То есть,
.
Расчет коэффициентов модели действительно
существенно упростился, однако, чтобы
получить искомую зависимость, необходимо
вернуться к исходным данным
.Сделать
это просто, если учесть (7.25), то есть
подставить в полученное уравнение
.
В результате получим
7.4.6. Двухуровневые планы многофакторных экспериментов
7.4.6.1. Центр эксперимента и интервалы варьирования факторов
На процессы, с которыми приходится иметь дело инженеру любой специальности, влияет множество факторов. При однофакторных экспериментах все факторы, кроме одного, стабилизируются на каком-то постоянном уровне. Провести исследование влияния на процесс сразу нескольких факторов и получить математическую модель процесса с учетом взаимовлияния на процесс всех принятых к исследованию факторов очень заманчиво.
Обычно к исследованию принимают не более 4 – 5 факторов. Если необходимо исследовать большее число разнородных факторов, то проводят 2 или больше экспериментов, группируя для каждого из них по возможности однородные факторы.
Назначение
координат центра
эксперимента
и интервалов
варьирования факторов
во многом определяет эффективность
эксперимента.
Координаты центра эксперимента должны соответствовать наилучшим из всех условий протекания исследуемого процесса.
При назначении величин интервалов варьирования факторов в многофакторном эксперименте руководствуются следующими соображениями.
Значения интервалов должны быть такой величины, чтобы реакция процесса на соответствующее изменение фактора не маскировалась плохой воспроизводимостью исследуемого процесса и чтобы эту реакцию на фоне случайных воздействий на процесс неучтенных факторов можно было достоверно уловить имеющимися в распоряжении исследователя приборами.
Изменение выхода процесса при изменении
какого-либо
-го
фактора на
его интервал варьирования
должно быть соразмерным (в идеальном
случае – одинаковым) с изменением выхода
процесса при изменении любого другого
-го
фактора на соответствующий интервал
.
Выполнение
этого пожелания должно привести при
обработке, например, результатов полного
или дробного факторных экспериментов
к получению уравнения, в котором оценки
линейных эффектов будут одного порядка
(в идеальном случае – одинаковыми).
Именно такое симметричное
относительно линейных членов уравнение
обеспечивает
получение наиболее эффективной программы
оптимизации.
7.4.6.2. Метод наименьших квадратов при обработке результатов многофакторного эксперимента
МНК дает возможность получить оценки максимального правдоподобия эффектов факторов, однако в этом случае определить коэффициенты соответствующих полиномов без использования ЭВМ сложно. Например, в простейшем случае для получения линейного уравнения по результатам двухфакторного эксперимента требуется получить оценки трех коэффициентов:
.
Система уравнений максимального правдоподобия является довольно громоздкой и для ее решения нужно применять метод определителей. Ситуация, однако, не является критической. Существуют соответствующие программы, позволяющие быстро, надежно и наглядно исследовать планы экспериментов для выявления их достоинств и недостатков. В частности, в компьютерной системе STATISTICA имеется специальный модуль – Experimental Design – для планирования и исследования планов эксперимента. При выполнении лабораторных работ вы ознакомитесь с работой этого модуля, главное, вам не придется решать громоздкие системы уравнений. За вас это сделает STATISTICA.
7.4.6.3. Составление плана полного факторного эксперимента (ПФЭ)
Самым
простым планом, обладающим ортогональностью
любых
двух столбцов независимых переменных,
является план ПФЭ
типа
,
в котором исследуемые
факторы изменяются лишь на двух уровнях:
верхнем
и нижнем
.
Центр эксперимента
.
Интервал варьирования
.
В
безразмерном выражении верхний уровень
обозначается
,
нижний
:
;
Для
планов ПФЭ
.
Тогда
формула для определения
коэффициентов линейного уравнения
запишется следующим
образом:
. (7.26)
Двухуровневые планы полного факторного эксперимента помимо линейных коэффициентов позволяют определить независимым образом оценки эффектов межфакторных взаимодействий
(7.27)
Помимо
ортогональности эти планы обладают
свойством ротабельности,
сводящимся к тому, что дисперсия
предсказания
результата опыта по полученному уравнению
будет
зависеть лишь от радиуса гиперсферы,
которой принадлежат
координаты прогнозируемого опыта.
План ПФЭ можно представить таблицей и графически в натуральной и кодированной размерности.
Приклад 7.11
Рис.
7.5
для исследования влияния некоторого
параметра
,
изменяющегося в диапазоне 20 – 30 некоторых
единиц (это может быть, например, частота
в Гц, кГц, МГц или в ГГц) и величины
параметра
,
например, активного сопротивления
колебательного контура, изменяющегося
в диапазоне от 2 до 10 Ом.
Розв‘язання.
Область
исследования (факторное пространство)
будет изображаться в виде прямоугольника
в системе
(натуральная
размерность) – рис. 7.5 а) и
в виде квадрата в системе
(безразмерная) –
рис. 7.5 б).
Найдем центр эксперимента:
;
.
Вправа 7.13
Знайдіть
інтервали варіювання
і
.
Таблица
7.3
1
20
2
2
30
2
3
20
10
4
30
10
Таблица
7.4
1
–1
–1
2
+1
–1
3
–1
+1
4
+1
+1
.
Запишем план эксперимента сначала при
использовании натуральной размерности
факторов
и
.
Его можно представить в виде таблицы
7.3. План эксперимента при использовании
нормированных параметров представлен
таблицуй 7.4.
И в том, и в другом случаях первое измерение (опыт) нужно провести при минимальных значениях факторов. Второе – при максимальном значении первого фактора и минимальном второго. В третьем измерении факторы поменялись местами и, наконец, последнее, четвертое, измерение проводится при максимальных значениях обоих факторов.
Таким образом, ПФЭ требует проведения 4-х опытов для всех возможных комбинаций факторов
П
Таблица
7.5
1
–1
–1
–1
2
+1
–1
–1
3
–1
+1
–1
4
+1
+1
–1
5
–1
–1
+1
6
+1
–1
+1
7
–1
+1
+1
8
+1
+1
+1
осуществляется в следующем порядке:
в
таблице, имеющей 3 столбца (по числу
факторов) и 8 строк (по числу опытов
записывают план ПФЭ
(т. е.
заполняют первые 4 строки);
повторяют план ПФЭ , заполняя следующие 4 строки для первых двух столбцов;
половину
строк (например, верхнюю), принадлежащих
третьему столбцу, заполняют знаками
«–1», что соответствует требованию
обеспечить нижний уровень третьего
фактора в этих опытах, остальные строки
– знаком «+1». План ПФЭ
приведен в таблице 7.5.
По
такому же принципу составляется план
ПФЭ
при любом
,
например,
при
:
записывают план ПФЭ ;
повторяют план ПФЭ ;
первые 8 опытов планируют провести при нижнем, а остальные – при верхнем уровне четвертого фактора:
После
построения плана следует проверить его
правильность.
Для этого обычно достаточно убедиться,
что план симметричен,
т. е.
.
для любого фактора
(число «+1» и «–1»
в любом столбце плана должно быть
одинаковым и равным
).
Вправа 7.14
Побудуйте
план ПФЕ
.
Переконайтеся у тому, що план є симетричним.
7.4.6.4. Уравнения, получаемые обработкой результатов реализации
планов ПФЭ
По результатам двухфакторного эксперимента можно составить уравнение регрессии, в котором помимо линейных членов будет член, учитывающий эффект парного межфакторного взаимодействия:
План
ПФЭ
дает возможность рассчитать
коэффициентов:
.
План
ПФЭ
дает возможность получить оценки 16
коэффициентов, план ПФЭ
– 32 и т. д.
Линейные коэффициенты в линейном уравнении целиком характеризуют влияние исследуемого фактора на процесс и поэтому их достаточно просто интерпретировать. Интерпретация же эффектов межфакторных взаимодействий представляет значительные трудности. Чтобы ее провести, исследователь дожжен хорошо разбираться в том процессе или устройстве, которые он изучает.
При расчете коэффициентов уравнения используют средние результаты опытов, рассчитанные по достоверным результатам отдельных повторностей, из числа которых исключены «промахи». Следовательно, в общем случае число повторностей каждого опыта будет различным. Тогда среднюю оценку результата -го опыта можно рассчитать по формуле
,
где
– число
повторностей
-го
опыта после
исключения «промахов».
Расчет
коэффициентов уравнения значительно
усложняется,
так как каждый средний результат
будет входить
в соответствующие формулы со своим
«весом». Поэтому на
практике стараются при наличии «промахов»
поставить дополнительный
опыт (опыты) с тем, чтобы эксперимент
был осуществлен
при
.
Мы не будем приводить формулы для расчета коэффициентов эмпирической модели. Заинтересованный читатель найдет их в литературе по планированию эксперимента.
Рассмотрим пример.
Приклад 7.12
Таблиця
7.6.
1
–1
–1
–1
70
2
–1
+1
–1
60
3
+1
–1
–1
55
4
+1
+1
–1
90
5
–1
–1
+1
105
6
–1
+1
+1
95
7
+1
–1
+1
80
8
+1
+1
+1
100
Розв‘язання.
План
ПФЭ
выписан в столбцах таблицы со второго
по четвертый и в строках от
до
.
Вправа 7.15
Якщо порівняти плани ПФЕ , які наведені у таблицяхі 7.5 і 7.6, можна побачити, що вони, здається, різні. Чи це так і є, чи все ж вони однакові?
Чтобы воспользоваться системой STATISTICA, нужно подготовить соответствующую электронную таблицу (Spreadsheet-таблицу) с данными. Как составляются таблицы данных можно узнать в Приложении Б.
РОЗДІЛ 8. Методи експериментальних досліджень (Лекція 13)
