Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОНИ_2014 / Литература / Анкутдинов_ОНИ_2002.pdf
Скачиваний:
409
Добавлен:
12.03.2015
Размер:
884.51 Кб
Скачать

более высокочастотный диапазон радиоволн, в котором увеличивается поглощение энергии радиоволн в среде и, следовательно, уменьшается дальность действия системы; разрешение данного противоречия было найдено при использовании так называемых сложных сигналов).

Физические противоречия состоят в наличии у одного и того же элемента системы противоположных физических свойств или функций (например, элемент электронной схемы должен быть проводником при протекании тока в одном направлении и диэлектриком при другом направлении тока, это противоречие разрешает такой элемент как диод).

Путь к созданию качественно новой технической системы лежит через выявление все более глубоких противоречий и нахождение способов их разрешения. В этом состоит одно из проявлений закона перехода количественных изменений в качественные. В то же время новая техническая система представляет собой синтез нового и некоторых элементов прежних решений, демонстрируя этим действие закона отрицания отрицания.

Вопросы для самоконтроля:

Каково соотношение терминов "понятие", "суждение", "умозаключение"? Каким образом происходит эволюция научной идеи в гипотезу и, далее, в закон?

Какова структура научной теории?

В чем различие диалектического и метафизического подхода к процессу познания?

Перечислите общенаучные эмпирические методы исследований и приведите примеры их использования для получения нового научного знания. Перечислите общенаучные теоретические методы исследований и приведите примеры их использования в процессе обучения по специальности радиотехника.

Каково содержание и методы решения задачи анализа структурной схемы устройства?

Каково содержание и методы решения задачи параметрического синтеза?

2. Методы обработки экспериментальных данных

Эксперимент – основной общенаучный эмпирический метод исследования, научно поставленный опыт с точно учитываемыми условиями. Эксперимент обобщает ряд сопряженных понятий: опыт, целенаправленное наблюдение, воспроизведение объекта познания, организация особых условий осуществления, проверка предсказаний. Основная цель эксперимента: выявление свойств исследуемых объектов, проверка справедливости гипотез. Различают эксперименты по отраслям науки (физический, химический, социальный и т.п.), по способу формирования условий (естественный, искусственный), по целям исследования (преобразующий, констатирующий, контролирующий, поисковый, решающий), по месту проведения (лабораторный, натурный, полевой, производственный), по структуре (простой, сложный), по характеру внешних воздействий (вещественный,

энергетический, информационный), по типу моделей (материальный, мысленный), по числу варьируемых факторов (одно- и многофакторный). Методика эксперимента – это совокупность мыслительных и физических операций, размещенных в определенной последовательности, в соответствии с которой достигается цель исследований. Необходимо также обосновать набор средств измерений (приборов), машин, аппаратов. Методы измерений должны базироваться на законах метрологии, изучающей средства и методы измерений.

Получив результаты эксперимента, исследователь должен извлечь из них полезную информацию или, другими словами, провести обработку и анализ экспериментальных данных. Мы рассмотрим несколько широко используемых методов обработки и анализа экспериментальных данных, а именно: графическое представление, аппроксимацию и статистическую обработку.

2.1. Графическое представление экспериментальных данных

Графическое представление экспериментальных данных является наиболее наглядным (например, по сравнению с табличным или аналитическим), позволяет выявить общий характер функциональной зависимости изучаемых физических величин, сравнительно легко установить наличие экстремумов функции, пределов увеличения (уменьшения) функций.

y

x

Рис.2.1

z

y=y1

 

y=y2

 

y=y3

 

x

 

Рис.2.2

Обычно при графическом представлении применяют прямоугольную систему координат. На плоскости наносят точки, отображающие экспериментальные данные (рис. 2.1). Если попытаться провести линию через все точки (в предельном случае – соединить точки отрезками прямых), то она будет иметь резкие искривления (в предельном случае – это будет ломаная линия). В естественных процессах такие искривления (на математическом языке – быстрые изменения первой производной) встречаются редко. Поскольку в экспериментальных данных всегда присутствуют ошибки измерения, график, проведенный через все экспериментальные точки, фактически отражает воздействие случайных мешающих факторов на результат измерения, а не исследуемое физическое явление. Поэтому при построении графика стараются провести плавную линию, как можно ближе проходящую ко всем экспериментальным точкам (см. раздел 2.2).

Иногда при построении графика выясняется, что некоторые точки резко удалены от кривой. В этих случаях, если нет оснований предполагать наличие скачка функции, резкое отклонение, скорее всего, объясняется грубой ошибкой измерения или промахом. Эксперимент следует повторить в диапазоне резкого отклонения данных.

Графики функций, имеющие сложный немонотонный вид (например, имеющие экстремумы), требуют тщательного вычерчивания в зонах изгибов и перегибов. На этих участках шаг изменения независимой переменой в эксперименте должен быть значительно меньше, чем на плавных участках.

Часто при проведении экспериментальных измерений приходится иметь дело с функцией двух переменных z=f (x,y). В этом случае одну из переменных, например y, при построении используют в качестве параметра. В результате график (рис. 2.2) представляет собой семейство кривых z=f(x) при y=y1 , y=y2 ,

…, y=yn .

Еще одна проблема при построении графика – рациональный выбор масштаба. Для увеличения точности построения необходимо, чтобы график заполнял всю площадь листа. Поэтому следует определить диапазон изменений переменных по координатным осям и соответствующим образом выбрать шкалы осей (не обязательно вести отсчет от нуля!). Масштаб осей, таким образом, получится автоматически.

Приведенные рекомендации могут оказаться недостаточными, если одна или обе переменные имеют большой диапазон изменений, например, несколько порядков. В этом случае применяют полулогарифмический y = f (lgx) или логарифмический

lg y = f (lgx) масштабы. Например, при построении частотной характеристики радиотехнического устройства широко применяется следующая разновидность логарифмического масштаба: по оси абсцисс откладывается частота в декадах lgω, а по оси ординат – амплитуда в децибелах 20 lgA.

2.2. Аппроксимация экспериментальных данных 2.2.1 Задача аппроксимации

Термин аппроксимация (от латинского approximo) означает замену одних математических объектов другими, более простыми и в том или ином смысле близкими к исходным.

Задача аппроксимации может возникнуть, например, при обработке экспериментальных данных, когда в результате некоторых измерений получена связь независимой переменной x и зависимой переменной y в виде таблицы значений (табл. 2.1).

Таблица 2.1

x

x1

x2

x3

xk

y

y1

y2

y3

yk

Простейший пример такого эксперимента – измерение напряжения на выходе электрической цепи при различных значениях какого-либо параметра цепи или параметров входного воздействия. В результате процедуры аппроксимации должна быть получена аналитическая связь – функция y=f(x),

которая в дальнейшем может быть использована в расчетах как характеристика электрической цепи в целом.

Задача аппроксимации возникает также и в случае, когда для относительно сложной функции требуется получить более простое выражение, которое легко интегрируется или анализируется тем или иным стандартным методом. Например, разложение функции в ряд Тейлора (2.1) и использование в качестве аппроксимирующей функции только нескольких первых членов этого ряда (2.2) позволяет существенно упростить исходную функцию для дальнейшего анализа (2.3):

f (x)= f (x0 )+

x x0

 

f (x0 )+

(x x0 )2

f ′′(x0 )+

(x x0 )3

f ′′′(x0 )+... (2.1)

 

 

 

1 2 3

1

 

 

1 2

 

 

f (x)f (x0 )+

x x0

f (x0 )

при x x0 <<1

 

 

(2.2)

 

 

 

1

 

 

 

 

 

 

 

(1+ x)n 1+nx; ln(1+ x)x; sin x x; cos x 1 при x <<1.

(2.3)

Очевидно, что качество аппроксимации может быть оценено двумя показателями: точность аппроксимации и простота аппроксимирующей функции, причем эти показатели противоречивы.

Процедура аппроксимации включает два этапа:

выбор типа аппроксимирующей функции (это может быть многочлен степени n, в частности, при n=1 и n=2 это соответственно прямая и парабола, экспонента, синусоида, гипербола, логарифмическая функция и другие функции); выбор параметров аппроксимирующей функции (коэффициентов

многочлена, показателя экспоненты, амплитуды, частоты и фазы синусоиды и т.д.), обеспечивающих наилучшее приближение аппроксимирующей функции к исходным данным. При этом обязательно должен быть заранее сформулирован критерий оценки качества приближения.

Если исходная экспериментальная или расчетная зависимость задана в виде набора точек (xi, yi), i=1,2,…, k, где k - количество точек, то при аппроксимации возникает естественное желание наиболее полно использовать имеющуюся информацию: то есть подобрать такую функцию, значения которой во всех точках xi совпадают со значениями yi. Эта задача была решена во второй половине XVIII века французским математиком

Лагранжем, который предложил так называемый "интерполяционный

многочлен n-го порядка" в виде суммы (n+1) слагаемых:

P

(x)= y

(x x2 )(x x3 ) ... (x xn+1 )

 

 

+

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

n

1

(x

x

2

)(x

 

x

) ... (x

x

n+1

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

3

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

+ y2

 

(x x1 )(x x3 ) ... (x xn+1 )

 

+...

+

 

 

(x

2

 

x

)(x

2

x

) ...

(x

2

x

n+1

)

 

 

 

 

 

 

 

 

 

1

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

+ yn+1

 

 

 

 

(x x1 )(x x2 ) ... (x xn )

 

 

.

(2.4)

 

(x

n+1

x

)(x

n+1

x

) ... (x

n+1

x

n

)

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

Интерполяционный многочлен (2.4) – частный случай аппроксимирующей функции – позволяет вычислить значение f(x)=Pn(x) для любого x (interpole – между точками), причем в узлах интерполяции – точках (xi, yi) выполняется

условие

Pn(xi ) = yi , i = 1,…,n+1.

Интерполяционный многочлен n-го порядка проходит через k = n +1 исходных точек. Если точек достаточно много, то и многочлен будет иметь высокую степень, то есть аппроксимирующая функция получится сложной. Кроме того, стремление провести аппроксимирующую функцию через исходные точки, особенно при их экспериментальном происхождении, не разумно из-за наличия ошибок измерения. Поэтому следует ограничиться невысокой степенью многочлена n =1,2,3, так, чтобы график аппроксимирующей функции, соответственно прямая, парабола или кубическая парабола, адекватно отражал общий ход экспериментальной зависимости.

При таком подходе количество определяемых параметров аппроксимирующей функции меньше количества точек k, используемых для этого. Поэтому необходимо выбрать специальные критерии качества аппроксимирующей функции. На практике чаще других используются следующие два критерия: критерий равномерного приближения и критерий наименьших квадратов.

2.2.2. Критерий равномерного приближения

Предположим, что тип аппроксимирующей функции выбран, и теперь необходимо определить ее параметры. Критерий равномерного приближения означает минимизацию наибольшего отклонения f(x) в точках x = xi от исходных значений yi

max

 

f (xi ) yi

 

min .

(2.5)

 

 

1i k

 

 

 

 

 

Для аппроксимирующей функции – степенного многочлена

n

f (x) = a0 + a1x + a2 x2 +... + an xn = a j x j ,

j=0

сформулируем оптимизационную задачу в соответствии с выбранным критерием (2.5) следующим образом

 

n

 

 

 

 

yi a j xij

z, i =1,2,..., k; n < k

(2.6)

 

j=0

 

 

 

z 0 min ,

 

 

где переменными являются z и aj.

Если каждое из неравенств в (2.6), содержащее знак абсолютной величины, представить в виде двух обычных неравенств, то задача сводится к варианту задачи линейного программирования и может быть решена с помощью симплекс-метода [1].

Пример 2.1. Для результатов измерений, приведенных в табл.2.2 найти равномерное приближение для аппроксимирующей функции вида f(x)= a0+ a1x.

Таблица 2.2

 

 

 

 

i

1

2

3

 

 

4

 

 

 

 

 

 

 

 

 

xi

1

2

3

 

 

4

 

 

 

 

 

Запишем

yi

2,0

1,5

2,0

 

 

3,5

 

 

 

 

 

оптимизационную задачу (2.6) для k = 4, n = 1.

 

 

 

 

 

 

2 a0 a1

 

z ,

 

1,5 a0 2a1

 

z ,

 

2 a0 3a1

 

z ,

 

3,5 a0 4a1

 

z ,

 

 

 

 

 

 

 

 

z 0 min

и представим каждое из неравенств, содержащее знак абсолютной величины, в виде двух обычных неравенств

a0 +a1 + z 2 0

a0 a1 + z +2 0

 

a0 + 2a1 + z 1,5 0

a0 2a1 + z +1,5 0

 

a0 +3a1 + z 2 0

a0 3a1 + z + 2 0

(2.7)

a0 +4a1 + z 3,5 0

a0 4a1 + z +3,5 0

Для того, чтобы качественно описать решение задачи (2.7) – задачи линейного программирования – воспользуемся пространственным представлением. В трехмерном пространстве неизвестных (a0 , a1 , z) каждое их восьми неравенств определяет полупространство, находящееся над соответствующей плоскостью. Например, для первого неравенства – такую плоскость описывает уравнение z = – a0 a1 + 2 . Полупространство над этой плоскостью, с учетом условия z 0, есть область возможных значений неизвестных, удовлетворяющих первому неравенству. Построив все восемь плоскостей, получим некоторую причудливую область пространства в форме многогранника, находящуюся над всеми этими плоскостями. Самая нижняя точка этой области, ближайшая к плоскости z = 0, и будет решением задачи

(2.7).

К сожалению, графическое изображение описанной процедуры на плоском листе бумаги практически невозможно было бы воспринять. Рекомендуем читателю попробовать самостоятельно решить задачу в двумерном представлении по следующему алгоритму, используя неизвестное z в качестве параметра. Запишем восемь исходных неравенств в несколько ином виде

a1 ≥ −a0 + 2 z (1)

 

a1 ≤ −a0 + 2 + z

 

(2)

 

a ≥ −

 

a0

+ 3

 

z

 

(3)

 

 

a ≤ −

 

a0

+ 3

+

 

z

 

(4)

 

 

 

 

 

 

 

 

 

 

1

2

4

2

 

 

 

 

1

2

4

2

 

 

 

 

 

 

 

 

 

 

 

 

 

a ≥ −

a0

 

+ 2

z

 

(5)

 

 

a ≤ −

a0

+ 2

+

z

 

(6)

 

 

 

 

 

 

 

1

3

3

3

 

 

 

 

1

3

3

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(7)

 

 

 

 

a ≤ −

a0

+ 7 +

z

 

(8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

4

8

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y4

3

2

1

0

 

 

 

 

 

x

 

 

 

 

 

0

1

2

3

4

Рис. 2.3

При некотором значении параметра z, например z = 1, каждое из неравенств определяет полуплоскость, находящуюся над или под соответствующей прямой. Построив все восемь прямых, можно определить область плоскости (a0,a1) в форме многоугольника, которая удовлетворяет всем восьми неравенствам. Эта область в нашем примере будет ограничена прямыми 1,4,6 и 7. Если далее уменьшать значение параметра z, то площадь области будет уменьшаться и при z = 0,5 окажется, что область пространства стянется в точку с координатами a0=1, a1=0,5.

Таким образом, искомое равномерное приближение есть f(x)=1 + 0,5x. На рис. 2.3 изображены точки, отражающие исходные данные табл. 2.2, и график аппроксимирующей функции.

2.2.3. Критерий наименьших квадратов

Критерий наименьших квадратов означает минимизацию суммы V квадратов отклонений значений аппроксимирующей функции в точках xi от экспериментальных значений yi

k

V = ( yi f (xi ))2 min

i=1

или, для аппроксимирующей функции – степенного многочлена,

k

n

V = ( yi a j xij )2 min; n < k ,

i=1

j=0

где переменными являются коэффициенты многочлена aj. Требуемый минимум имеет место, при равенстве нулю всех (n+1) частных производных функции V , т.е. при Va j = 0 .

Частная производная при j=m имеет вид

V

k

 

n

j

 

m

 

= 2yi a j xi

 

xi .

am

 

i=1

 

j=0

 

 

 

и, таким образом, реализация выбранного критерия сводится к решению системы (n+1) линейных (это очень важно для последующего решения) уравнений с (n+1) неизвестными aj

i=k

 

 

j=n

 

 

 

 

 

m

a j xi

j+m

= 0, m = 0,1,2,..., n.

(2.8)

yi xi

 

i=1

 

 

j=0

 

 

 

Пример 2.2. Найти аппроксимирующую функцию в виде f(x)=a0+a1x+a2x2, наилучшую по критерию наименьших квадратов, для результатов измерений, приведенных в табл.2.3.

Таблица 2.3

 

i

1

 

2

3

4

 

5

 

xi

1

 

2

3

4

 

5

 

yi

3,0

 

9,0

10,0

6,0

 

1,0

Запишем систему (2.10)

для трех неизвестных a0 , a1 и a2.

 

i=5 (yi a0 a1xi a2 xi2 )= 0

i=1

i=5 (yi xi a0 xi a1xi2 a2 xi3 )= 0

i=1

i=5 (yi xi2 a0 xi2 a1xi3 a2 xi4 )= 0 i=1

и преобразуем ее к стандартному виду

 

 

 

 

 

i=5

 

 

 

i=5

 

i=5

 

 

 

5a0

+ a1 xi + a2

xi2 =

yi

 

 

i=5

i=1

i=5

 

i=1

i=5

i=1

i=5

 

 

 

 

 

 

 

 

 

0

 

 

1

i

 

 

2

i

 

i

i

i

 

 

 

 

a

 

 

x

 

+a

 

x2 +a

 

x3 =

 

x y

 

i=1

 

 

i=1

 

 

 

i=1

 

i=1

 

a0

i=5

+a1

i=5

 

 

 

i=5

 

 

i=5

 

xi

 

xi

+ a2 xi =

xi yi .

 

 

 

2

 

 

 

3

 

 

 

4

 

 

2

 

i=1

 

 

 

 

i=1

 

 

 

i=1

 

 

i=1

 

Подставив значения xi и yi

из табл.2.3, получим систему

5a

0

+15a +55a

2

= 29

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

15a0 +

 

 

 

+ 225a2

 

=80

 

 

 

 

55a1

 

 

 

 

 

55a0 +

 

 

 

 

 

 

 

 

 

 

 

 

225a1 + 979a2 = 250 ,

 

 

решение которой a0 5,6 , a1 10,9, a2 1,93.

Таким образом, искомое приближение по методу наименьших квадратов есть f(x)= 5,6 + 10,9 x 1,93 x2. На рис. 2.4 изображены точки, отражающие исходные данные табл. 2.3, и график аппроксимирующей функции. Средний квадрат модуля отклонения аппроксимирующей функции от экспериментальных значений (среднеквадратическая ошибка) составляет

σ =

V k = 0,61.

 

 

 

 

y

10

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

1

 

 

 

 

 

x

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2

3

4

5

Рис. 2.4

 

 

 

 

 

До сих пор в качестве аппроксимирующей функции рассматривался степенной многочлен, являющийся линейным относительно своих параметров – коэффициентов a0, a1,…, an. Поэтому удавалось решить аналитически линейную систему уравнений относительно этих параметров. Однако, на практике, исходя из имеющихся экспериментальных данных и априорной информации о физических законах, реализующихся в эксперименте, могут быть выбраны и другие аппроксимирующие функции, в которых параметры входят нелинейно.

Например, для результатов измерений, изображенных на рис. 2.5,а и б, целесообразно выбрать соответственно

f (x) =

1

,

a, b > 0

 

 

(2.9)

 

a + bx

 

b < 0,

c > 0.

 

(2.10)

f (x) = c +aebx

 

 

y

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a<0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a>0

 

 

 

 

 

0

 

 

x

0

 

x

 

 

а)

 

 

 

б)

Рис. 2.5

 

 

 

 

 

 

Подобные экспериментальные данные могут быть получены, соответственно при измерении частотной зависимости коэффициента передачи электронной схемы и при записи переходного теплового или электрического процессов.

Если непосредственно применить критерий наименьших квадратов для выбора параметров предложенных функций, то мы столкнемся с системой нелинейных уравнений, которая, возможно, не будет иметь аналитического решения. В принципе эта ситуация не является тупиковой – можно применить численные методы. Чтобы избежать этого, применяется метод линеаризации.

Суть метода состоит в переходе к новым переменным, которые входили бы в аппроксимирующую функцию линейно. Положив для функции (2.9) Y=1/y, A0 = a, A1 = b, X = x, получим линейную зависимость Y= F(X)= A0 +A1X, эквивалентную исходной. Экспериментальные данные должны быть пересчитаны по приведенным формулам (в данном случае только значения Yi=1/yi), и далее может быть применен критерий наименьших квадратов.

В случае (2.10) аналогичная линеаризация Y=F(X)= A0 + A1X достигается, если положить Y = ln(y-c), A0 = lna, A1 = b, X = x. Чтобы пересчитать экспериментальные данные по этим формулам необходимо предварительно определить значение c. Обычно на практике значение c может быть специально измерено. В противном случае это можно сделать, исходя из рассмотрения экспериментальных данных, нанесенных в виде точек на плоскость xoy, и, в дальнейшем уточнить значение c путем его вариаций.

0,036 x

Пример 2.3. Рассмотрим пример аппроксимации с использованием метода линеаризации и критерия наименьших квадратов для экспериментальных данных, заданных следующей таблицей (первые три строки табл. 2.4):

Таблица 2.4

i

1

2

3

4

5

6

7

8

9

10

xi

10

20

30

40

50

60

70

80

90

100

yi

23,

20,

18,

17,

17,

17,

16,

16,

15,5

15,2

 

3

1

8

9

6

1

4

1

-

 

Y

2,1

1,6

1,3

1,0

0,9

0,7

0,3

0,1

-

i

7

3

4

6

6

4

4

0

0,69

1,61

Нанесем экспериментальные точки на плоскость xoy (рис.2.6). Ход экспериментальной зависимости определяет тип функции (2.10) –

экспонента.

Выберем

для

начала

значение

c = 15,0.

 

 

 

 

Пересчитываем экспериментальные значения по формуле Yi= ln (yi - c) и записываем результаты в табл. 2.4. Теперь для пар значений (xi,Yi), используя критерий наименьших квадратов, можно построить аппроксимирующую функцию в виде F(X)=A0+ A1X= = 2,57 – 0,036 x. Тогда аппроксимирующая функция для исходных данных будет иметь вид f (x) =15,0 +13,0e . Среднеквадратическая ошибка аппроксимации составит σ = 0,58 .

y 24

 

 

 

 

 

22

 

 

 

 

 

20

 

 

 

 

 

18

 

 

 

 

 

16

 

 

 

 

 

14

 

 

 

 

 

12

 

 

 

 

 

10

 

 

 

 

x

0

20

40

60

80

100

Рис. 2.6

Этот результат может быть улучшен путем небольших вариаций параметра c.

В частности, при c =

14,8 получим аппроксимирующую функцию в

виде f (x) =14,8 +11,2e0,030 x и

среднеквадратическую ошибку σ = 0,40 . График

этой функции изображен на рис.2.6. Процесс уточнения параметра c может быть продолжен.

В заключение данного раздела для читателя, уже получившего некоторый опыт решения задач аппроксимации экспериментальных данных, сделаем следующее замечание. Данную задачу можно рассматривать как частный случай огромного класса так называемых обратных задач. В отличие от прямых задач, когда по известным формулам, отражающим физические законы, вычисляются значения физических величин, при решении обратных задач, наоборот, по известным значениям физических величин необходимо

восстановить параметры, входящие в формулы физических законов, а, возможно, и выбрать сами эти формулы.

Например, если задано положение в пространстве и величина электрического заряда одного или нескольких точечных источников электрического поля, мы сможем вычислить по формулам электростатики напряженность электрического поля в любой точке пространства (прямая задача). Обратная задача в этом случае состоит в определении местоположения и величины зарядов точечных источников по известной напряженности электрического поля, измеренной в произвольном числе точек пространства. При решении такой задачи необходимо сначала выбрать модель поля – число источников, а затем определить их параметры: местоположение и заряд. Здесь очевидна аналогия с задачей аппроксимации экспериментальных данных – сначала выбор типа аппроксимирующей функции, затем – определение ее параметров.

Общая теория обратных задач разработана академиком А.Н. Тихоновым [2,3]. При решении обратных задач основными вопросами являются наличие и единственность решения, а также его устойчивость к малым вариациям исходных данных (например, искажениям результатов измерений под действием помех).

По аналогии с обратными задачами и при аппроксимации экспериментальных данных методом наименьших квадратов существует проблема устойчивости. Эта проблема может проявиться при решении системы уравнений типа (2.8). Главный определитель этой системы под действием малых случайных ошибок измерения может оказаться близким к нулю, что приведет к большой среднеквадратической ошибке аппроксимации.

Впоследнее время в связи с бурным развитием вычислительной техники и повышением ее быстродействия стало возможным решение обратных задач методом случайных испытаний (методом Монте-Карло [6], см. раздел 4.1.), когда решение обратной задачи заменяется многократным решением прямой задачи при вариации значений искомых параметров. За решение обратной задачи принимается наилучшая из попыток по выбранному заранее критерию.

Впринципе такой метод может быть использован и при аппроксимации экспериментальных данных при выбранном критерии качества. Определив тип аппроксимирующей функции можно далее испытывать различные случайные наборы значений параметров этой функции с тем, чтобы выбрать из них наилучший.

2.3.Статистическая обработка экспериментальных

данных

При проведении измерений в рамках научных экспериментов исследователь получает некоторый результат, который носит случайный характер. Для характеристики этого факта используется термин "неопределенность результата измерения". Уменьшение неопределенности результата измерения

возможно путем многократного повторения эксперимента и дальнейшего анализа результатов – статистической обработки.

При наличии некоторого большого массива измерений может быть поставлена задача определения закона распределения случайной величины или проверки гипотезы о том или ином законе распределения [4]. При относительно небольшом числе измерений можно поставить задачу определить, хотя бы приближенно, важнейшие числовые характеристики случайной величины. Например, если заранее известно, что случайная величина X имеет нормальное распределение, необходимо определить его параметры: математическое ожидание mx и среднеквадратическое отклонение

σx.

Значение параметра, вычисленное на основе ограниченного числа опытов, всегда будет случайным. Поэтому следует говорить не об определении, а об оценке параметра. Ошибка в оценке в среднем тем больше, чем меньше значение n.

Оценка параметра закона распределения должна отвечать следующим требованиям:

состоятельность – при увеличении числа наблюдений (n → ∞) оценка параметра должна стремиться к его истинному значению; несмещенность – математическое ожидание оценки параметра должно быть равно его истинному значению (отсутствие систематической ошибки); эффективность – дисперсия оценки параметра должна быть минимальной. Различают генеральную и выборочную совокупности измерений. Генеральная совокупность – это множество результатов всех измерений, которые в принципе можно провести. Генеральная совокупность может быть конечной (например, при определении среднего роста студентов университета можно действительно измерить рост всех студентов без исключения) или бесконечной (например, при определении среднего значения шума можно сделать сколь угодно много измерений его мгновенных значений). Выборочная совокупность (выборка из генеральной совокупности) предполагает ограниченное, относительно небольшое число измерений (например, при изучении общественного мнения россиян в опросе обычно участвуют не более 0,01% населения).

Приведем формулы для оценок математического ожидания

~

и дисперсии

mx

~

случайной величины X, полученных по результатам

измерений xi из

Dx

выборки объемом n. (Символ "~" означает статистическую оценку, а не истинное значение параметра.)

~

1

n

;

~

1

n

~ 2

. (2.11)

mx =

 

xi

Dx =

 

(xi mx )

 

 

 

n i=1

 

 

n 1 i=1

 

 

Эти оценки удовлетворяют требованиям состоятельности и несмещенности, а при нормальном законе распределения случайной величины X – требованию эффективности. Далее мы ограничимся рассмотрением только нормально распределенных случайных величин.

Оценки в виде числа

~

~

mx илиDx называются точечными. В ряде задач

требуется не только найти подходящее численное значение параметра, но и оценить точность этого значения. Такая задача особенно актуальна при малом объеме выборки, когда точечная оценка параметра в значительной мере случайна.

Чтобы дать представление о точности и надежности оценки используются понятия доверительный интервал и доверительная вероятность.

Доверительный интервал Iβ – интервал значений исследуемого параметра, например среднего значения случайной величины,

~

~

~

~

(2.12)

Iβ = (mx tβσm~

, mx + tβσm~ ) ,

который с заданной надежностью (доверительной вероятностью β) накроет

истинное значение параметра mx. В (2.12) σ~m~ =

~

n – среднеквадратическое

Dx

отклонение оценки m~x , определенное по результатам выборки (эта формула

справедлива для n > 30), tβ – гарантийный коэффициент, значения которого приведены в табл. 2.5 для различных значений доверительной вероятности. Можно сказать, что ширину доверительного интервала отсчитывают в "сигмах".

Таблица 2.5

β

0,8

0,9

0,95

0,99

0,997

0,999

 

 

 

 

2,576

3

 

t

1,282

1,645

1,960

3,00

3,291

При небольшом объеме выборки (n <30) для интервальной (вероятностной) оценки параметров используются формулы, аналогичные (2.11) и (2.12). Различие состоит в том, что сумма относительного небольшого числа случайных величин (результатов измерений xi) уже не является нормально распределенной случайной величиной. В результате границы доверительного интервала расширяются по сравнению с (2.12)

~

~

~

~

 

Dx

Dx

) . (2.13)

Iβ = (mx tβ

n

, mx +tβ

n

 

 

 

Расширение границ доверительного интервала связано, во-первых, с уменьшением n, и, во-вторых, с увеличением гарантийного коэффициента tβ . Значения tβ приведены в табл. 2.6 (t-распределение Стьюдента для K= n–1 степеней свободы).

Таблица 2.6

β K

0,8

0,9

0,95

0,99

0,999

 

 

 

 

 

2

1,886

2,920

4,303

9,925

31,60

4

1,533

2,132

2,776

4,604

8,610

10

1,372

1,812

2,228

3,169

4,587

20

1,325

1,725

2,086

2,845

3,850

30

1,310

1,697

2,042

2,750

3,646

1,282

1,645

1,960

2,576

3,291

Заметим, что при большом числе измерений (нижняя строка табл. 2.6) значения коэффициента tβ, взятые из t-распределения Стьюдента, совпадают со значениями из табл. 2.5.

В процессе обработки экспериментальных данных следует исключать грубые ошибки или промахи. Однако прежде, чем исключить результат того или иного измерения, необходимо убедиться, что это действительно промах, а не отклонение вследствие статистического разброса.

Простым способом исключения резко выделяющегося измерения является правило "трех сигма": разброс случайных величин от среднего значения не должен превышать ±3σ~x . Более достоверными являются методы,

использующие доверительный интервал.

Пусть имеется ряд измерений малой выборки, подчиняющийся закону нормального распределения. Критические пороги появления грубых ошибок при n измерениях, среди которых определены наибольшее и наименьшее значения – xmax и xmin, определяются по формулам:

 

~

 

~

 

 

t1 = (xmax mx ),

t2 = (mx xmin ),

σ

n 1

σ

n 1

 

 

n

 

n

 

 

В табл. 2.7 приведены в зависимости от доверительной вероятности β максимальные значения tmax, возникающие вследствие статистического разброса. Если t1 > tmax, то значение xmax необходимо исключить из ряда измерений как промах. При t2 > tmax исключается измерение xmin. После

исключения грубых ошибок определяются новые значения m~ и ~ . из

x Dx

оставшихся результатов измерений. Таблица 2.7

n

tmax

при β

 

0,90

 

0,95

0,99

 

 

3

1,41

 

1,41

1,41

5

1,79

 

1,87

1,96

10

2,15

 

2,29

2,54

20

2,45

 

2,62

2,96

30

2,61

 

2,79

3,16

В ходе исследований часто возникает вопрос о достоверности опытных результатов. Предположим, например, что некоторое устройство обработки радиосигнала подверглось модернизации с целью увеличения отношения q сигнал/помеха на его выходе. Для сравнения качества старого и нового устройств были проведены многократные измерения величины q, по результатам которых были вычислены оценки математического ожидания и среднеквадратического отклонения q~1 = 5, σ~1 = 0,2 и q~2 = 6 , σ~2 = 0,2 . Возникает вопрос, действительно ли величина q увеличилась на 20%, или это увеличение можно объяснить разбросом опытных данных.

Проведем проверку достоверности экспериментальных данных по критерию "трех сигма". В данном случае на достоверность проверяется разность q~ = q~2 q~1 =1. Как известно, дисперсия алгебраической суммы двух случайных