Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

матан

.pdf
Скачиваний:
41
Добавлен:
27.05.2015
Размер:
3.81 Mб
Скачать

§1. Сплайны

691

номиальных кривых; эти отрезки состыкованы так, что производные полученной функции (иногда до порядка на единицу меньше степени используемых полиномов) непрерывны на всем рассматриваемом промежутке (точное определение см. ниже). Популярность сплайнов связана, в частности, с активным применением их при построении математических моделей тех или иных процессов. Например, сплайны используют в геологии для аппроксимации поверхностей месторождений, в гидрологии и метеорологии — для черчения карт на компьютере, для расчета балок, лежащих на различных основаниях, в инженерной геометрии, теории приближений, вычислительной математике и т.д. В первую очередь это связано с преимуществами, которыми обладает аппарат сплайнприближений по сравнению с другими аппроксимациями. К числу основных преимуществ принято относить следующие:

1.устойчивость сплайнов относительно локальных возмущений;

2.хорошая сходимость сплайн-интерполяции;

3.экстремальные свойства сплайнов (они являются решени-

ями задач минимизации функционалов); 4. достаточно простая реализация сплайн-функций на компьютере.

Очевидно, что задача интерполяции в общем случае является неопределенной. Если о заданной функции, кроме ее значений в узлах интерполирования x0, x1, . . . , xn, ничего не известно, то в других точках рассматриваемого отрезка эта функция может принимать любые значения. Поэтому во многих задачах, в случае отсутствия дополнительной информации об интерполируемых функциях, применяют линейную интерполяцию. Смысл ее состоит в том, что значения заданной функции f(x), заключенные между двумя соседними узлами интерполирования, приближают линейной функцией ϕ(x), принимающей значения f(x) в этих узлах.

Заметим, что производные такого линейного сплайна не определены во всех узлах интерполяции. В ряде задач это является существенным недостатком. Для достижения более высокой точности применяют сплайны более высоких порядков. Далее дадим определение полиномиального сплайна. Для простоты, большая часть изложения будет посвящена одномерным сплайнам.

Пусть на отрезке [a, b] задана сетка

∆ : a = x0 < x1 < · · · < xl = b.

Обозначим Pm – пространство полиномов степени не выше m,

Cm[a, b] – пространство функций, определенных на [a, b], и имеющих непрерывную производную порядка m.

ОПРЕДЕЛЕНИЕ 1.1. Функция sm(x) называется полино-

692

Глава 25. Обработка результатов эксперимента

миальным сплайном степени m дефекта k (1 ≤ k ≤ m) с узлами ∆ если:

1.sm(x) Pm, для всех x [xi, xi+1], i = 0, . . . , l − 1.

2.sm(x) Cm−k[a, b].

Пусть теперь кроме сетки ∆ задана сетка

∆ : a = x0 < x1 < · · · < xn = b и некоторые вещественные числа yi, i = 0, . . . , n.

ОПРЕДЕЛЕНИЕ 1.2. Сплайн sm(x) называется интерполирующим функцию f(x) на сетке ∆, если:

1.sm(x) Pm, для всех x [xi, xi+1], i = 0, . . . , l − 1.

2.sm(x) Cm−k[a, b].

3.sm(xi) = yi = f(xi), i = 0, . . . , n.

Узлы сетки ∆ называют узлами сплайна, а узлы сетки ∆

– узлами интерполяции.

ЗАМЕЧАНИЕ. Производная от sm(x) порядка (m − k + 1) может быть разрывной на [a, b].

ЗАМЕЧАНИЕ. Сплайны нулевой степени (или нулевого порядка) являются кусочно-постоянными на [a, b] функциями. Сплайны первой степени являются кусочно-линейными на [a, b] функциями.

1.2.Интерполяционные эрмитовы сплайны

В данном пункте рассматривается случай, когда узлы интерполяции совпадают с узлами сплайна.

Несложно доказать существование и единственность алгебраического многочлена p(x) нечетной степени 2r − 1, удовлетворяющего условиям

p(j)(a) = ya,j, p(j)(b) = yb,j, j = 0, . . . , r − 1,

где ya,j и yb,j – произвольные наперед заданные числа. Это,

так называемый, многочлен Эрмита1. Тогда, если заданы числа yi,j, i = 0, . . . , n, j = 0, · · · , r − 1, то на каждом промежутке [xi, xi+1] можно независимо построить многочлен pi(x) степени 2r − 1 такой, что

p(ij)(xi) = yi,j, p(ij)(xi+1) = yi+1,j, j = 0, . . . , r − 1.

1Шарль Эрмит (24.12.1822 – 14.01.1901) – французский математик, член Парижской АН (с 1856 г.)Основные работы посвящены теории эллиптических функций и ее приложениям, математическому анализу, алгебре и теории чисел.

§1. Сплайны

693

На самом деле несложно выписать и явный вид данного многочлена. Полагая

s(x) = pi(x), x [xi, xi+1], i = 0, . . . , n − 1,

получим сплайн s2r−1(x), для которого s(2jr)1(xi) = yi,j. Такие сплайны называют эрмитовыми. Так как на каждом

из промежутков многочлены, составляющие сплайн, определяются независимо друг от друга, то такие сплайны называют еще локальными.

ЗАМЕЧАНИЕ. Существуют эрмитовы сплайны четных степеней 2r, который определяются похожим образом, с помощью введения дополнительных узлов. В каждом из основных узлов xi они имеют дефект r, а в каждом дополнительном – дефект равен единице. Однако, в данном параграфе, мы не будем более подробно останавливаться на построении таких сплайнов.

Построим на отрезке [0, 1] интерполяционный многочлен степени 2r − 1, удовлетворяющий условиям

H(0) = y0,0, H (0) = y0,1, . . . , H(r−1)(0) = y0,r−1,

H(1) = y1,0, H (1) = y1,1, . . . , H(r−1)(1) = y1,r−1.

Представим его в виде суммы фундаментальных многочленов, т.е. многочленов у которых только одна производная в соответствующей точке равна 1, а остальные равны нулю:

r−1

H(t) = [y0,jϕ0,j(t) + y1,jϕ1,j(t)].

j=0

Здесь фундаментальные многочлены ϕ0,j(t) и ϕ1,j(t) удовлетворяют условиям

ϕ0,j(0) = ϕ0,j(0) = ϕ(0j,j1)(0) = ϕ(0j,j+1)(0) = ϕ(0r,j1)(0) = 0,

ϕ(0j,j)(0) = 1, ϕ(0k,j)(1) = 0, k = 0, 1, · · · , r − 1, ϕ1,j(1) = ϕ1,j(1) = ϕ(1j,j1)(1) = ϕ(1j,j+1)(1) = ϕ(1r,j1)(1) = 0,

ϕ(1j,j)(1) = 1, ϕ(1k,j)(0) = 0, k = 0, 1, · · · , r − 1.

Очевидно, что в точке t = 1 многочлен ϕ0,j(t) имеет нуль кратности r, а в точке t = 0 нуль кратности j. Таким образом данный многочлен можно представить в виде

ϕ0,j(t) = (t − 1)rtj(a0 + a1t + · · · + ar−j−1tr−j−1).

694

Глава 25. Обработка результатов эксперимента

Используя оставшиеся условия для подбора коэффициентов ai, получим требуемое. Проиллюстрируем это, построив многочлен Эрмита третьей степени ϕ0,0(t). Очевидно

ϕ0,0(0) = 1, ϕ0,0(1) = ϕ0,0(0) = ϕ0,0(1) = 0.

Учитывая вышесказанное,

ϕ0,0(t) = (t − 1)2(at + b).

Подставляя условия

ϕ0,0(0) = 1, ϕ0,0(1) = 0,

получаем b = 1, a = 2. Таким образом

ϕ0,0(t) = (t − 1)2(2t + 1).

Аналогично можно построить и остальные фундаментальные

многочлены

ϕ0,1(t) = (t − 1)2t, ϕ1,0(t) = t2(3 2t), ϕ1,1(t) = (t − 1)t2.

Для построения многочлена Эрмита на [xi, xi+1] следует сделать замену

t = x − xi , hi = xi+1 − xi, hi

и воспользоваться построенными фундаментальными многочленами. Таким образом, на отрезке [xi, xi+1] кубический многочлен Эрмита, принимающий значения

H3(xi) = fi, H3(xi+1) = fi+1, H3(xi) = fi , H3(xi+1) = fi+1

можно записать в виде

P (x) = fi(t−1)2(2t+1)+fi+1t2(32t)+hifi (t−1)2t+hifi+1(t−1)t2.

Аналогично, построив соответствующие фундаментальные многочлены, можно получить формулы для вычисления интерполяционных эрмитовых многочленов более высоких степеней.

1.3.Кубические интерполяционные сплайны

Как уже отмечалось выше, популярность в использовании сплайнов вызвана, в том числе, достаточно простой их реализацией на компьютере. Проиллюстрируем это построением кубических интерполяционных сплайнов.

§1. Сплайны

695

Пусть задана сетка ∆ и действительные

числа

yi, i = 0, 1, . . . , n. Интерполяционный кубический сплайн s(x) называется периодическим, если

s(j)(a + 0) = s(j)(b − 0), j = 0, 1, 2.

Для простоты изложения, в данном параграфе будем рассматривать лишь равномерные сетки, т.е. сетки у которых xi+1 − xi = h = const. Обозначим s (xi) = mi. Тогда, в силу линейности s (x), на отрезке [xi, xi+1] имеем

s (x) = s (xi) + s (xi+1) − s (xi)(x − xi), xi+1 − xi

или

s (x) = mi +

mi

(x − xi).

(1)

h

Здесь ∆mi = mi+1 − mi. Дважды интегрируя равенство (1) в пределах от xi до x, получаем

s(x) = yi + s (xi)(x − xi) + m2i (x − xi)2 + 6mh i (x − xi)3. (2)

Полагая в (2) x = xi+1, находим

yi = s (xi)h + m2i h2 + 6mh i h3,

откуда

s(x) = yi +

y

h

(2mi + mi+1) (x − xi)+

i

 

 

 

h

6

 

+m2i (x − xi)2 + 6mh i (x − xi)3,

и

s x

) =

yi

h

m

i +

m

i+1) +

m

x

x

i) +

mi

(

x

x

 

2.

 

 

h

6

2h

 

 

 

(

(2

 

 

 

i(

 

 

 

 

i)

 

 

Аналогично, на отрезке [xi−1, xi]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s x

 

 

yi−1

 

h

m

 

 

m m x x

 

 

mi−1

 

x

 

x

 

2

.

 

 

 

h

 

 

 

i−1)+

 

 

 

 

 

i−1)

 

( ) =

 

6 (2

 

i−1+

i)+

i−1(

2h (

 

 

 

Учитывая, что s (xi + 0) = s (xi 0), получаем

 

 

 

 

 

 

 

 

 

 

 

m

i−1

+ 4m

+ m

i+1

= 12

f(xi+1) 2f(xi) + f(xi−1)

=

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 12f(xi−1, xi, xi+1),

 

 

 

 

 

 

 

 

 

 

(3)

 

 

696

Глава 25. Обработка результатов эксперимента

где f(xi−1, xi, xi+1) – так называемая вторая разделенная разность функции f(x).

Таким образом, мы получили систему n−1 линейных уравнений (3) относительно n + 1 неизвестных m0, m1, . . . , mn. Учитывая условия периодичности, т.е. m0 = mn, m1 = mn+1, получаем следующую систему уравнений

mn + 4m1 + m2 = 12f(x0, x1, x2),

m1 + 4m2 + m3 = 12f(x1, x2, x3),

· · · · · · · · ·

mn−2 + 4mn−1 + mn = 12f(xn−2, xn−1, xn),

mn−1 + 4mn + m1 = 12f(xn−1, xn, xn+1).

Заметим, что вопросам существования и единственности подобных систем уравнений достаточное внимание уделяется в курсе линейной алгебры, а численным методам нахождения решений – в курсе численных методов. Таким образом, решив данную систему уравнений (а ее решение, очевидно, существует и единственно), получаем требуемое.

ЗАМЕЧАНИЕ. В непериодическом случае решение вполне аналогично. Потребуется два краевых условия, заменяющих условие периодичности.

1.4.Экстремальные свойства кубических интерполяционных сплайнов

В последние годы большое распространение получили, так называемые, натуральные сплайны. Натуральными называют сплайны, которые являются решением вариационных задач специального вида. Проиллюстрируем данное направление в теории сплайнов.

Обозначим через W22[a, b] пространство функций, определенных на [a, b], первая производная которых абсолютно непрерывна, а вторая – интегрируема с квадратом, т.е.

b

(f (x))2dx < ∞.

a

§1. Сплайны

697

ТЕОРЕМА 1.1. Среди всех функций f(x) W22[a, b], принимающих в узлах заданные значения yi, интерполя-

ционный кубический сплайн s(x) такой, что s(xi) = yi и s (a) = s (b) = 0, минимизирует функционал

b

J(f) = (f (x))2dx.

a

Доказательство. Рассмотрим разность f(x)−s(x). Справедливы равенства

b

J(f − s) = (f (x) − s (x))2dx =

a

b b b

= (f (x))2dx − 2 f (x)s (x)dx + (s (x))2dx =

a a a

b b b

= (f (x))2dx − (s (x))2dx − 2 (f (x) − s (x))s (x)dx =

a a a

= J(f) − J(s) 2I,

где

b

I = (f (x) − s (x))s (x)dx.

 

a

 

С другой стороны,

 

 

n−1

xi+1

 

xi

 

I = i=0

(f (x) − s (x))s (x)dx =

= (f (x) − s (x))s (x)|xi

xi+1

(f (x) − s (x))s (x)dx.

 

xi+1

 

xi

Третья производная кубического сплайна на [xi, xi+1] – постоянна. Далее будем обозначать ее s(3)i . Таким образом,

I = n−1 {[f (xi+1) − s (xi+1)]s (xi+1)

i=0

i+j

698

Глава 25. Обработка результатов эксперимента

[f (xi) − s (xi)]s (xi) − s(3)i ([f(xi+1) − s(xi+1)] [f(xi)− −s(xi)])} = −s (x0)[f (x0) − s (x0)] + s (xn)[f (xn) − s (xn)].

Учитывая, что s (x0) = s (xn) = 0, получаем I = 0. Таким

образом, для любой функции f(x) W22[a, b], принимающих в узлах заданные значения yi,

J(f − s) = J(f) − J(s) 0.

В результате имеем,

J(s) ≤ J(f),

что и доказывает теорему.

1.5.Замечание о двумерных сплайнах

Понятие полиномиального сплайна естественным образом обобщается на случай двух и более переменных. Однако, если в одномерном случае стыковка многочленов и краевые условия обеспечивались заданием их в конечном числе точек на прямой, то даже на плоскости все это необходимо делать на некоторых кривых. Правда все значительно упрощается, если склеивать многочлены и задавать краевые условия на прямых, параллельных осям координат.

Пусть P = [a, b]×[c, d] – прямоугольник на плоскости Oxy, и заданы сетки узлов

x : a = x0 < x1 < · · · < xn1 = b,

y : c = y0 < x1 < · · · < xn2 = d.

Определим двумерную сетку на P как декартово произведение ∆ = ∆x × y. Обозначим

Pij = [xi, xi+1] × [yj, yj+1].

ОПРЕДЕЛЕНИЕ 1.3. Двумерным сплайном степени m1 дефекта k1 по переменной x и степени m2 дефекта k2 по переменной y относительно сетки ∆ называют функцию s(x, y),

класса Cm1−k1,m2−k2 , которая на каждом Pij есть многочлен степени m1 по переменной x и степени m2 по переменной y.

Здесь Cr1,r2 – пространство функций f(x, y), имеющих непрерывные частные производные

∂xi∂yj f(x, y), i = 0, · · · , r1, j = 0, . . . , r2.

Пусть на ∆x определено пространство сплайнов степени m1 дефекта k1 Sm1,k1 (∆x), а на ∆y пространство сплайнов Sm2,k2 (∆y). Если ϕ11(x), . . . , ϕ1q1 (x) – базис в Sm1,k1 (∆x),

§2. Замечания о других методах

699

а ϕ21(y), · · · , ϕ2q2 (y) – базис в Sm2,k2 (∆y), то базисом пространства сплайнов Sm1m2,k1k2 (∆) будет система функций, образо-

ванная из всевозможных произведений ϕ1i (x)ϕ2j (y). Данный

факт позволяет конструировать двумерные сплайны на базе одномерных. Последнее, естественно, существенно упрощает процедуру построения двумерных сплайнов.

§2. Замечания о других методах

Важнейшей составной частью ряда задач математического моделирования является анализ, сравнение и последующая классификация изучаемых объектов некоторого множества. Под классификацией в подобных задачах принято понимать разделение данного множества объектов на однородные (в каком-то смысле) группы, либо приписыванием каждого элемента рассматриваемого множества к одному из заранее известных классов. Конечно, подобные задачи изучались на протяжении всего развития научного знания. Однако в последние десятилетия развитие компьютерной техники стало основным инструментом, который позволил по-новому подойти к решению проблем классификации. И существенное значение здесь сыграл, уже достаточно разработанный, аппарат многомерного статистического анализа. А именно, стали активно использоваться, так называемые, методы распознавания образов "с учителем" (дискриминантный анализ), методы распознавания образов "без учителя" (кластерный анализ) и методы, позволяющие выяснить, насколько существенно то или иное свойство для конкретной цели (факторный анализ).

2.1.Дискриминантный анализ

Дискриминантный анализ представляет из себя набор методов, позволяющих изучать различия между двумя и более группами объектов по нескольким переменным одновременно, и, соответственно, классифицировать объекты по принципу максимального сходства. Основным его предположением является то, что объект должен принадлежать одному из изучаемых классов (что, к сожалению, в практических задачах выполняется далеко не всегда). Хотя дискриминантный анализ состоит из достаточно большого числа методов, все их можно разбить на две группы: методы интерпретации межгрупповых различий и методы классификации наблюдений по группам. Первая часть методов отвечает на вопрос: есть ли возможность, используя данный набор переменных, отли-

700

Глава 25. Обработка результатов эксперимента

чить один класс от другого, если "да", то насколько хорошо, и какие из этих переменных наиболее информативны. Вторая часть методов связана с получением функций, обеспечивающих возможность отнести данный объект к одному из рассматриваемых классов.

2.2.Кластерный анализ

Кластерный анализ – это общее название достаточно большого множества алгоритмов, используемых при создании классификации. В результате использования этих алгоритмов образуются, так называемые, "кластеры", т.е. группы похожих объектов. Многочисленные приложения кластерного анализа принято сводить к четырем основным задачам:

1.разработка классификации;

2.исследование концептуальных схем группировки объектов;

3.создание новых гипотез на основе исследования данных;

4.проверка гипотез, а также определение, действительно ли выделенные классы присутствуют в имеющихся данных. Заметим, что при всем многообразии методов и алгоритмов кластерного анализа, все исследования содержат следующие шаги:

1.отбор выборки для классификации;

2.определение множества признаков, по которым будут оцениваться объекты;

3.выбор меры сходства (метрики) между объектами;

4.выбор метода кластерного анализа и его применение для создания групп сходных объектов;

5.проверка достоверности результатов решения.

Кчислу основных недостатков методов кластерного анализа следует отнести следующие. Во-первых, большинство из них являются эвристическими, и, соответственно, подкрепляются лишь опытом разработчиков метода. Во-вторых, эти методы создавались в различных областях человеческого знания и различных науках, и, в связи с этим, несут в себе особенности и отпечатки именно этих научных дисциплин. В- третьих, что очень существенно, различные алгоритмы могут порождать различные решения для одних и тех же исходных данных. Кроме того, кластерный анализ привносит некую свою структуру в исходные данные, и эта структура может не совпадать с реальной.

2.3.Факторный анализ

Основной целью факторного анализа является снижение размерности анализируемого пространства признаков, и, соответственно, выбор наиболее информативных переменных.