Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МИФИ_Вычметоды КФ

.pdf
Скачиваний:
0
Добавлен:
13.02.2026
Размер:
9.98 Mб
Скачать

натянутой на векторы s1

,s2

,.... Указанному

определению

соответствует сокращенная запись

 

Σ = span(s1

,s2

,...) = span(S) .

(8.71)

Множество S называется образующим множеством подпространства Σ . Всякое подпространство имеет бесконечно много образующих множеств, содержащих различное число векторов. Образующее множество, содержащее наименьшее количество векторов, называется базисом подпространства, а количество m векторов базиса называется размерностью подпространства. Если, кроме того, эти векторы ортонормированны, то базис называется ортонормированным. Подпространство Σ имеет бесконечно много ортонормированных базисов, однако вектор любого базиса можно выразить в виде линейной комбинации векторов всякого другого базиса. Примером

подпространства может служить плоскость в R3 . Размерность этого подпространства равна 2, и любые два вектора, лежащие в этой плоскости и не являющиеся параллельными, образуют его базис.

Пусть теперь A = AT – симметричная матрица. Подпространство Σ инвариантно относительно A, если для любого вектора x из Σ следует, что вектор Ax также принадлежит Σ . Собственный вектор матрицы A определяет инвариантное подпространство размерности единица, а множество m ортонормированных собственных векторов матрицы A образует базис инвариантного подпространства размерности m, натянутого на эти векторы.

Если Q = (q1 ,q2 ,...,qm ) – векторы некоторого базиса инвариантного

подпространства Σ , упорядоченные в виде n× m -матрицы Q, то действием матрицы А на Q мы получаем новую n× m -матрицу AQ, столбцы которой есть линейные комбинации столбцов матрицы Q, что следует из инвариантности Σ : действительно, каждый вектор Aqi Σ . Эти m линейных комбинаций удобно записать в виде

произведения QC, где m× m-матрица C называется сужением A на Σ . Таким образом,

AC = QC

(8.72)

(рис. 8.4).

221

Рис. 8.4. Матрица Рэлея

Если столбцы матрицы Q образуют ортонормированный базис Σ , то

QTQ = Im ,

(8.73)

где Im – единичная матрица порядка m, и

 

C = QT AQ –

(8.74)

симметричная матрица, которая называется матрицей Рэлея. Пусть (λ,y) – собственная пара матрицы C, т.е.

Cy = λy .

(8.75)

Тогда, умножая слева на Q, получаем QCy = λQy , или

 

A(Qy) = λ(Qy) ,

(8.76)

т.е. λ является также и собственным значением матрицы A, а Qy – соответствующим собственным вектором. Этот результат позволяет определять собственные пары матрицы A, решая задачу на собственные значения для матрицы C меньшего размера.

Полученный выше результат можно использовать только в том случае, если Σ инвариантно относительно A. Однако такое подпространство нельзя выбрать заранее, так как это было бы равносильно нахождению собственных значений матрицы A. Обычно подпространство Σ оказывается лишь «почти» инвариантным относительно A, и вопрос заключается в том, как определить хорошие приближения к собственным парам матрицы A.

Процедура Рэлея – Ритца, обеспечивающая получение наилучших приближений, заключается в следующем:

1) выполняется ортонормализация матрицы

Q и вычисляется

m× m-матрица Рэлея

 

H = QTAQ .

(8.77)

222

 

Здесь матрица Рэлея обозначена через H, чтобы подчеркнуть, что соотношение (8.72) уже не будет являться точным равенством, так как матрица H лишь «почти» инвариантна относительно A;

2) определяется требуемое количество k ≤ m собственных пар матрицы H, (µi ,hi), i = 1,...,k . Таким образом,

Hhi = µihi ;

(8.78)

3)полученные значения Ритца µi будут наилучшими

приближениями к собственным значениям матрицы A, а векторы Ритца xi = Qhi – соответствующими приближениями к собственным

векторам этой матрицы.

8.2.2.Алгоритм Ланцоша

Алгоритм Ланцоша реализуется в том случае, когда «почти» инвариантное подпространство Σ , в котором строятся аппроксимации Рэлея – Ритца, выбирается в виде

подпространства Крылова.

Для произвольного ненулевого вектора b подпространство Крылова определяется следующим образом:

Κ m = span(b,Ab,A2b,...,Am−1b) .

(8.79)

В этом случае подпространство Κm будет почти

инвариантно

относительно A при достаточно большом значении m.

Действительно, рассмотрим произвольный вектор u

из Κm . Его

можно представить в виде линейной комбинации

 

 

 

 

m

 

 

 

 

 

u = uk (A)k−1b .

 

(8.80)

 

 

 

k=1

 

 

 

Соответственно,

 

 

 

 

 

 

 

 

m

 

 

 

 

 

Au = uk (A)k b ,

 

(8.81)

 

 

 

k=1

 

 

 

причем

все

слагаемые

в

(8.81),

кроме

последнего,

пропорционального Amb , принадлежат Κm . Можно показать [34], что при достаточно больших значениях m вектор Am−1b будет

223

близок к собственному вектору матрицы A, так что вектор A(Am−1b) будет приблизительно пропорционален вектору Am−1b , и, таким образом, будет «почти» принадлежать Κm . Следовательно, для любого вектора u из Κm вектор Au «в основном» принадлежит Κm , а это и означает, что Κm почти инвариантно относительно A,

причем близость Κm к инвариантному подпространству улучшается с увеличением m.

Выбор подпространства в виде (8.79) позволяет использовать следующие свойства.

1.Матрица Рэлея

T = QTAQ

(8.82)

является трехдиагональной; вычисление пар Ритца для трехдиагональных матриц – существенно более простая задача по сравнению с задачей на собственные пары для произвольных симметричных матриц.

2.Столбцы матрицы Q могут быть связаны друг с другом с помощью трехчленных рекуррентных соотношений, позволяющих вычислять новые векторы базиса Q.

3.Алгоритм Ланцоша обычно использует последовательность подпространств Крылова Κ12 ,...,Κm и вычисляет пары Ритца

матрицы A, отвечающие каждому из этих подпространств. Сходимость значений собственных пар обычно оказывается

достаточно быстрой, как правило, достаточно брать m ≈ 2n .

4. Матрица A используется только для умножения на векторы, поэтому удобно реализовать подпрограмму, вычисляющую произведение Ax для заданного вектора x.

Далее ортонормированный базис подпространства Κm будем обозначать Qm вместо Q, явно указывая размерность

подпространства Κm ; таким образом, будет рассматриваться случай, когда векторы b, Ab,...,(Am−1 )b в (8.79) линейно

224

независимы.

Необходимо

помнить,

что

Qm – прямоугольная

матрица размера n× m с ортонормальными столбцами, т.е.

 

 

QmT Qm = Im .

(8.83)

Из (8.82) и

(8.83) вовсе

не следует,

что

AQm = QmTm , так как в

общем случае QmQmT ≠ In . Правильное соотношение можно записать следующим образом:

AQm = Qm Tm + Rm ,

(8.84)

где Rm – матрица невязки, структура этой матрицы для случая m = 4 показана на рис. 8.5.

Рис. 8.5. Графическое представление алгоритма Ланцоша в случае m=4

Ортонормированный базис Q строится одновременно с увеличением размерности подпространства Κm следующим образом: q1 = bb , а

все последующие векторы qi , i > 1 образуются ортогонализацией вектора Aqi−1 со всеми векторами qj, j < i , определенными ранее.

После ортогонализации проводится нормировка базиса. Сформированный таким образом базис, очевидно, принадлежит

подпространству Κm .

Каждый вектор qi ортогонален ко всем остальным

векторам

qj, j ≠ i, поэтому

 

qiTAqj = 0; j < i − 1 .

(8.85)

Кроме того, матрица Tm является симметричной, а следовательно, учитывая (8.85), и трехдиагональной.

225

Из рис. 8.5 для частного случая m = 4 непосредственно видно, что

Aq

 

=

 

 

α

q

 

+ β q

 

;

 

 

1

 

 

 

1

 

1

 

1

2

 

 

Aq2 = β1q1 + α2q2 + β2q3;

 

 

 

 

= β2q2

+ α3q3

+ β3q4 ;

(8.86)

Aq3

Aq

4

= β

q

3

+ α

4

q

4

 

 

 

+ r .

 

 

3

 

 

 

 

 

 

4

Из определения матрицы Tm получаем, что

α4

= q4T Aq4;

(8.87)

β

3

= qT Aq

.

 

 

3

4

 

 

Последнее из уравнений (8.86), таким образом, можно записать в виде

r

= Aq

4

− (qT Aq

4

)q

3

− (qT Aq

4

)q

3

,

(8.88)

4

 

3

 

4

 

 

 

что в точности совпадает с выражением, которое получается в результате ортогонализации вектора Aq4 к векторам q3 и q4 при

вычислении вектора q5 . Следовательно,

 

q

=

r4

;

 

 

 

5

 

β4

 

 

 

(8.89)

β4

=

r4

.

 

Полагая для удобства q0 = 0 , получаем рекуррентное соотношение

Aqi = βi−1qi−1 + αiqi + βiqi+1;

(8.90)

i ≤ m.

В случае i = m (8.90) определяет вектор невязки rm = βmqm+1 .

Сформулируем теперь алгоритм Ланцоша в явном виде. Стартовый вектор b выбирается либо в произвольном виде, либо с использованием априорной информации о собственных векторах матрицы A. Полагаем

q0

= 0;

 

r0

= b;

(8.91)

 

 

β0 = b .

226

Затем для m = 1,2,... выполняется следующая последовательность шагов.

1. Пополнение ортонормированного базиса:

βrm−1 → qm .

m−1

2. Вычисление промежуточной невязки:

Aqm − βm−1qm−1 → rm .

3. Вычисление очередного диагонального элемента матрицы Tm :

qmT rm → αm .

4. Завершение вычисления невязки:

rm − αmqm → rm .

5. Вычисление нормы невязки:

rm → βm .

Эта последовательность вычислений повторяется необходимое число раз. Пары Ритца (µi ,xi) , аппроксимирующие собственные

пары матрицы A, получаются посредством решения задачи на собственные значения для матрицы Tm :

Tmhi = µihi; i = 1,2,...,k; k ≤ m ,

(8.92)

с последующим вычислением

 

xi = Qmhi .

(8.93)

Для контроля сходимости хорошим критерием служит норма

вектора невязки Axi − µixx

, равная

 

 

 

Axi − µixi

 

 

 

=

 

 

 

 

 

 

(AQm − Qm Tm )hi

 

 

 

=

 

 

 

Rmhi

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

rmhim

 

= βm

 

him

 

.

 

(8.94)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Существуют версии алгоритма Ланцоша, предназначенные для отыскания крайних собственных значений, некоторых внутренних собственных значений и даже всех собственных значений

227

симметричных или эрмитовых матриц очень больших размеров, некоторые версии алгоритма позволяют вычислять и соответствующие собственные векторы.

При практической реализации алгоритма Ланцоша возникают погрешности, связанные с машинной точностью обработки чисел двойной точности. Эти погрешности могут нарушить ортогональность столбцов матрицы Q до такой степени, что они станут линейно зависимыми. Для решения этой проблемы были разработаны специальные модификации алгоритма, производящие переортогонализацию векторов q в зависимости от величины погрешности. Их описание выходит за рамки книги.

8.3. Расчет функций линейного отклика и плотности состояний

При численном анализе квантовых систем конечной целью расчета часто являются такие физические величины, как плотность состояний, проводимость, восприимчивость и т. д. Это достаточно сложные корреляторы, для расчета которых, как правило, требуется комбинировать результаты расчетов с различным числом частиц в системе.

Рассмотрим отклик узельной системы (кластера) на внешнее поле. Пусть имеется система решеточных фермионов или бозонов во внешнем магнитном поле, и по системе циркулирует ток вдоль направления x, так что вдоль этого направления система характеризуется градиентно-инвариантной фазой Φ . Оператор тока в представлении чисел заполнения уже рассматривался в разд. 6.6, представим его, разложив до первого порядка по фазе:

 

 

∂H

 

 

 

 

 

 

 

 

2πiΦ

 

 

2πiΦ

 

 

 

 

jx = −

 

= ite ai+ ai+er

 

e Φ0L ai++er

aie

 

Φ0L

 

= (Φ → 0)

 

 

x

 

 

 

 

 

∂Ax

 

 

hc

i

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(8.95)

 

ite

(

 

 

 

 

 

 

)

 

2πiΦ

 

(

 

 

 

 

 

 

 

 

+

 

r

+ r

 

 

 

 

 

+

 

r

 

+ r

)

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

.

 

 

 

ai

ai+ex

− ai+ex ai

 

Φ0L

ai

ai+ex

+ ai+ex ai

 

 

hc

i

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

228

 

 

 

 

 

 

 

 

 

Введем следующие обозначения:

 

 

jPx (i) =

it

(ai+ ai+er x

− ai++er x ai);

 

 

(8.96)

 

hc

 

kx (i) = −t(ai+ ai+er x

+ ai++er x ai).

 

Здесь jPx (i) – парамагнитная часть x-компоненты плотности тока в точке i; kx (i) – соответственно, плотность кинетической энергии движения тока вдоль оси x.

Компонента x векторного потенциала имеет вид

r

Φex

 

(8.97)

Ax (i) =

,

L

 

 

 

поэтому плотность полного тока, согласно (8.95), можно переписать следующим образом:

jx (i) = −

∂H

= ejPx (i) + e2kx (i)Ax (i) .

(8.98)

∂Ax (i)

 

 

 

Используем далее известную формулу линейного отклика – соотношение Кубо (см., например, [35, 36]). Согласно этому соотношению, если на систему действует внешнее возмущение

V(t) = −xf(t) ,

(8.99)

где x – шредингеровcкий (не зависящий от времени) оператор некоторой физической величины, характеризующей систему (например, оператор тока), а возмущающая сила f(t) – заданная

функция времени (например, векторный потенциал), то имеет место линейное соотношение между фурье-компонентами среднего значения x(t) и силы f(ω) :

 

 

(8.100)

x(ω) = α(ω)f(ω) .

Величина α(ω) называется обобщенной восприимчивостью и

равна

α(ω) =

i

eiωt

x0 (t)x0 (0) − x0 (0)x0

(t) dt;

 

 

h

0

 

(8.101)

x0 (t) = eitH0 /h x e−itH0 / h .

Здесь x0 (t) – гейзенберговский оператор, определяемый по невозмущенному гамильтониану H0 (т.е. без учета силы f). В

229

частности, величина α(ω) будет является динамической проводимостью, если f(t) – напряженность электрического поля, а x – оператор тока.

Получим выражение для проводимости в терминах узельных операторов для нашей задачи. Потенциал возмущения за счет внешнего поля с учетом (8.96) может быть записан в таком виде:

V = −ejPx (i)Ax (i) +

i

e2k

x

(i)A2

(i)

 

 

x

 

(8.102)

 

 

2

.

 

 

 

 

Несложно убедиться в справедливости соотношения (8.98). Роль оператора x играет парамагнитный ток, а второй член последнего выражения с кинетической энергией – аддитивная добавка, которая переносится при расчете соотношений в ответ с учетом дифференцирования по векторному потенциалу. Для дальнейшего вывода выпишем фурье-компоненты векторного потенциала и тока:

 

 

 

 

r r

 

 

 

Ax (l,t) = Re(Ax (q,ω)eiql −iωt );

(8.103)

jx (l,t) = Re(jx (q,ω)eiql −iωt ).

 

 

 

 

r r

 

 

 

Тогда, согласно соотношению Кубо, имеем:

 

 

 

jx (q,ω)

= −e2 ( − kx − Λ xx (q,ω))Ax (q,ω);

 

 

i

 

 

 

 

Λxx (q,ω) =

 

dt e(iω−δ)t jPx (q,t)jPx (−q,0)

δ→0 ;

(8.104)

 

 

N

 

 

h

a 0

 

 

 

jPx (q,t)jPx (−q,0) = jPx (q,t)jPx (−q,0) − jPx (−q,0)jPx (q,t);

 

 

 

 

r r

 

 

 

jPx (q) = e−iql jPx (l); kx =

1

 

kx (l) .

 

Na

 

 

l

 

 

l

 

Средние значения в (8.104) понимаются в термодинамическом смысле:

... ≡

1

n

 

...

 

n e−Enβ ,

(8.105)

 

 

 

Z

n

 

 

 

 

 

 

 

 

 

где β = 1/ T – обратная температура.

Далее, учитывая связь векторного потенциала и напряженности электрического поля в длинноволновом пределе

230