Добавил:
researchgate.net Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Yuriy Kruglyak. Quantum Chemistry_Kiev_1963-1991

.pdf
Скачиваний:
28
Добавлен:
28.02.2018
Размер:
16.43 Mб
Скачать

Для получения соотношения (321) использовалось свойство антисимметрии матрицы преобразования

Dkm = −Dmk ,

(323)

вытекающее из условия ортогональности исходного и нового наборов орбиталей. Преобразование (320) следует рассматривать как корректирующее преобразование исходного орбитального набора на каждом цикле итераций, которое используется в любой процедуре преобразования.

Если в выражении (321) величины Dmk при m > k рассматривать как

независимые переменные, то оно будет представлять собой линейную функцию, аппроксимирующую поверхность энергии вблизи точки,

определяемой системой орбиталей {ϕ}, а величины Vkm

имеют смысл первых

производных энергии по переменным Dmk .

 

Возьмем ненулевые действительные числа ξkm

и введем новые

независимые переменные

 

 

ykm = Dkm / ξkm ,

(324)

подстановка которых в (321) дает

 

 

E = ξkm Vkm ymk .

(325)

 

k<m

 

Переменные ymk трактуются как

координаты вектора

(шага) в евклидовом

пространстве с метрикой, определяемой квадратом длины шага

l2 ymk2 = Dmk2 / ξmk2 .

(326)

k<m

k<m

 

Шаг, выбранный в направлении противоположном градиенту E , т. е. вектор с

компонентами

 

 

ymk = −λ( E)mk = −λξmk Vkm

(327)

обеспечивает скорейший относительно данной метрики спуск по энергетической поверхности. Положительная константа λ определяет длину шага скорейшего спуска. В градиентном методе Мак-Вини [14, 15, 39] все коэффициенты масштабного преобразования (324) полагаются равными единице, в величину параметра λ выбирают эмпирически [40]. Леви [38] выбирал величины λξkm2 разными для разных координат Dmk , исходя из грубых

оценок вторых производных энергии.

 

 

 

 

Итак, переходя от начального набора {ϕ} к новому набору {ϕ } с помощью

преобразования (320), где

 

 

 

 

D

= −λξ2

V

,

(328)

mk

mk

km

 

160

получим новое значение энергии, которое будет по крайней мере не выше, чем первоначальное. Метод продвижения к минимуму энергии очевиден, а именно: выбирают орбитали начального приближения {ϕ}, затем с использованием (322) вычисляют матрицу преобразования D и с ее помощью определяют новые орбитали {ϕ} по (320). После определения из уравнений (283) новых коэффициентов Tk , этот процесс повторяют, взяв в качестве исходных

предварительно ортогонализованные орбитали, полученные на предыдущем цикле. Самосогласование считается достигнутым, если изменение энергии, согласно (321),

E = −λ ξmk2 Vkm2

(329)

k<m

 

обратится в нуль с некоторой заданной точностью.

Градиентный метод представляется эффективным методом расчета МКволновых функций, так как он не связан с вариационными уравнениями Эйлера и свободен от сопутствующих их решению недостатков (§ 2.8.2.1.1). В градиентном методе, однако, к сожалению нет некоторых преимуществ традиционной схемы ССП. В частности, преобразование орбиталей (320) сохраняет их ортогональность только в первом порядке по Dmk . Для того, чтобы

ее сохранить, орбитали между итерациями нужно корректировать с помощью какого-либо процесса ортогонализации.

С другой стороны, при традиционном подходе (§ 2.8.2.1.1), когда орбитали находятся либо непосредственно из решения вариационных уравнений Эйлера, либо, когда это возможно, с помощью ОГ, невозможно обеспечить стабильную сходимость процесса самосогласования и быть уверенным в том, что полученный экстремум является минимумом энергии. К тому же, почти все рассмотренные в § 2.8.2.1.1 схемы линеаризации вариационных уравнений и в этом случае требуют промежуточной ортогонализации орбиталей. В этом смысле они не аналогичны методу Хартри – Фока в одноконфигурационном приближении, так как в большинстве своем они не соответствуют задаче на псевдособственные значения вида (289).

В связи со сказанным выше представляется актуальной постановка следующей задачи. В МК приближении (273) с произвольным набором конфигураций сформулировать практический метод построения ОГ, одного и общего для всех орбиталей, обеспечивающего стабильную сходимость процедуры самосогласования к стационарному решению, соответствующему минимуму функционала энергии. Эта задача была решена в работах Куприевича и Шрамко [10 – 13, 42].

161

{ϕ}

2.8.2.2. Метод ОГ в МК теории ССП

Сведение задачи отыскания оптимизированных орбиталей к задаче на псевдособственные значения вида (287) для некоторого одного и общего для всех орбиталей эрмитового оператора в теории ССП является наиболее естественным и удобным в практических расчетах. В этом случае орбитали после каждой итерации будут автоматически удовлетворять условиям ортогональности. Однако оператор должен обеспечивать сходимость процедуры самосогласования к минимуму энергетического функционала. В связи с этим представляется необходимым более последовательное изучение вопроса об учете геометрических особенностей энергетической поверхности при отыскании оптимизированных орбиталей.

Исходя из квадратичной аппроксимации средней энергии, далее строится метод ОГ и анализируется ход процедуры самосогласования на различных ее стадиях. На основе полученных результатов исследуются возможности управления ходом процесса самосогласования в зависимости от геометрических особенностей энергетической поверхности с целью построения на основе метода ОГ вычислительной схемы, обеспечивающей стабильную сходимость для широкого круга задач при фактически минимальном объеме вычислительной работы.

2.8.2.2.1. Квадратичная аппроксимация энергетической поверхности в пространстве элементов унитарной матрицы преобразования орбиталей

В МК теории ССП волновая функция задается орбитальным набором {ϕ} и набором конфигурационных коэффициентов Tk . Процедура самосогласования заключается в поочередной оптимизации {ϕ} и Tk . Внимание далее мы сосредоточим на оптимизации ортонормированного набора {ϕ}, т. е. на построении набора, минимизирующего энергетический функционал при фиксированных коэффициентах Tk .

Уточнение орбиталей выполняется, как обычно, по итерационной схеме. Задав исходный ортонормированный набор {ϕ}, рассмотрим один шаг такого уточнения, приводящий к ортонормированному набору следующего приближения. При этом будем исходить из преобразования орбиталей, аналогичного использующемуся в градиентном методе (§ 2.8.2.1.2), однако, в отличие от последнего искомые орбитали, как и в одноконфигурационном методе ХФ, будем предполагать нормированными собственными функциями некоторого эрмитового оператора с невырожденным спектром – ОГ Φˆ , вид

162

которого определим позже. Другими словами, потребуем, чтобы искомые орбитали удовлетворяли уравнениям

ˆ

(330)

Φ |i = Λi |i .

Переходу {ϕ} {ϕ} будет соответствовать цикл процедуры самосогласования, не нарушающий, однако, условий их ортогональности.

Предположим, что исходный набор орбиталей {ϕ} близок к

самосогласованному, т. е. матрица оператора Φˆ в представлении этих орбиталей близка к диагональной и уточнение орбиталей будет небольшим. Тогда во втором порядке теории возмущений Рэлея – Шредингера (Приложение П-5) установим приближенно связь преобразования орбиталей (320) с матричными элементами оператора Φˆ на орбиталях исходного набора, а именно:

 

 

D

= D(1) + D(2),

 

 

 

mk

 

 

 

mk

mk

D(1)

mk

/ ω

 

 

,

D(1)

= 0, (m k)

mk

 

km

 

 

kk

 

 

 

Dmk(2) =

 

ΦmiΦik

,

(m k)

 

 

 

 

 

 

 

 

ω ω

 

 

 

 

 

i(k )

ki

km

 

 

 

 

Dkk(2) = −

1

Φik2

,

 

 

2

2

 

 

 

 

 

 

 

i(k )

ω

 

 

 

 

 

 

 

 

ki

(331а)

(331б)

(331в)

(331г)

где ωkm являются разностями диагональных матричных элементов оператора

ˆ

 

Φ , которые фиксируются заранее

 

ωkm = Φkk −Φmm .

(332)

Выражения (331в) и (331г) можно объединить в одно выражение, вводя величину

 

 

 

1,

 

(при

k = m)

 

Θi

=

 

 

ω

 

k m)

(331д)

mk

 

2

 

im

.

(при

 

 

 

 

 

 

ω

 

 

 

 

 

 

 

km

 

 

 

Тогда с учетом (331б) окончательно имеем:

D(2) = 1 Θi D(1)D(1) . mk 2 i(k ) mk mi ik

Поскольку элементы матриц плотности γ (i | k) (317) и Γ(ij входящие в выражение для средней энергии (314), не зависят от орби

(331е)

| kl) (318),

тального

163

набора, для получения энергии Eна преобразованных орбиталях нужно лишь заменить орбитали | i в одно- и двухэлектронных интегралах k | hˆ | i и kl | gˆ | ij на соответствующие орбитали из набора {ϕ}. Подставляя в выражения для интегралов разложения (320) с учетом (331а) и (331е) и опуская члены, в которые входят произведения трех и более величин Dmk(1) , окончательно получим:

 

E′= E + Dmk(1)vkm + 1 Dmk(1)Dqp(1)akmpq ,

 

(332)

 

m, k

2 k,m,p,q

 

 

где

ˆ

 

 

 

vkm

 

 

(333)

= 2[γ (k |i) i |h |m +2Γ(ki | jl) jl | gˆ |mi ],

 

 

i

j, l

 

 

 

ˆ

q

 

 

akmpq = 2γ (k | p) m |h | q +δkqΘpmvpm +

 

(334)

+ 4Γ(kj |li) [δ jp mq | gˆ

|li +δlp mj | gˆ | qi +δip mj | gˆ

|lq ].

 

i, j, l

 

 

 

 

Пусть размерность базиса, в котором определены орбитали, есть n . Тогда матрицы унитарных преобразований имеют форму n ×n и образуют n(n 1) / 2 - параметрическое семейство. Элементы матриц малых унитарных преобразований задаются соотношениями (331) в явном виде с точностью до членов третьего порядка малости. При таком способе задания в качестве независимых параметров выступают n(n 1) / 2 величин Dmk(1) при m > k , так как из (331) следует зависимость

 

 

 

D(1) = −D(1) .

 

 

(335)

 

 

 

mk

km

 

 

 

Исключив в (332) с помощью

выражения (335) Dmk(1)

при m < k и

сгруппировав соответствующие члены,

получим

Eв виде разложения в ряд

Тейлора по независимым переменным Dmk(1) с m > k , а именно:

 

 

E′= E + Dmk(1)Vkm +

Dmk(1)Dqp(1) Akmpq ,

(336)

 

 

 

m>k

m>k, q>p

 

 

где

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

(337)

 

 

 

Vkm = (1Pkm )vkm ,

 

 

Akmpq =

1

ˆ ˆ

ˆ

 

ˆ

(338)

 

2

(1+ PkpPmq )(1Pkm )(1Ppq )akmpq .

 

 

 

 

 

 

 

ˆ

обозначен оператор перестановки индексов i и

j (Приложение

Символом Pij

П-3). Отметим, что формула (337) представляет собой иную запись выражения

(322).

164

2.8.2.2.2. Построение ОГ первого приближения

Если в выражении (336) ограничиться лишь членами первого порядка по Dmk(1) , то пе реходя к новым независимым переменным по формуле (324) и

выбирая шаг в направлении отрицательного градиента E по формуле (327), как это делалось в § 2.8.2.1.2, мы с помощью преобразования орбиталей (320), где Dmk(1) определяются согласно (328), будем перемещаться по поверхности средней

энергии к минимуму. В обычном градиентном методе для оптимизации орбиталей используется непосредственно преобразование (320), которое является унитарным лишь приближенно, поэтому после каждого шага спуска полученный набор орбиталей необходимо ортогонализовать. В отличие от

этого воспользуемся мы воспользуемся связью (331б)

элементов Dmk(1)

преобразования (320) с матричными элементами ОГ, записав

 

Φ

km

=ω

D(1) .

(339)

 

km

mk

 

Поскольку для продвижения к минимуму E величины Dmk(1) должны определяться по соотношению (328), легко найти, выражая ωkm через

фиксированные диагональные матричные элементы оператора согласно формуле (332), явный вид недиагональных матричных элементов искомого ОГ, а именно:

Φ

km

= λ(Φ

mm

−Φ

kk

)ξ2 V

. (k m)

(340)

 

 

 

km km

 

 

В выражении (340)

лишь

величины

Vkm полностью

определяются

соотношениями (337) и (333). Диагональные матричные элементы Φkk вместе с метрическими коэффициентами ξkm2 и величиной шага спуска λ

рассматриваются как параметры, произвол в выборе которых ограничивается лишь следующими условиями:

λξ2

|V

| 1, Φ

kk

≠ Φ

mm

(для каждой пары k,m)(341а)

km

km

 

 

 

 

 

λ > 0.

 

 

 

(341б)

Условия (341а) обеспечивают применимость теории возмущений. Когда же удовлетворяются условия (341б), цикл процедуры самосогласования будет шагом спуска по энергетической поверхности, если такой шаг достаточно мал. Так как при достижении экстремума все Vkm должны обратиться в нуль, при

подходе к экстремальной точке они должны по модулю уменьшаться, хотя и не обязательно монотонно.

165

О приближении к экстремальной точке можно судить по одному из следующих критериев:

ε = Vkm2

(342)

m>k

 

или

 

δ = max |Vkm |,

(343)

значения которых в точке экстремума обращаются в нуль. При уменьшении величин ε или δ условие (341а) удовлетворяется все более строго. Поэтому можно заключить, что если процесс самосогласования, основанный на ОГ (340) сходится, то полученные орбитали реализуют минимум (по крайней мере локальный) энергетического функционала (314) при заданных элементах матриц плотности γ (i | k) и Γ(ij | kl) .

2.8.2.2.3. Выбор параметров ОГ

При применении ОГ вида (340) для оптимизации орбиталей МК волновой функции важным является вопрос о выборе его параметров. По сравнению с градиентным методом в методе ОГ новыми являются лишь параметры Φkk .

Однако, как видно из выражения (340) и как показали результаты численных расчетов, выполненных с несколькими сильно отличающимися между собой наборами элементов Φkk при фиксированных значениях остальных параметров,

выбор Φkk не влияет на процесс самосогласования. Диагональные элементы ОГ

можно положить равными различным константам, например, как это было сделано в одной из численных реализаций метода, последовательным натуральным числам

Φkk = k .

(344)

Простейший выбор метрических коэффициентов ξkm

состоит в

приравнивании всех их единице, как это делалось в стандартном градиентном методе [15, 39]. Тогда условия (341) удовлетворяются при достаточно малом положительном значении λ . Малое значение λ обеспечивает сходимость процедуры самосогласования к минимуму энергии. Однако, как показывает соотношение (329), понижение энергии за один цикл пропорционально значению λ . Таким образом, с малым λ число циклов самосогласования, необходимых для достижения минимума энергии, может быть слишком большим. С большим же λ шаг спуска может превратиться в шаг подъема и возникнут осцилляции. Наиболее разумным является компромиссный выбор некоторого значения λ , которое можно определить только эмпирическим путем.

166

С метрическими коэффициентами ξkm равными единице цикл процедуры

самосогласования с использованием ОГ (340) приближенно воспроизводит шаг спуска по поверхности средней энергии в градиентном методе Мак-Вини [15]. Анализ сходимости этого метода показал [36], что даже в одконфигурационном случае скорость его сходимости мала и бывает настолько медленной, что изменение орбиталей на соседних циклах становится практически неразличимым, хотя значение энергии еще не достигло минимума. В работе [38] отмечалась неудовлетворительная сходимость градиентного метода также в МК теории ССП.

Более подходящий выбор метрических коэффициентов позволяет достичь лучшей сходимости. Для рассмотрения этой возможности следует учесть, что параметр λ и метрические коэффициенты ξkm входят в выражение для ОГ (340)

только в виде произведения λξkm2 . Эти произведения согласно (328) находятся в близком соответствии с величинами λkm из работы [38], где для их оценки

использовалась связь их со вторыми производными энергии. Согласно [38] разные метрические коэффициенты для разных координат являются более предпочтительными в расчетах с применением МК теории ССП.

Неопределенность в выборе параметров для ОГ является следствием неопределенности в выборе масштабов для координат в градиентном методе. Этот метод обеспечивает наилучшую сходимость, когда поверхности равной энергии близки к сферическим. Такой случай на практике встречается очень редко, поэтому для достижения наилучшей сходимости нужно делать преобразование координат, которое привело бы эти поверхности к нужной геометрии. Использование в [38] разных значений составляющих шага спуска по разным координатам по существу соответствует такому преобразованию. К более подробному исследованию выбора оптимальных значений λ и ξkm для

ускорения сходимости процесса самосогласования в рамках МК теории ССП еще возвратимся в § 2.8.2.2.5.

2.8.2.2.4. Построение ОГ второго приближения

Рассмотренные до сих пор методы оптимизации орбиталей основываются на определении первой вариации энергетического функционала. Опыт их применение позволяет заключить, что для построения эффективной процедуры самосогласования со стабильной сходимостью недостаточно вычисления только первых производных энергии, и требуется дополнительная информация о поведении энергетической поверхности. Для улучшения сходимости метода ОГ первого приближения, описанного в §§ 2.8.2.2.2 и 2.8.2.2.3, также требуется такая информация, поскольку он основан на линейной аппроксимации

167

энергетической поверхности. Далее укажем метод построения ОГ, в котором информация о поведении поверхности средней энергии используется более полно. Такой метод, основанный на квадратичной аппроксимации энергетической поверхности, называют методом второго приближения.

При построении ОГ второго приближения исходим из выражения (336), аппроксимирующего энергию вблизи исходной точки квадратичной функцией независимых переменных Dmk(1) . Обозначив через V и D векторы-столбцы,

составленные из Vkm и Dmk(1) при k < m , перепишем выражение (336) в матричной форме

E = E′− E =V D + 1 DAD ,

(345)

2

 

где A – квадратная матрица вторых производных (338).

Для исследования поведения энергетической поверхности, определяемой выражением (345), рассмотрим задачу на собственные значения

 

AX = ,

(346а)

 

X X = I ,

(346б)

где X – матрица собственных векторов матрицы A , ε – диагональная матрица

ее собственных значений, а

I

единичная матрица.

Определив из (346)

матрицу X , построим с ее помощью векторы-столбцы V и

D , а именно:

 

 

 

 

 

 

 

V = X V ,

(347)

 

 

 

D .

(348)

 

D = X

 

Компоненты вектора-столбца

D назвали нормальными координатами. В этих

 

 

 

 

 

 

координатах приращение энергии, определяемое выражением (345),

распадается на сумму независимых парциальных приращений Ep по каждой

нормальной координате Dp , а именно:

 

 

 

 

 

 

 

 

 

 

1

 

2

(349)

E = (VpDp +

2

εpDp ) .

p

 

 

 

По координате p , которой соответствует

положительное

значение εp ,

энергетическая поверхность будет иметь минимум. Для такой нормальной координаты оптимальное значение компоненты Dp вектора шага определяется

из условия

 

 

(350)

Dp = −Vp / εp .

168

Если матрица A является положительно определенной, соотношение (350) полностью определяет вектор шага, реализующий минимум энергетического функционала в рамках квадратичной аппроксимации. Пользуясь соотношением

 

(351)

D = XD ,

вытекающим из формулы (348), можно найти оптимальные значения Dkm(1) . Тогда

искомые недиагональные элементы ОГ определяются согласно формуле (331б) следующим образом:

Φ

km

=ω D(1) .

(352)

 

km

mk

 

Очевидно, что чем меньше

будут

отношения

Vp / εp , тем точнее

квадратичная функция (345) аппроксимирует энергетическую поверхность вблизи минимума и, следовательно, тем более существенного улучшения волновой функции можно ожидать с помощью оператора (352). Однако, если бы хотя бы некоторые εp близки к нулю или отрицательны, распространение

квадратичной аппроксимации вблизи выбранной точки на область минимума энергетического функционала является неправомерным.

Отрицательные или близкие к нулю εp могут возникнуть по двум

причинам. Первая из них связана с тем, что среди координат имеются такие Dmk(1) , первые и вторые производные средней энергии по которым тождественно равны нулю вследствие определенной структуры матриц плотности. Этот случай будет всегда иметь место, если орбитали | m и | k не входят вообще ни в одну из конфигураций, или входят вместе в каждую из конфигураций так, что их унитарное преобразование не изменяет волновую функцию. Такие Dmk(1) ,

естественно, надо исключить из рассмотрения, и в дальнейшем будем предполагать, что в исходное выражение (345) они не входят.

Близость к нулю или отрицательность некоторых εp может быть

обусловлена также тем, что исходная точка выбрана вблизи седловой точки на поверхности средней энергии. В этом случае следует отойти от седловой точки, двигаясь по соответствующим нормальным координатам небольшими шагами в направлении отрицательного градиента и непрерывно контролируя значение второй производной, с тем, чтобы своевременно перейти к вычислению оптимального шага по формуле (350). Такую стратегию можно реализовать, вычисляя длину шага по нормальной координате p согласно формуле

 

Vp

 

 

Vp

 

 

 

1

 

 

 

 

Dp = −

 

 

 

 

= −

 

 

×

 

 

 

 

,

(353)

 

 

 

 

|Vp

 

 

 

 

 

ε2p

+κ2Vp2

|

(εp /Vp )2

+κ2

 

 

 

 

 

 

 

 

где κ – некоторая безразмерная константа.

169

Соседние файлы в предмете Квантовая химия