photon190573: (Default)
По просьбам населения попробую разложить по полочкам, что такое мультиреференсные методы и как они соотносятся друг с другом.

В HF/DFT волновая функция представлена в виде 1 детерминанта Слейтера. 1 детерминант (или 1 спин-адаптированная комбинация детерминантов) описывает 1 электронную конфигурацию. Соответственно, если состояние (неважно, основное или возбужденное) не описывается 1 конфигурацией (например, частично заполненная оболочка или ситуации, когда состояния примерно одной энергии описываются разными эл. конфигурациями), такое состояние требует описания в виде лин. комбинации спин-адаптированных волновых функций, соответствующих разным конфигурациям.

Например, состояние 2p^1 -- это 3 конфигурации: 2p_x^1, 2p_y^1, 2p_z^1. Если не учесть их все с равными весами, волновая функция состояния будет перекошенной (например, будет только p_x в сферически симметричной задаче, что сходу неверно).

Соответственно, любое описание состояния через лин. комбинацию конфигураций, является многоконфигурационным (да, в CIS или TDDFT возб. состояния тоже являются многоконфигурационными, даже если доминирует одна). И не так уж важно, получено ли это описание вариационным методом (любые методы ССП) или по теории возмущений, или через кластерное разложение.

Теперь, собс-но, про иерархию методов. Самое простое -- взять обычное одноконфигурационное решение ССП (HF или DFT, неважно). Пусть оно получилось косым из-за того, что заселенными оказались только некоторые орбитали из оболочки, отчего эти просели, а незаселенные уехали вверх. Теперь построим на этих орбиталях все возможные (спин-адаптированные) конфигурации, возьмем их линейную комбинацию (будет конфигурационное взаимодействие), а коэффициенты КВ получим диагонализацией гамильтониана в базисе всех возможных таких лин. комбинаций. Это, как нетрудно догадаться, полное КВ -- наилучшее решение, к-рое только можно получить в данном базисе.

Но Full CI, если это не очень маленькая система -- это непозволительно дорого. Количество конфигураций растет как факториал (быстрее, чем экспонента). Хочется как-то облегчить себе жизнь. А давайте ограничимся только 1-2-кратными возбуждениями по отношению к референсной ("возбуждения" при этом могут иметь ту же энергию что и референс) -- это CISD (КВ1+2). Про CIS тут даже и говорить как-то неприлично... Другой вариант: а давайте учтем все возможные конфигурации, но на ограниченном наборе орбиталей (например, в пределах 1 оболочки). Это КВ в полном активном пространстве (CAS-CI). Полное -- потому что учтены все возможные для данных активных орбиталей расположения электронов. А активные -- это те самые орбитали, к-рые мы для этих целей выбрали. Ну и можно совсем уж урезать осетра и сделать ограниченное КВ в акт. пространстве. Правда, сейчас так никто не делает за бессмысленностью.

Итак, если речь идет про КВ (CI), то орбитали не трогают, только оптимизируют коэф. КВ, и варианты бывают Full-CI, CAS-CI, CISD и CISD в акт. пространстве.

Обратите внимание: пока мы строили конфигурации на готовых орбиталях и только игрались с коэффициентами КВ. Но скорее всего, наши исходные орбитали были плохие (потому что получены в изначально неверном предположении). Поэтому возникла резонная идея, что орбитали тоже неплохо бы подправить с учетом того, что правильная волновая функция является лин. комбинацией нескольких конфигураций. Или, матрица плотности правильного состояния будет усредненной по всем эл. конфигурациям с соответствующими весами. Такой подход называется MCSCF (МКССП), поскольку подправляем орбитали мы снова методом ССП.

Что значит -- подправлять орбитали? Значит, что получив коэффициенты КВ и построив лин. комбинацию конфигураций, подставим ее в ур. Хартри-Фока и снова диагонализуем методом ССП, но с учетом того, что теперь у нас не 1 детерминант, а целая лин. комбинация. Вот тут и всплывает 1й нюанс: если мы, допустим, для нашей системы 2p^1 будем подправлять орбитали только для 1 состояния (к-рое у нас в ХФ получилось 2p_x^1), то оно и будет у нас получаться дальше. Это называется State-Specific (SS-MCSCF) Как было косое решение в симметричной задаче, так и осталось. Отсюда растут ноги у идеи усреднять по состояниям -- усредняется как энергия, так и матрица плотности, и индивидуальные конфигурации уже не играют такой роли (State-Averaged, SA-MCSCF). В случае вырожденных состояний этот прием отлично работает. Но и в случае квазивырождения, и даже вообще невырождения (когда между усредняемыми состояниями есть заметная энерг. щель) тоже очень неплохо работает: в одном расчете получаются сразу несколько состояний с одинаковой погрешностью. Если в SS-MCSCF каждое состояние получалось в отдельном расчете (только низшее состояние имеет смысл, а остальные хоть и получаются, но смысла особого не имеют), с риском свалиться в вариационный коллапс или с необходимостью вводить симметрийные ограничения, то в SA-MCSCF усредняемые состояния сразу ортогональны друг другу, и никакого вариационного коллапса. И симметрию можно отключить, особенно если и изначально молекула не была симметричной.

Итак, результат вариационного расчета называется референсом. Многоконфигурационный референс получается в результате MCSCF, в отличие от одноконфигурационного (из HF или DFT). MCSCF бывает без усреднения по состояниям (SS-MCSCF) или с усреднением (SA-MCSCF), бывает полным в акт. пространстве (CASSCF) или ограниченным (обозначений не встречала, хотя задать такой расчет в Гамессе или FF легко). Варианта CISD с оптимизацией орбиталей не встречала, хотя технически, наверняка, возможно. Но скорее всего, будет нереально дорого. Похоже что фишка многоконфигурационного референса как раз в том, чтобы получить решение в небольшом акт. пространстве, а потом его улучшать дальше.
Далее, имея на руках многоконфигурационный референс, можно (и нужно!) улучшать его еще дальше за счет взаимодействия состояний из акт. пространства с состояниями из т.н. внешнего пространства -- теми, где участвуют орбитали, не входящие в состав активных. Это все методы с приставкой MR: MRCI (обычно в варианте CISD) над референсом из акт. пространства, MRPT и MRCC -- соответственно, теория возмущений и Coupled Clusters на референсе из акт. пространства. Из них только MRCI -- вариационный.
Грабли там заботливо разложены на каждом шагу, но это уже отдельная история.
Размерность и прожорливость каждого метода -- это, наверное, не ко мне. Лимитировать могут разные вещи. Небольшая (в смысле размера базиса) задачка в огромном акт. пространстве порождает чудовищное кол-во конфигураций, отчего затыкается любой традиционный алгоритм (но специально заточенный под такие вещи DMRG, наверное, нет). Не особо большой SA-CASSCF(8e,8o) для задачи в огромном базисе тоже может стать кластеру поперек горла. Считали нормально CASSCF для N состояний, увеличили до N+1 -- и уперлись в нехватку памяти или безумное время счета.
photon190573: (Default)
В результате общения с пользователем на форуме поняла, что нужно вернуться к азам и объяснить, кто в МКССП на ком стоит.

В начале был атомный базис. Для тех, кто забыл, какого цвета учебник, напоминаю: это набор более-менее водородоподобных орбиталей, центрированных на каждом ядре в молекуле. И пусть базис у нас "в темном чулане хранится / в доме, который построил Джек".

В методе ХФ или DFT волновая функция или, соответственно, эл. плотность описывается с помощью линейных комбинаций этих атомных базисных функций. Для тех, кто все болел, когда это проходили, напоминаю: эти комбинации называются молекулярными орбиталями, а волновая функция (или ее формальный аналог в DFT) представляется в виде слетеровского детерминанта. Коэффициенты в этих линейных комбинациях (т.е., вклад каждой АО) выбирают таким образом, чтобы минимизировать среднее значение гамильтониана с этим слетеровским детерминантом. Полная электронная плотность (а она является наблюдаемой величиной) определяется занятыми орбиталями. Очевидно, что добавление или отрыв электрона существенно меняет распределение эл. плотности в молекуле.

Таким образом, на первой стадии мы имеем слетеровский детерминант, построенный из молекулярных орбиталей, каждая из к-рых представляет собой линейную комбинацию атомных орбиталей ("которые часто воруют пшеницу / которая в темном чулане хранится / в доме, который построил Джек"). Во многих случаях такого описания основного состояния молекулы вполне достаточно.

Если мы возьмем все, а не только занятые молекулярные орбитали с первого шага (обычно берут хартри-фоковские) и построим все возможные слетеровские детерминанты, в к-рых одна или несколько занятых орбиталей заменены таким же количеством незанятых, это можно интерпретировать как возбуждение (т.е., мы возбуждаем электроны с занятых орбиталей на вакантные). Но возбужденные состояния нельзя описать отдельными слетеровскими детерминантами (конфигурациями). Каждое возбужденное состояние представляется в виде линейной комбинации возбужденных слетеровских детерминантов, а коэффициенты этих линейных комбинаций снова подбирают таким образом, чтобы минимизировать среднее значение гамильтониана. И это будет еще один этаж "в доме, который построил Джек".

Возбужденное состояние может иметь одну доминирующую конфигурацию, но не обязательно. Так что представление о том, что возбуждение -- это всегда переход электрона с какой-то одной занятой орбитали на какую-то одну вакантную, -- оставьте, пожалуйста, где-нибудь в другом месте.

Этот метод называется методом конфигурационного взаимодействия (КВ, CI) и может быть разного порядка, или кратности, в зависимости от учитываемых возбуждений (CIS, CISD, CISDT и т.д. -- надо расшифровывать или догадаетесь, что речь идет о Singles, Singles+Doubles, Singles+Doubles+Triples и т.д.?) или включать все возможные возбуждения в рамках заданного набора занятых и вакантных орбиталей, называемого активным пространством. Последний вариант называется КВ в полном акт. пространстве (Complete Active Space CI, or CAS-CI). Если акт. пространство включает в себя все занятые и вакантные орбитали, такой вариант CAS-CI называется полным КВ (Full CI).

Итак, теперь у нас есть представление основного и возбужденных состояний в виде линейных комбинаций слетеровских детерминантов разной кратности возбуждения, построенных из молекулярных орбиталей, каждая из к-рых представляет собой линейную комбинацию атомных орбиталей ("которые часто воруют пшеницу / которая в темном чулане хранится/ в доме, который построил Джек").

Метод многоконфигурационного самосогласованного поля (МКССП, MCSCF) в дополнение к оптимизации коэффициентов КВ включает еще и оптимизацию молекулярных орбиталей. Чем больше акт. пространство (т.е., чем сильнее оно приближается к полному пространству МО), тем меньше нужна оптимизация орбиталей. А оптимизация орбиталей есть не что иное как изменение коэффициентов при АО в разложении МО. И это -- чердак в доме старины Джека :) Таким образом, единственная неизменная вещь здесь, фундамент, на к-ром все стоит -- это базис.

Но где же "те два петуха, которые будят того пастуха"? В смысле, где в этой конструкции место усреднению по состояниям?

В принципе, мы могли бы оптимизировать орбитали для каждого состояния в отдельности, и тогда орбитали для каждого состояния получались бы свои. Но единственный критерий при оптимизации МО и коэффициентов КВ -- это минимизация среднего значения гамильтониана, и этот критерий действителен только для основного состояния данной мультиплетности и симметрии. Поэтому, если нам нужно возбужденное состояние той же мультиплетности и симметрии, что и основное, мы не сможем получить его волновую функцию отдельно. Тут-то и придется использовать усреднение по состояниям.

Усреднение по состояниям -- это способ в МКССП получить равно-хорошие (или равно-плохие) орбитали для нескольких состояний. В этом случае гамильтониан строят не на отдельных орбиталях, и не на отдельных конфигурациях, и даже не на отдельных состояниях, а на матрице плотности, усредненной с заданными весами по интересующим нас состояниям. И величина, к-рую мы минимизируем в этом случае -- это среднее значение гамильтониана с этой матрицей плотности.

Веса состояний никак не оптимизируют. Это не вариационный параметр. Мы их, вообще говоря, от балды задаем. И "эксперты рекомендуют" :) задавать их равными 1 для всех состояний, включенных в усреднение, и 0 для всех остальных состояний. Это будет означать, что нас интересуют все усредняемые состояния в равной мере, и ни одному из них мы не даем предпочтения перед остальными. И это -- единственный более-менее обоснованный подход в выборе весов. И поскольку веса -- это тот параметр, к-рый задаем мы сами, придавать им какой-то физический смысл, интерпретировать -- не надо. Вот не надо, да.

Гамильтониан, чье среднее значение мы минимизируем, сам зависит от матрицы плотности. Поэтому попытки считать CASSCF в разных точках ППЭ с разными наборами и весами усредняемых состояний можно сравнить с попытками посчитать энергию молекулы в одной геометрии с функционалом BLYP, в другой -- с B3LYP, в третьей -- с BHHLYP, и построить по этим данным профиль реакции.

Итак, в сухом остатке у нас следующая конструкция: базис АО --> МО как линейная комбинация АО --> слетеровские детерминанты, построенные из МО --> состояние как линейная комбинация слетеровских детерминантов --> усреднение матрицы плотности по состояниям как способ получить общий набор МО для нескольких состояний и вообще как способ обращаться с возбужденными состояниями. Анализировать вдоль пути реакции можно, например, веса отдельных конфигураций в составе интересующего состояния. Можно (если не в лом) проанализировать даже вклады отдельных АО в МО, к-рая сильнее всех меняется вдоль пути реакции. А вот веса отдельных состояний в усредненной матрице плотности анализировать не имеет смысла, потому что они такие, какими мы их задали, и в процессе расчета их никто не оптимизирует. Выбрать веса из каких-то физических соображений нельзя, т.к. нет таких физических параметров молекулы, к-рые можно было бы сопоставить с весами состояний в ее матрице плотности.

Надеюсь, я смогла изложить достаточно понятно. Спрашивайте, welcome :)

Profile

photon190573: (Default)
photon190573

April 2024

S M T W T F S
 123456
78910111213
14151617181920
2122232425 2627
282930    

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 18th, 2026 04:44 am
Powered by Dreamwidth Studios