litceysel.ru
добавить свой файл
1
УДК 62-505.3; 530.145. PACS 03.65 – w; 02.30.Yy.



Управление квантовыми системами и некоторые идеи

теории оптимального управления

В.Ф. Кротов

Институт проблем управления РАН,

Москва, Профсоюзная, 65,

Тел.: (495) 334-91-59, Е-mail: vfkrotov@ipu.ru




Введение

Проблема управления квантовыми системами – одна из наиболее актуальных научно–технических проблем, связанная с новейшими физическими нанотехнологиями. Конечная цель здесь – создание регулярных методов синтеза переменного электрического поля (лазерного излучения), управляющего микроскопическими состояниями атомов и молекул. Успешное внедрение на уровень квантовых систем современных техник управления, инструментария лазерной физики и квантовой электроники, реализующего «хирургию» атомов и молекул, открыло уникальные возможности для создания новых материалов, миниатюризации компьютерной памяти, и других технологий. Эта проблема оказалась также благодарным объектом для математиков, специализирующихся в области теории управления. Математические методы синтеза управления квантовыми системами основаны на некоторых идеях теории оптимального управления, адекватных свойствам этих систем. Здесь эти идеи анализируются и развиваются применительно к особенностям КС. Помимо сложности фазового пространства, выражающегося в высокой размерности аппроксимирующих схем, это характерная нелинейность задачи оптимального управления для таких систем и следующие из нее сингулярности решений, создающие известные пробелы в возможностях оптимизации. На основе полученных результатов эти пробелы устраняются, расширяется сфера применения алгоритмов синтеза управления, повышается их эффективность и быстродействие.

1. Постановка задачи.

В квантовой механике (КМ) синтезированы детерминированная динамика волновой функции (ВФ) и статистическая связь последней с наблюдаемыми величинами: динамическая и статистическая части квантовой системы (КС). Синтез управления целиком связан с первой, вторая же обусловливает выбор критериев. Пусть вектор координат системы, пробегающий область ; – ее ВФ (комплексная), на границе области ; ВФ рассматривается как элемент комплексного гильбертова пространства с нормой и соответствующим произведением


(1)

где – значок комплексного сопряжения, – элементарный объем координатного пространства. Полное описание динамического состояния КС содержится в ВФ , но здесь в этом качестве удобнее использовать пару . Динамика КС описывается дифференциальными уравнениями Шрёдингера.

(2)

где время; постоянная Планка; заданная функция; – электрическое поле, зависящее только от времени, свободно выбираемое в пределах ; – гамильтонов оператор системы; например, для частицы массы , управляемой монохроматической радиацией с переменной амплитудой: , – оператор (дифференциальный) кинетической энергии, – потенциальная энергия, – оператор дипольного момента. Все операторы в КМ – эрмитовы, а функционалы – квадратичные формы (КФ). При любом выборе управления система (2) имеет динамический инвариант


(3)

Последнее равенство диктуется статистическим смыслом ВФ. Т. е. область достижимости управляемой КС есть единичная сфера в H.

Необходимо выбрать функцию так, чтобы она минимизировала заданный функционал:

(4)

адекватный целям управления. Здесь – соответствующий оператор; знак минус обусловлен тем, что во многих случаях максимизируется положительная квадратичная форма. Это – задача оптимального управления для процессов в функциональном пространстве состояний H.

Замечание. Иногда применияются и критерии более общего вида:

(5)

где – эрмитов оператор, зависящий от , – заданная функция, функционал определен (4). Особенно часто:

(6)

(см. об этом ниже).

2. Особенности задачи.

Рассмотрим ординарную задачу оптимального управления

(7)

(8)


где – эвклидово пространство размерности с произведением ; вектор , вектор–функция , функции и компактное множество заданы, множество допустимых процессов , удовлетворяющих (8). В соответствии со сказанным в п.1 ограничимся случаем: скаляр, , , . Причем случаи и , как мы увидим, алгоритмически существенно различны. овымое управлениеупр

Для практических вычислений гильбертов вектор аппроксимируется вектором , и задача (2), (4) – задачей (7), (8). Адекватная размерность вектора очень велика: для молекулы с 6 – 7 степенями свободы, это – первая особенность задачи, фильтрующая выбор алгоритмов. Вторая, – комплексность ВФ, – не столь существенна для алгоритмизации; третья – отсутствие ограничений на состояние, включая терминальные ограничения; четвертая: (2) суть линейные однородные уравнения с управляемыми коэффициентами специального вида, в представлении (7):


(9)

где , матричные операторы, , зависящие от .

Для различных модификаций задачи (2), (4), (6) выведены необходимые условия оптимальности типа краевых задач для уравнений Эйлера и принципа максимума Понтрягина [1] (текст и ссылки), [2]. Но непосредственное их использование для синтеза управления возможно только применительно к «игрушечным» моделям малой размерности. Эффективный инструмент для решения задач (7), (8) с большим , и соответственно, для (2), (4): методы итеративного улучшения программы управления. В настоящее время применительно к КС используются два таких алгоритма: градиентный (ГрМ) и глобальный (ГлМ). Перечисленные особенности задачи создают удобные предпосылки для их применения.

3. Методы последовательного улучшения программы управления.

Выделим из (7) «подзадачу улучшения». Имеется допустимый, но не оптимальный процесс . Требуется улучшить его, отыскав процесс , такой, что .

Повторяя эту операцию, получим улучшающую последовательность , . Предел мы здесь не исследуем, сосредоточившись на операции улучшения и некоторых оценках последовательности.


Унифицированное описание интересующей нас группы методов дает техника достаточных условий оптимальности [3]. Запишем семейство представлений функционала с непрерывной, дважды дифференцируемой по функцией в качестве параметра:

(10)

(11)

(12)

Здесь и далее нижний значок означает дифференцирование по соответствующей переменной.

Существенную роль в решении задачи улучшения играют сопряженные уравнения



(13)

которые определяют вектор-функцию .

3.1. Градиентный метод. Пусть , удовлетворяет (13). Будем искать процесс , достаточно близкий к , чтобы знак разности был тот же, что и у ее главной линейной части


(13)

где , – вариация программы управления. Зададим так, что правая часть (14) положительна. Пусть при достаточно малых : , , и траектория определена управлением в силу (8). Тогда существует , такое что , .

Таким образом, процесс улучшения программы управления сводится к следующим шагам: 0. инициализация: дано , находим , решая задачу Коши (8) с ; 1. находим и , решая линейную задачу Коши (13), либо, не запоминая , , – задачу Коши для уравнений (8), (13) при с начальными условиями и (13); 2. установим вариацию программы управления так, чтобы правая часть (14) была положительной; 3. Для различных , найдем решения задачи Коши (8) при . Величину следует выбрать так, чтобы выполнялось , .


Выражение (13) дает градиент функционала в пространстве управлений . Эти методы развивались в работах Келли и др. [4], Энеева [5], Брайсона [6], и других.

3.2. Глобальный метод улучшения управления. Обозначим

(15)

Опишем операцию улучшения. Инициализация подобна п. 0. из 3.1. 1. Конструируем функцию , такую что

(16)

(17)

2. Из (15) находим и определяем процесс согласно уравнению и начальным условиям (8).

Теорема, [3]. Имеем: . Если условие , не выполняется, то .

Воспроизводя эту операцию, получим улучшающую последовательность . Основное звено этого метода, [7], – конкретный способ построения функции на каждой итерации. Их варианты с подробным описанием см. в [8], [9], [3].


3.3. Линейные системы с управляемыми коэффициентами. Пусть справедливо (9). Зададим: . Имеем

(18)

(19)

Здесь ()T – значок транспонирования. Функция выпукла по . Таким образом, первое условие (19) необходимо и достаточно для (16). Если функция вогнута, то второе условие (19) необходимо и достаточно для (17). Т. е. функция удовлетворяет (16), (17) и глобальный улучшающий алгоритм воспроизводит алгоритм градиентного метода с заменой в п.п. 2, 3 на , при этом существенно упрощая последний, поскольку исключается настроечный параметр , и бесконечно малые теоретически шаги заменяются конечными.

3.4. Особые режимы. Пусть и . Имеем:


(20)

(21)

Пусть при выполнении п.3 операции улучшения при . Значение оказывается не фиксировано. Доопределим его значением , реализующим равенство

. Дифференцируя последнее, получим с учетом (20), (21):

(22)

Это решение назовем особым, или сингулярным, режимом улучшенного управления. Оно появляется в улучшающей последовательности в качестве полуфабриката особого режима оптимального управления, если последний содержится в оптимальном процессе, и ограничено условием . Этот режим получен в рамках глобального метода. Градиентный метод здесь неприменим: , соответственно, улучшающий сдвиг управления не определен, а управление не следует из логики метода и, вообще, противоречит его условиями (малость ).

Характерна возможная неединственность улучшенного процесса . При определенных условиях имеется альтернатива: «сойти» с особого режима или остаться на нем. Именно, если в момент выполняется одно из неравенств


(23)

то соответственно

(24)

Замечание 1. Терминальные условия (19) и совместны только при специальных значениях . Поэтому, вообще, для выполнения 2-го и последующих улучшений необходимо, чтобы участок улучшаемой траектории, примыкающий к , был неособым:

Замечание 2. Пусть управление имеет несколько компонент:

, ; (25)

Изложенный алгоритм применим к улучшению по при фиксированном , так что можно считать: , . В последовательности эти шаги чередуются с улучшениями других компонент управления.

4. Квантовые системы.

Постановка задачи – в п.1. Она относится к классу задач п.п. 2.3, 2.4 в соответственно обобщенном пространстве состояний. Роль матричных операторов , играют операторы , , действующие в . Их дополнительное свойство – самосопряженность, и как следствие, – (3).

4.1. Условия применимости методов улучшения. ГрМ применим к задаче (4), только на ранних итерациях и если поиск начинается далеко от экстремума и не сказываются эффекты особого режима, либо – при отсутствии последнего в составе оптимального процесса (что не характерно). При наличии добавки (6) он применим без оговорок (см. об этом ниже).

Применимость глобального улучшения регламентируется в п. 2.2 требованием вогнутости функции , чему соответствует неотрицательность формы . Покажем, что для КС оно смягчается до требования знакоопределенности последней и, как правило, выполняется. Наиболее характерные критерии оптимальности – максимум или минимум вероятности того, что к моменту значения наблюдаемых величин, или соответствующие состояния, окажутся в пределах заданного множества . Пусть наблюдаемые – энергия или импульс, имеющие собственные значения и функции . Имеем: , . Это – положительная КФ. Задача , соответствующая максимизации , отвечает требованиям применимости метода. Задача не отвечает им, но ей эквивалентна задача , где – дополнение до числовой оси. Последняя обладает необходимой выпуклостью. Аналогично обстоит дело, если наблюдаемые – координаты, и соответственно .Таким образом, и максимизация, и минимизация реализуема этим методом либо непосредственно, либо альтернативной заменой .


4.2. Операция улучшения. Запишем базисные конструкции этих методов, учитывая особенности задачи. Улучшающая функция теперь – линейный действительный функционал: , где заданная вектор- функция, , как и соответствующие ей в силу (13):







Дифференциальные уравнения итераций:

(26)

(27)





В соответствии с п.п. 2.3, 2.4, операция глобального улучшения будет следующей.

0. Инициализация, прямая прогонка. Выбирается функция и интегрируется уравнение Шредингера (2) для c начальным значением , получается траектория и соответствующее значение функционала .


1. Обратная прогонка. Решается задача Коши (26a), , и находится .

2. Прямая прогонка. Решаем задачу Коши (26), , , воспроизводя и определяя новую траекторию , управление согласно (27), и соответствующее значение функционала или .

Применение операции градиентного улучшения к задаче (6) воспроизводит хорошо известные схемы. Методы гарантируют только нахождение локального минимума (понтрягинская экстремаль).

4.3. Энергия поля как регламентирующий фактор управления. Функционал интерпретируется как расход энергии на управление, а минимизация суммы это компромисс между качеством достижения главной цели (4) и экономией энергии. Но содержание этого компромисса требует прояснения. Если энергия лазерного излучения есть регламентирующий фактор управления, то его следует ввести в постановку задачи в виде ограничения:

(28)

где – предельное допустимое значение энергии. Этому ограничению отвечает сопряженная функция: .


Решается задача улучшения при и проверяется (28). Если , то ограничение (28) несущественно; если , то решается семейство задач улучшения с параметром , который подбирается так, что . Как видим, редукция не тождественна учету ограниченности энергии.

4.4. Сравнение методов глобального и градиентного последовательного улучшения. ГрМ имеет локальный характер, улучшение требует семейства прогонок с настроечным параметром ε и гарантируется только при малых его значениях. Соответствено, сходимость происходит медленно. ГлМ не содержит настроечных коэффициентов и реализуется единственной парой прогонок: обратной и прямой. ГрМ не содержит достаточных инструментов для улучшения и генерирования особого режима, т. е. – оптимизации КС с критерием качества (4): оптимальная траектория состоит из кусков и особого режима , для которого градиент и, соответственно, улучшающий сдвиг управления не определен, а управление не следует из логики метода и, вообще, не допускается его условиями (малость ). Поэтому при пользовании ГрМ обычно к функционалу (4) добавляется слагаемое (26). Оно регуляризует ГрМ, но вносит неясность в физический смысл критерия (см. выше) и обусловливает недоиспользование ресурса управления для главной цели (4): ухудшается и сходимость последовательности улучшений сравнительно с ГлМ, и качество конечного результата. ГлМ не имеет этих осложнений и применяется либо напрямую к исходной задаче (4), либо к редуцированной, хотя и в нем не все обстояло благополучно с особым режимом. Теоретически сингулярная дуга улучшенной траектории автоматически реализуется ГлМ как скользящий режим. Поэтому в [3] предлагалось не выделять ее специально. Однако реализация такого подхода оказывается связана с существенными вычислительными трудностями. Регулярное управление , полученное здесь, снимает эти трудности.


ГрМ применялся к КС еще до появления ГлМ, лучше освоен физиками, и большинство задач решается им. Применение ГлМ к проблемам управления КС было предложено в [9,10], и к настоящему времени его можно считать достаточно внедренным. Его преимущества нашли подтверждение в исследованиях управления квантовым состоянием молекул и задач физической химии, магнитного резонанса, задач квантовой оптики, и других актуальных направлений, опубликованных в [11 – 17] и других работах. Следует выделить [14], где этим методом в модификации [11] оптимизируется нелинейная управляемая КС, выпадающая за рамки уравнений (2). Это – так называемый бозонный конденсат, особое макроскопическое состояние вещества, открытое и исследованное советскими физиками, нобелевскими лауреатами (именно за эти работы) П.Л. Капицей и Л.Д. Ландау. Интересный сравнительный анализ был сделан в [11, 12]. Показано, что ГлМ существенно уменьшает необходимое количество вычислений, если поиск начинается далеко от экстремума. Численные эксперименты на нескольких КС с критерием (6) хорошо это демонстрируют. Сходимость происходит очень быстро в самом начале поиска. Новые перспективы управления КС, ориентированные на синтез компьютерной памяти методами квантовой оптики, открывает [17].

Работа выполнена в рамках Программы № 15 «Проблемы анализа и синтеза интегрированных систем управления для сложных объектов, функционирующих в условиях неопределенности» отделения энергетики, машиностроения, механики и процессов управления РАН.

Автор благодарит А.В. Булатова и А.В. Горшкова за консультации и обсуждение работы.

Аббревиатуры: КМ – квантовая механика; ВФ – волновая функция; КС – квантовая система; (ГлМ) – глобальный метод; (ГрМ) – градиентный метод.

СПИСОК ЛИТЕРАТУРЫ


  1. Rabitz H. Control of microworld chemical and physical processes. In: Encyclopedia of Computational Chemistry, J. Wiley & Sons Ltd, Chichtster, 1998, v.1, p. 573 – 580.

  2. Krotov V.F. Global Methods in Optimal Control Theory, Marcel Dekker Ink., New-York, Basel, 1996. 384с.


  3. Kelley H. J. // Gradient theory of optimal flight paths. MRS J, 1960, 30 (10).

  4. Энеев T. M. // Приложение градиентного метода в теории оптимального управления. Космические исследования, 1966, т.4 (N 5).

  5. Bryson A. E. and Ho Y. Ch. Applied Optimal Control, Hemisphere Publishing
    Corporation, Washington, D.C. (1975).

  6. Кротов В.Ф. , Фельдман И.Н. // Итеративный метод решения экстремальных задач. В сб.: Моделирование технико-экономических процессов, ред. Кротов В.Ф.. Москва (1978), с. 22 – 35.

  7. Кротов В.Ф., Фельдман И.Н. // Итеративный метод решения задач оптимального управления. Изв. АН СССР, Техн. Кибернетика, 1983, N 2, с. 162 – 167.

  8. Кротов В.Ф., Коннов А.И. // О глобальных методах последовательного улучшения управляемых процессов. Автомат. и Телемех., 1999, N 10, с. 77 - 88.

  9. Казаков В.А., Кротов В.Ф. // Оптимальное управление взаимодействием света и вещества. Автомат. и Телемех., 1987, N 4, с. 9 - 15.

  10. 13. Krotov V. F. Global methods to improve control and optimal control of
    resonance interaction of light and matter. Lecture Notes in Control and Infor-
    mation Sciences, Vol. 121, Springer-Verlag, New York , 1988, р. 267 – 298.

  11. Somloi J., Kazakov V. A., and Tannor D. J. // Controlled dissociation of I2 via optical transitions between the X end B electronic states. Chemistry Physics, 1993, 172, 85 - 98.

  12. Somloi J., Kazakov V. A., and Tannor D. J. Physical Review A, 60, 3081, 1993.

  13. Rangan C. and Bucksbaum P.H. // Optimally shaped terahertz pulses for phase retrievial in a Rydberg-atom data register. Physical Review A, 64, 033417 (2001).


  14. Sklarz S.E. and Tannor D.J. // Loading a Bose – Einstein condensate onto an optical lattice: an application of optimal control theory to the nonlinear Shroedinger equation. Physical Review A 66, 053619 (2002).

  15. Calarco T., Dorner U., Julienne P.S., Williams C.J. and Zoller P.// Quantum computations with atoms in lattices: Marker qubits and molecular interactions. Physical Review A 70, 012306 (2004).

  16. Khaneja N, Reiss T., Rehlet C., Shulte-Herbrueggen T., Glaster S.J. // Optical control of coupled spindynamics: design of NMR pulse sequences by gradient ascent algorithms. Jornal of Magnetic Resonance 172 (2005), 296 – 305.

  17. Gorshkov A.V., Calarco T., Lukin M.D., Sorensen A.S.// Photon storage in Λ-optically dence atomic media. Physical Review A, 77, 043806 (2008).