litceysel.ru
добавить свой файл
1
Лекция № 13


Применение метода математического моделирования для оптимизации параметров систем автоматизации


Основные понятия и определения параметрической оптимизации


В широком смысле общая задача оптимизации параметров систем автоматизации заключается в отыскании экстремума критерия (целевой функции) при заданных ограничениях в виде равенств и (или) неравенств, то есть в решении задачи математического программирования.

Целевая функция есть однозначная численная характеристика системы, позволяющая количественно оценить ее качество. Аргументом целевой функции выступают параметры , подлежащие оптимизации и называемые управляемыми параметрами. Вектор параметров системы , удовлетворяющий заданным ограничениям и доставляющий экстремум целевой функции, называется оптимальной точкой, а пара и составляет оптимальное решение.

При непрерывном изменении значений элементов вектора целевая функция может быть непрерывной или разрывной. Если график целевой функции имеет один экстремум, то такая функция называется унимодальной или одноэкстремальной).

Если же график целевой функции имеет несколько экстремумов, то такая функция называется многоэкстремальной (см. рис.2б). Для нее различают точки глобального экстремума и локальных экстремумов.

Математическое определение глобального и локального экстремума имеет следующий вид. Функция , определенная в допустимой области изменения независимой переменной , достигает своего глобального максимума в точке , если


для всех .

Функция , определенная в допустимой области изменения независимой переменной , достигает своего локального максимума в точке , если в - окрестности точки выполняется условие

для всех х, удовлетворяющих условию ,

где - малая положительная величина, характеризующая точность попадания в экстремальную точку.

Глобальный экстремум можно определить путем нахождения всех локальных экстремумов и их сравнения между собой. Если функция унимодальна, то локальный экстремум автоматически становится глобальным.

При дискретном характере значений элементов вектора целевая функция также окажется величиной дискретной, а ее изображение на координатной плоскости будет представлять собой множество точек. Дискретные значения управляемых параметров характерны для многих технических объектов. В таких случаях при решении задач оптимизации делают допущение о непрерывности параметров, а после нахождения оптимальных значений осуществляют выбор из дискретного ряда.


Если экстремум целевой функции отыскивается в неограниченной области параметров , то его называют безусловным экстремумом, а методы его поиска – методами безусловной оптимизации.

Однако в задачах оптимизации параметров систем автоматизации технологическими процессами, как правило, присутствуют те или иные ограничения. Различают прямые и функциональные ограничения. Прямые ограничения накладываются на управляемые параметры –



где - нижнее и верхнее граничные значения управляемого параметра ;

m – размерность пространства управляемых параметров.

Область в пространстве управляемых параметров, заданную прямыми ограничениями, называют допустимой областью или областью допустимых значений управляемых параметров - .

Функциональные ограничения устанавливают некоторые зависимости между управляемыми параметрами, нарушение которых недопустимо по условиям обеспечения работоспособности или регламентируемой эффективности функционирования технической системы и имеют вид–

.

Наличие ограничений приводит к задаче условной оптимизации, при которой находится условный экстремум целевой функции. Наложенные ограничения приводят к тому, что поиск оптимального решения ограничивается некоторой областью в пространстве управляемых параметров - , которая называется областью работоспособности технической системы.


Таким образом общая задача оптимизации параметров технической системы как задача математического программирования может быть формализована следующим образом -




Определение экстремума аналитической целевой функции


Рассмотрим задачу поиска экстремума непрерывной целевой функции в одномерном случае. Предположим, что функция определена на интервале и n-кратно дифференцируема на этом интервале. Если внутри этого интервала есть точка , доставляющая экстремум целевой функции, то теорема Тейлора позволяет записать изменение функции F при переходе от точки к точке в виде

,

где - сумма членов ряда, в которых степень равна (n+1) и выше.

Если соответствует локальному минимуму функции , то по определению должна существовать - окрестность точки , в которой выполняется неравенство - . Из данного неравенства следует, что (1)


При достаточно малом первое слагаемое доминирует над остальными, а так как можно выбрать и положительным, и отрицательным, то данное неравенство будет выполняться только при условии –

. (2)

Рассуждая аналогичным образом, нетрудно получить второе условие выполнимости неравенства (1) - . (3)

Если определяется локальный максимум, то в выражение (3) примет вид - .

Условия (2) и (3) являются необходимыми условиями локального экстремума, но не достаточными. Например, в точке функция одновременно удовлетворяет условиям и локального максимума, и локального минимума, но не имеет экстремум. Такие точки называются точками перегиба или седловыми точками. Достаточным условием локального экстремума является следующее:

если в точке первые (m-1) производные целевой функции обращаются в нуль, а производная порядка m отлична от нуля, то является точкой локального экстремума при m четном, в противном случае - является точкой перегиба.


Для многомерной непрерывной целевой функции , имеющей все первые и вторые частные производные по всем управляемым параметрам, разложение в окрестностях экстремальной точки в ряд Тейлора, ограничиваясь квадратичными членами, будет иметь вид –

,

где - скалярное произведение соответствующих векторов;

- вектор-градиент целевой функции;

- вектор, определяющий расстояние между точками и ;

- матрица Гессе, а ее элементы – вторые производные целевой функции по управляемым параметрам: .

Необходимым условием экстремума целевой функции в некоторой точке пространства управляемых параметров является равенство нулю градиента целевой функции в этой точке, что соответствует равенству нулю всех первых частных производных целевой функции по управляемым параметрам –

. (4)

Достаточные условия экстремума целевой функции заключаются в том, чтобы матрица Гессе в стационарной точке (для которой выполняется условие (4)) при любом векторе была –


для максимума - отрицательно определенной (5)

для минимума – положительно определенной (6)


Поисковая оптимизация


Как правило, задачи оптимизации технических объектов и систем характеризуются большим количеством оптимизируемых параметров и накладываемых на них ограничений. Такие задачи получили название многопараметрической условной оптимизации –

. (7)

Вопросы теории и методы решения задач условной оптимизации рассматриваются в области математики, называемой математическим программированием. Традиционно в математическом программировании выделяются следующие основные разделы:

- линейное программирование – целевая функция линейна, а множество, на котором осуществляется поиск экстремума целевой функции, задается системой линейных неравенств (равенств);

- нелинейное программирование – нелинейные целевая функция и ограничения.

При оптимизации параметров технических систем часто используют их алгоритмические математические модели, то есть определение значений целевой функции, функций-ограничений и их градиентов осуществляется на основе результатов численного решения системы уравнений модели и вычисления значений выходных параметров объекта, которые являются функционалами фазовых координат объекта. В этом случае отсутствуют аналитические выражения, устанавливающие связь между управляемыми параметрами и функциями (7), и для решения задачи используют поисковую оптимизацию.

Сущность поисковой оптимизации заключается в том, что поиск экстремальной точки в пространстве управляемых параметров осуществляется последовательными шагами, ведущими от исходной точки через некоторые промежуточные отображающие точки в заданную - окрестность точки экстремума . Последовательность отображающих точек , соединенных отрезками прямых, называется траекторией поиска. На каждом шаге поиска решается система уравнений, составляющих математическую модель оптимизируемой системы, и вычисляются значения выходных параметров, на основе использования которых формируется целевая функция.


Общий алгоритм поисковой оптимизации включает следующие этапы:

1. Задание параметров алгоритма.

2. Выбор исходной точки поиска и вычисление значения целевой функции .

3. Определение направления движения в пространстве управляемых параметров.

4. Осуществление шага поиска – переход в следующую точку пространства управляемых параметров .

5. Вычисление целевой функции в новой точке .

6. Оценка успеха поиска – сравнение значений и .

7. Изменение параметров алгоритма поиска.

8. Проверка условий окончания поиска. Если данные условия не выполняются, то осуществляется переход к этапу 3.

Таким образом, процесс оптимизации представляет собой целенаправленное движение в пространстве управляемых параметров к точке, в которой достигается экстремум целевой функции.

Затраты машинного времени при поисковой оптимизации можно оценить по формуле –

,

где - время, затрачиваемое на один вариант анализа функционирования системы при фиксированном значении управляемых параметров (решение уравнений математической модели системы, вычисление значений целевой функции и ограничений);

- число вариантов анализа системы соответственно на этапе определения направления поиска и на этапе вычисления целевой функции;


- число шагов поиска.


Постановка задачи оптимизации


Процедура постановки задачи оптимизации носит неформальный характер и включает следующие этапы:


  • выбор критериев оптимальности,

  • формирование целевой функции,

  • выбор управляемых параметров,

  • назначение ограничений,

  • нормирование управляемых и выходных параметров.

В качестве критериев оптимальности принимаются выходные параметры, которые оказывают наибольшее влияние на достижение конечной цели функционирования системы. Остальные выходные параметры используются при формировании функции ограничений. Выбор критериев оптимальности требует глубокого понимания сущности решаемой задачи. Всесторонняя оценка эффективности и качества объекта возможна при использовании множества критериев, что приводит к многокритериальности.

Векторный характер критериев оптимальности создает проблему формирования целевой функции. Сложности создает как количество критериев, так и характер их взаимодействия. Зачастую улучшение одного из критериев приводит к ухудшению других. Поэтому при наличии векторного критерия возможно лишь некоторое компромиссное решение. В этом случае говорят о Парето-оптимальных решениях. Для нахождения Парето-оптимального решения формируют аддитивную целевую функцию вида –

, (8)

где - коэффициент веса, характеризующий значимость j-го критерия - .

В однокритериальных задачах критерий оптимальности скалярный, что позволяет использовать его в качестве целевой функции. В случае многокритериальной задачи для организации алгоритма поисковой оптимизации необходимо решить задачу свертки векторного критерия в скалярную целевую функцию. Данная задача может быть решена на базе различных альтернативных принципов, обусловливающих множество стратегий решения многокритериальных задач. Различают следующие виды стратегий:


- стратегия частного критерия;

- стратегия взвешенной аддитивной компенсации противоречий критериев;

- стратегия мультипликативной компенсации противоречий критериев;

- максиминная стратегия.


Стратегия частного критерия

В качестве целевой функции принимают один из критериев оптимальности – выходной параметр системы, характеризующий важнейшее ее качество. Все остальные критерии оптимальности используют для назначения ограничений. Математическая формулировка задачи имеет вид –

, (9)

где - важнейший из критериев оптимальности, - остальные критерии оптимальности, m – количество управляемых параметров, n – количество критериев.

Преимущество стратегии частного критерия – простота постановки задачи оптимизации. Однако при этом по не оптимизируемым параметрам показатели эффективности системы могут оказаться на минимально допустимом уровне, что снижает эффективность полученного решения.


Стратегия взвешенной аддитивной компенсации противоречий критериев

Данная стратегия предполагает свертку всех критериев оптимальности (оптимизируемых параметров системы) путем приведения требований по направлению их изменения к единому виду. Разделим выходные параметры системы на три группы:

- - параметры, значения которых в процессе оптимизации необходимо увеличивать - ;

- - параметры, значения которых в процессе оптимизации необходимо уменьшать - ;


- - параметры, на значения которых установлено предельно допустимое отклонение от заданного значения - .

- граничные значения выходных параметров по условиям работоспособности системы.

Параметры третьей группы можно перевести во вторую группу следующим образом –



Введем вектор весовых коэффициентов , характеризующих значимость выходных параметров, и вектор нормирующих коэффициентов и сформируем аддитивную целевую функцию –

, (10)

Если в выражении (10) умножить на (-1), то получим следующую математическую формулировку задачи оптимизации:

(11)

Весовые коэффициенты должны отвечать условиям - . При выборе нормирующих множителей можно воспользоваться техническими требованиями к исследуемой системе, то есть принять их равными требованиям к техническим параметрам .


Основной недостаток данной стратегии заключается в том, что алгоритм оптимизации не реагирует на ухудшение отдельных критериев. В результате может оказаться, что технические требования на отдельные параметры не будут выполнены и цель оптимизации не будет достигнута.


Стратегия мультипликативной компенсации противоречий критериев

В аддитивной целевой функции вида (10) осуществляется компенсация абсолютных значений нормированных критериев. Другим путем компенсации противоречий является использование принципа компенсации относительных значений критериев. Он формулируется следующим образом: суммарный уровень относительного снижения значений одних критериев не должен превышать суммарного уровня относительного увеличения других –

.

Этот принцип приводит к мультипликативной компенсации противоречий критериев. Мультипликативная целевая функция может применяться в тех случаях, когда отсутствуют условия работоспособности, накладывающие ограничения на предельно допустимые отклонения параметров от заданных значений, и когда выходные параметры не могут принимать нулевые значения. Целевая функция при этом имеет вид –

.

Математическая формулировка задачи оптимизации в этом случае будет иметь вид:

(12)

Данная стратегия имеет тот же недостаток, что и аддитивная компенсация противоречий, то есть улучшение одних критериев достигается за счет бесконтрольного ухудшения других.


Максиминная стратегия

Данная стратегия решения многокритериальных задач оптимизации нацелена на максимальное удовлетворение технических требований, предъявляемых к системе. В ее основе лежит идея равномерности, суть которой заключается в выравнивании всех нормированных критериев оптимальности


,

где В – некоторое вещественное число; - коэффициенты.

Введем количественные оценки степени выполнения технических требований:

или ,

где - значение параметра технического требования, предъявляемого к выходному параметру ; - значение j-го критерия оптимальности, вычисляемое на каждом шаге процесса оптимизации ; - интервал допустимого изменения j-го критерия.

Все условия работоспособности системы приводятся к единому виду - .

Значения подлежат максимизации, причем в первую очередь те из них, которые оказываются наименьшими. Математическая формулировка задачи оптимизации будет иметь вид:

(13)

Для учета значимости выходных параметров могут вводиться коэффициенты штрафа . Тогда вычисление целевой функции осуществляется по формуле - .


В качестве могут быть использованы разности максимального и минимального значений j-го выходного параметра, полученные путем анализа уравнения регрессии в пределах интервалов варьирования факторов или заданные технические требования на отклонение выходных параметров от нормативных значений.

При использовании максиминной стратегии влияние на целевую функцию оказывает лишь тот критерий, который в данной точке пространства управляемых параметров является наихудшим с позиции выполнения заданных технических требований. В результате происходит выравнивание оценок степени выполнения технических требований . В этом ее существенное преимущество перед другими стратегиями.

В тех точках пространства управляемых параметров, где происходит смена критерия и в целевой функции заменяется на , целевая функция не дифференцируема. Данная особенность изменения целевой функции требует применения особых алгоритмов оптимизации.

Если условия работоспособности системы привести к виду - , то оптимизационная задача будет задачей минимакса –

.

Рассмотренные способы формирования целевой функции могут применяться как при детерминированных, так и при статистических критериях (вид которых в свою очередь определяется видом используемой математической модели исследуемой системы). Преимущество статистических критериев заключается в повышении надежности объекта, так как при этом в большей мере учитывается изменчивость различных факторов.



Выбор управляемых параметров осуществляется на основе анализа чувствительности целевой функции к варьированию значений внутренних параметров. Указанный анализ заключается в определении вектора чувствительности , элементами которого являются абсолютные коэффициенты влияния - или вектора чувствительности с относительными коэффициентами влияния - . Чем больше значения коэффициентов Аi и Bi, тем сильнее влияние параметра на целевую функцию .

Универсальным и простым методом анализа чувствительности является метод приращений. Он основан на разложении целевой функции в окрестностях точки в линейный ряд Тейлора и принятии допущения о не влиянии на ее значение всех параметров, кроме исследуемого:



.

Однако при сложном рельефе поверхности отклика возникает необходимость определения коэффициентов во всей допустимой области управляемых параметров, так как в разных ее точках один и тот же управляемый параметр может оказывать существенно разное влияние. В этом случае применение метода приращений с одной стороны требует больших затрат машинного времени, а с другой стороны не гарантирует высокой точности оценки влияния параметров на целевую функцию в следствие ограниченности рассчитываемых точек и субъективности их выбора.


Анализ чувствительности можно также выполнить на основе регрессионного метода. Для этого строят линейную регрессионную модель системы на основе планирования эксперимента в области допустимых значений управляемых параметров. Регрессионная модель в этом случае имеет вид –

,

где - j-й критерий оптимальности; - коэффициенты регрессии, которые имеют смысл абсолютных коэффициентов влияния на . Если разделить на , то получим коэффициенты относительного влияния.

Регрессионный метод анализа чувствительности позволяет получить интегральную оценку влияния управляемых параметров на целевую функцию, то есть во всей области их допустимых значений. В большинстве случаев этого достаточно для выбора управляемых параметров. В то же время регрессионная модель не отражает истинный характер изменения поверхности отклика в каждой точке пространства и поэтому не может быть использована для выявления локальных экстремумов.

Необходимость нормирования управляемых параметров обусловлена тем, что оптимизируемые параметры характеризуют различные свойства системы и могут иметь существенно разные численные значений, что осложняет выбор величины шагов в их пространстве и снижает эффективность алгоритма поиска экстремума целевой функции. Данная операция осуществляется по аналогии с нормированием значений факторов при разработке регрессионных моделей.