ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.03.2024

Просмотров: 59

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

17

x31

= 0,92;

x22

= 0,34;

x32

= 0,66;

x13

=1;

x11 = 0,08;

L = 0,82 + 0,12 0,92 + 0,06 0,66 = 0,97

Следовательно, при выбранной оптимальной схеме лечения относительное число выздоровевших больных максимально и составляет 97%.

x32 x32=-4x31+4,33

1,0

 

 

0,66

F

 

 

ОДР

L’=max

 

 

L’=0

 

 

 

 

x31

 

0,92

1,0

x32=-8x31+0,5

Рис.1.4

2. УПРАВЛЕНИЕ СОСТОЯНИЕМ ОРГАНИЗМА В БИОТЕХНИЧЕСКИХ СИСТЕМАХ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

2.1. Метод динамического программирования

Рассмотрим управляемый процесс, который переводит некоторую систему G

из начального состояния S0 в конечное состояние Sm . При наличии промежуточных состояний такой перевод представляется в виде траектории, состоящей из

18

конкретной последовательности промежуточных состояний (рис.2.1). Если промежуточные состояния могут быть различными, то траектория перевода G из S0

в Sm неоднозначна и зависит от вырабатываемых управляющих воздействий x .

Введя какую-либо целевую функцию W =W (x), зависящую от выбранного управления x , можно сравнивать (по величине W ) траектории друг с другом и ставить задачу об отыскании оптимальной траектории, при которой достигается экстремум W . В зависимости от содержания целевой функции в процессе

оптимизации

ее

стремятся

либо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x')

 

максимизировать, либо минимизировать. Мы

 

 

 

 

 

 

x

'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sm

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

далее будем рассматривать оптимизацию,

S0

 

 

 

 

 

 

 

x''

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x'')

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при которой

W min .

Таким

образом,

 

 

 

 

 

 

 

 

 

 

x*

 

 

 

 

 

 

 

 

 

 

 

 

 

W*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задача

заключается

в

отыскании

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x'''

 

 

 

 

 

 

 

 

 

 

 

 

 

W(x''')

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оптимального управления

x *,

при котором

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

целевая

функция

W достигает

своего

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.2.1

 

минимального значения W * , т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W* = min{W (x)}.

x

Представим себе теперь процесс управления состоящим из конечного числа последовательных шагов. В этом случае траектория перехода G из S0 в Sm будет иметь вид последовательности промежуточных состояний S0 , S1 , S2 ,K, Sm , которая является результатом пошагового управления x , также имеющего вид последовательности x = x1 , x2 ,K, xm . Будет считать, что Si обозначает состояние системы G , а xi - управление на i-м шаге для произвольной траектории. Для конкретной же траектории конкретное управление xi' переводит G в конкретное состояние Si' . Нужно иметь в виду, что управления x1 , x2 ,K, xm в общем случае не числа, а вектора, функции, какие-либо предписания и т.п. Пусть на каждом отдельном i-м шаге, заключающемся в переходе из Si1 в Si , известно значение целевой функции W которое обозначается wi . Считая выбранный критерий W

аддитивным, т.е. полагая, что


19

m

W= wi ,

i=1

задача оптимизации формулируется следующим образом. Требуется найти такое оптимальное управление x* = x1 , x2 ,K, xm (где xi - оптимальное шаговое управление на i-м шаге), при котором целевая функция W принимает минимальное значение, т.е.

 

 

m

 

 

 

 

 

 

 

 

 

 

 

W = wi min .

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

Последовательность оптимальный

шаговых

управлений x , x ,K, x

приводит к

 

 

 

 

 

 

 

1 2

 

 

m

 

оптимальной траектории S

0

, S * , S *

,K, S *

, S

m

перевода G из S

0

в S

m

.

 

 

1 2

 

m1

 

 

 

 

 

Для примера, приведенного на рис.2.2, существует два варианта управлений и две возможных траектории, для каждой из которых можно подсчитать значение целевой функции.

 

 

I вариант

 

II вариант

 

Управление:

x'= x1' , x2' , x3'

, x4

 

x''= x1'' , x2'' , x3'' , x4

 

 

Траектория:

S0 , S1' , S2' , S3 , S4

 

S0 , S1'' , S2'' , S3 , S4

 

 

Целевая функция:

W '= w'

+ w'

+ w'

+ w

W ''= w'' + w''

+ w''

+ w

 

 

4

 

1

2

3

4

1

2

3

 

Пусть W '>W '' ; тогда второй вариант является оптимальным, т.е. x* = x'', W* =W '' .

Поиск

оптимального

управления

x *

 

методом

динамического

 

 

 

S '

 

 

 

 

 

'

w2'

2 w3'

S3

 

 

 

 

S1

 

 

w4

 

 

 

 

 

 

 

S4

 

 

 

 

 

 

 

 

 

w'

 

w''

 

 

 

 

 

1

 

 

 

 

 

 

S0

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2''

 

 

 

 

 

w''

 

w''

 

 

 

 

 

1

 

2

 

 

 

 

S1''

Рис. 2.2


20

программирования основан на использовании общего принципа, известного как принцип оптимальности. Он формулируется так [7]:

Каково бы ни было состояние S системы G в результате какого-то числа шагов, мы должны выбирать управление на ближайшем шаге так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к минимальному значению целевой функции на всех оставшихся шагах, включая данный.

При решении задач динамического программирования полезно пользоваться схемой решения, данной в [6,7]. После выбора способа описания состояний управляемой системы и разбиения всего процесса управления на шаги применяется следующая процедура [7].

1. Перечислить набор шаговых управлений xi для каждого шага и налагаемые на них ограничения.

2. Для каждого i-го шага определить значение wi в функции от состояния Si1

на (i 1)-м шаге и от шагового управления xi

wi = fi (Si1 , xi ).

 

3. Определить, как изменяется состояние Si1 системы G

под влиянием

управления xi на i-м шаге: оно переходит в новое состояние

 

Si i (Si1 , xi )

(2.1)

4. Пусть Wi (Si1 ) - условный оптимум целевой функции, получаемый на всех последующих шагах, начиная с i-го и до конца. Надо записать основное рекуррентное уравнение динамического программирования, выражающее Wi (Si1 )

через уже известную функцию Wi+1 (Si )

 

Wi (Si1 )= min{fi (Si1 , xi )+Wi+1 (ϕi (Si1 , xi ))}.

(2.2)

xi

 

Этому условному оптимуму целевой функции соответствует условное оптимальное управление на i-м шаге xi (Si1 ), которое совместно с оптимальным управлением на всех последующих шагах обращает целевую функцию на всех оставшихся шагах, начиная с данного, в минимум.



21

5. Произвести условную оптимизацию последнего (m-го) шага, задаваясь множеством состояний Sm1 , из которых можно за один шаг дойти до конечного состояния, вычисляя для каждого Sm1 условный оптимум целевой функции по формуле

Wm (Sm1 )= min{fm (Sm1 , xm )}

(2.3)

xm

 

и находя условное оптимальное управление xm (Sm1 ), для которого этот минимум достигается.

6. Произвести условную оптимизацию (m-1)-го, (m-2)-го и т.д. шагов по формуле (2.2), полагая в ней i = (m 1)(, m 2),K, и для каждого из шагов указать условное оптимальное управление xi (Si1 ),при котором достигается минимум.

Так как начальное состояние системы S0 одно и оно известно, то на первом шаге варьировать состояние системы не нужно, оптимальное значение целевой функции для S0 находится непосредственно. Это и есть оптимум функции цели за весь процесс перевода,

W =W1 (S0 ).

7. Произвести безусловную оптимизацию управления, учитывая выработанные ранее рекомендации на каждом шаге. На первом шаге оптимальное шаговое управление x1* = x1 (S0 ). Пользуясь (2.1), находим изменившееся состояние системы S1 , для него определяем оптимальное управление на втором шаге x2 и т.д.

до конца.

2.2. Управление переходом организма из начального в конечное состояние при наличии промежуточных состояний

Управляемый процесс перевода системы G из начального S0 в конечное Sm

состояние можно интерпретировать как процесс лечения, который переводит организм человека из состояния "болен" в состояние "здоров", или процесс нормализации состояния человека-оператора, переводящий организм из состояния "не норма" в состояние "норма". Если при этом реализуется возможность выделения конечного множества состояний организма, являющихся промежуточными между