Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.10.2024
Просмотров: 100
Скачиваний: 0
1 а
+1
\
2 t, сек.
V/1 ^
-i-:r.-.=h-
Рпс. 1. Фазовый портрет
О б ъ я с н е н и я в тексте
|
2 |
(,оек. |
|
— J J L J |
|
Рис. 2. |
Фазовый портрот |
|
О б ъ я с н е н и я в тексте |
|
|
Графики U(t) |
и фазовый портрет для этих задач приведены |
соот |
ветственно на рис. 1 и 2. |
|
Преимущественной областью применения динамического про граммирования являются дискретные, нелинейные и стохасти ческие системы.
Однако в настоящее время трудами советских ученых развито применение принципа максимума к стохастическим (Стратонович, 1966; Хазен, 1968; Фельдбаум, 1963; Шапиро, 1968), нелинейным
(Болтянский, |
1969) и |
дискретным (Пропой, |
1972) |
системам. |
|
||||||
|
|
|
|
|
Л И Т Е Р А Т У Р А |
|
|
|
|
|
|
Беллман |
Р. |
Динамическое |
программирование. М., |
ИЛ, |
1960. |
|
М., |
||||
Болтянский, |
В. Г. Математические методы оптимального |
управления. |
|||||||||
«Наука», |
1969. |
|
|
|
|
|
|
|
|
||
Гродинз |
Ф. |
Теория |
регулирования и |
биологические |
системы. М., |
«Мир», |
|||||
1966. |
|
|
|
|
|
|
|
|
|
|
|
Понтрягин |
Л. |
С, |
Гамкрелидзе Р. В., |
Болтянский |
В. |
Г., |
Мищенко |
Е. |
Ф. |
||
Математическая |
теория оптимальных процессов. М., |
Физматгиз, |
1961. |
Пропой А. И. О задачах дискретного управления с фазовыми ограничения ми.— Ж. вычислит, математики и математической физ., 1972, № 4.
32
Стратонавт Р. Условные |
марковские |
процессы и их применение к теории |
|||||||||
оптимального управления. Изд-во |
МГУ, 1966. |
|
|
||||||||
Фельдбаум |
А. А. |
Основы |
теории |
оптимальных |
автоматических |
систем. М., |
|||||
Фызматгпз, |
1963. |
|
|
|
|
|
|
|
|
|
|
Хазеп 9. М. Методы |
оптимальных |
статистических |
решений |
и задачи опти |
|||||||
мального управления. М., «Сов. радио», |
1968. |
|
|
||||||||
Шапиро Д. И. Об одном итерационном |
методе |
оптимального |
управления.— |
||||||||
Труды Всес. заочи. энергетич. ин-та.— |
Автоматика н |
телемеханика, |
|||||||||
1966, |
31. |
|
|
|
|
|
|
|
|
|
|
Шапиро Д. И. Об одной |
стохастической |
задаче |
оптимального |
синтеза.— |
|||||||
Труды |
IV Всес. |
совещ. по автомат, |
упр. Тбилиси, 1968. |
|
Глава 1-3 ТЕОРИЯ ИГР
Теория игр есть теория математических моделей принятия оп тимальных решений в условиях конфликтов или неопределенно сти (Воробьев, 1968).
В соответствии с приведенной формулировкой основным объ ектом изучения теории игр являются модели принятия оптималь ных решений в условиях конфликта. Подобные модели назы ваются играми (Фон Нейман, Моргенштерн, 1970).
Введем некоторые определения. Стороны, участвующие в кон фликте и принимающие решение, называются коалициями дей
ствия; |
|
|
|
|
Множество подобных коалиций — Rg. |
|
|||
Возможность каждой из К ЕВ Rg |
коалиций действия назы |
|||
ваются стратегиями. Множество |
всех |
стратегий — SK- |
||
Стороны, отстаивающие общие интересы, есть коалиции инте |
||||
ресов. |
|
|
|
|
Множество подобных коалиций — Ru. |
|
|||
Система, обозначающая правила-игры, —Г. |
|
|||
Отношение предпочтения для каждой коалиции > |
к характе |
|||
ризует в определенной ситуации цели участников конфликта. |
||||
Учитывая изложенное, игра формально может быть определена |
||||
следующим образом. |
|
|
|
|
Игрой |
называется система |
|
|
|
|
г = <і?а, {SK}KERA, |
s , |
Ru,{>K}KeRu>, |
|
где Rg, Ru, |
S к {К ЕЕ Rg)— произвольные множества; S |
акеіідП8к, |
||
^>к {К ЕЕ. Ru) — произвольные |
бинарные отношения |
на S. Это |
выражение формально характеризует все элементы коалиции, их возможности, правила игры и цели игры.
2 А. Р. Шахиович |
33 |
Очевидно, что наиболее характерным признаком игры является множественность коалиции интересов. Если это множество пусто, то его игровая сущность вырождается. Исследование тогда про изводится иными математическими методами.
В основу классификации игровых задач могут быть положены различные признаки:
— множественность или единственность коалиций действия;
—тип моделей, характеризующий взаимосвязи (вероятностнологические модели, дифференциальные модели, графы); '
—цели игры («уничтожение противника» или нахождение ком промисса) и т. д.
Достаточно полной классификации игр в настоящее время еще не существует. Пусть і?а и Ru — семейства подмножеств некоторого множества / , элементы которого называются игроками. Можно считать, что всякое подмножество коалиции действия само яв ляется коалицией действия. Практически это предположение ни как не умаляет общности рассмотрений.
Пусть каждому игроку і ЕЕ / поставлено в соответствие мно жество ST (множество индивидуальных стратегий игрока і). По ложим для каждого К ЕЕ і?э
|
S к |
= П |
Si |
|
|
|
|
|
|
|
|
І6К |
|
|
|
|
|
и |
|
|
|
|
|
|
|
|
|
S ЕЕ П Si. |
|
|
|
|
|||
Здесь S не задано явно в виде подмножества Л S к. Но всякая си- |
||||||||
|
|
|
|
|
|
деі?а |
|
|
туация S, понимаемая как элемент Д £ ; , определяет (в виде своих |
||||||||
|
|
|
|
іег |
|
|
|
|
проекций на множества вида nSt) |
коалиционные стратегии каждой |
|||||||
из коалиций действия К. Набор же всех таких S к {К ЕЕ Rd) |
есте |
|||||||
ственно понимать как элемент Л S к. |
|
|
|
|
|
|||
Введем, наконец, для каждого К |
ЕЕ Ru |
на множестве всех |
си |
|||||
туаций S принимающую вещественные |
значения функцию Лк |
(эта |
||||||
функция Лк называется функцией |
выигрыша коалиции |
интере |
||||||
сов К). Будем считать, что S1 |
]> |
KS2 |
для К |
ЕЕ Rd, если Лк |
(SJ ^> |
|||
> # * ( £ а ) . |
игры можно |
|
назвать |
коалиционными |
играми |
|||
Полученные |
|
|||||||
с запрещенными ситуациями. |
Пусть Г — бескоалиционная |
игра |
||||||
с запрещенными ситуациями (7?э — Ru |
= |
Л- Введем в рассмотре |
||||||
ние множества |
X, элементы которого будем называть позициями, |
и множество Т, элементы которого обычно можно интерпретиро вать как моменты времени, и фиксируем отображение
f:S->2TxX
34
(т. е. / ставит в соответствие каждой ситуации игры функцию, за данную за Т со значениями в X). /-образы ситуаций называются партиями, и на каждой партии fs (где s Œ S) задаются численные выигрыши hi (/s ) каждого из игроков і еЕ / . Так, заданные вы игрыши определяют функцию выигрыша игроков:
Ht (s) = hi (f.).
Конкретизированную описанным образом бескоалиционную игру
можно назвать общей позиционной игрой. |
|
||||
Пусть |
Г — общая |
позиционная игра |
в смысле предыдущего |
||
примера, |
X — конечномерное евклидово |
пространство с |
элемен |
||
тами X, |
Т — множество |
вещественных |
чисел, а cp: S |
X X X |
|
X Т ->• X. Будем считать, что S состоит из всех ситуаций а, для |
|||||
которых система дифференциальных уравнений |
|
||||
(это равенство понимается как векторное) |
имеет при данных на |
||||
чальных |
условиях (х0, |
t0) |
единственное решение. Тогда |
каждая |
ситуация определяет некоторую партию, которую в данном случае принято называть траекторией. Определяемые через ср траектории /s: Т ->- X оказываются однозначными функциями.
Так, определенная игра Г называется дифференциальной иг рой. Задача теории дифференциальных игр может быть сформули рована следующим образом (Айзеке, 1967).
В некотором векторном пространстве задано дифференциальное
уравнение |
|
|
dz |
. |
. |
dt |
=<P(z,u,v), |
правая часть которого зависит от двух управляющих параметров и ж v. Кроме того, в пространстве R задано многообразие M про извольной размерности.
Игра состоит в том, что определенным образом задается изме нение во времени управляющего параметра ѵ, а значения управ ляющего параметра и выбираются так, чтобы некоторый функцио нал (в теории игр называемый платой)
J=\G{z,u,v)-dt+R{T)
о
принимал экстремальное значение. Игра считается законченной, когда
z e M .
Динамика игры рассматривается в фазовом пространстве коор динат (см. главу 1-2). Вид функционала определяется конкретной задачей. Большинство практических случаев охватывается двумя
2* 35
типами функционалов: при G "= 0 игра имеет терминальную пла
ту, при |
R = 0 игра |
имеет интегральную плату. |
Вообще |
G (z, и, ѵ) |
характеризует |
требование к динамике, a R (Т) |
харак |
теризует состояние в конечный момент. Наиболее распространен ным классом дифференциальных игр являются игры преследо вания, т. е. перехваты одного управляемого объекта другим
(Красовский, 1970). Одним из основных |
положений теории игр |
|||||||
является теорема фон Неймана о минимаксе. |
|
|
|
|||||
Применительно к теории дифференциальных игр она может |
||||||||
быть записана |
в виде |
|
|
|
|
|
|
|
|
max |
min / (и, |
ѵ) — min max / |
(и, v) = |
/0. |
|
|
|
|
Ii |
и |
|
v u |
|
|
|
|
Здесь / 0 |
— цена платы |
или, иначе, / (и, ѵ*) <І / 0 |
= / |
(и*, ѵ*) |
||||
scC / (u*, v), где и*, v* — стратегии, характеризующие |
седловую |
|||||||
точку. |
Выбор |
решения в каждом возможном положении |
состоит |
|||||
в определении |
каждым |
игроком своего |
управления |
в |
функции |
|||
фазовых координат и* |
(х) или ѵ* (х). |
|
|
|
|
|||
С помощью |
теории |
дифференциальных игр решаются |
опреде |
|||||
ленные задачи из области военного дела, экономики и др. |
|
|||||||
В данном разделе монографии для'нас представляет |
больший |
|||||||
интерес методическая, |
а не прикладная |
сторона. |
|
|
|
|||
Рассмотрим |
возможность исследования системы |
управления |
с помощью теории дифференциальных игр. Впервые на это указал Я . 3. Цыпкин (1968).
Система управления:
+ |
x (t) = |
«(*); x(Q) = x0. |
Определим управление |
u*(t), |
минимизирующее функционал |
J(u(t),x0)=\\l-x(t)\dt.
о
Ограничения на управление
0 < и ( * ) < 1 ,
т
\о и (t) dt = T1.
Для перехода к игровой задаче введем очевидное тождество
|
11 — x J = max w(l |
— x), |
тогда |
| « М < 1 , |
|
|
т |
|
т |
|
|
min ^ 11 |
— x [t) I dt — min max |
\w(l—x(t))dt, |
ц о |
36