Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.10.2024

Просмотров: 100

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1 а

+1

\

2 t, сек.

V/1 ^

-i-:r.-.=h-

Рпс. 1. Фазовый портрет

О б ъ я с н е н и я в тексте

 

2

(,оек.

 

— J J L J

 

Рис. 2.

Фазовый портрот

 

О б ъ я с н е н и я в тексте

 

Графики U(t)

и фазовый портрет для этих задач приведены

соот­

ветственно на рис. 1 и 2.

 

Преимущественной областью применения динамического про­ граммирования являются дискретные, нелинейные и стохасти­ ческие системы.

Однако в настоящее время трудами советских ученых развито применение принципа максимума к стохастическим (Стратонович, 1966; Хазен, 1968; Фельдбаум, 1963; Шапиро, 1968), нелинейным

(Болтянский,

1969) и

дискретным (Пропой,

1972)

системам.

 

 

 

 

 

 

Л И Т Е Р А Т У Р А

 

 

 

 

 

Беллман

Р.

Динамическое

программирование. М.,

ИЛ,

1960.

 

М.,

Болтянский,

В. Г. Математические методы оптимального

управления.

«Наука»,

1969.

 

 

 

 

 

 

 

 

Гродинз

Ф.

Теория

регулирования и

биологические

системы. М.,

«Мир»,

1966.

 

 

 

 

 

 

 

 

 

 

 

Понтрягин

Л.

С,

Гамкрелидзе Р. В.,

Болтянский

В.

Г.,

Мищенко

Е.

Ф.

Математическая

теория оптимальных процессов. М.,

Физматгиз,

1961.

Пропой А. И. О задачах дискретного управления с фазовыми ограничения­ ми.— Ж. вычислит, математики и математической физ., 1972, № 4.

32


Стратонавт Р. Условные

марковские

процессы и их применение к теории

оптимального управления. Изд-во

МГУ, 1966.

 

 

Фельдбаум

А. А.

Основы

теории

оптимальных

автоматических

систем. М.,

Фызматгпз,

1963.

 

 

 

 

 

 

 

 

 

Хазеп 9. М. Методы

оптимальных

статистических

решений

и задачи опти­

мального управления. М., «Сов. радио»,

1968.

 

 

Шапиро Д. И. Об одном итерационном

методе

оптимального

управления.—

Труды Всес. заочи. энергетич. ин-та.—

Автоматика н

телемеханика,

1966,

31.

 

 

 

 

 

 

 

 

 

 

Шапиро Д. И. Об одной

стохастической

задаче

оптимального

синтеза.—

Труды

IV Всес.

совещ. по автомат,

упр. Тбилиси, 1968.

 

Глава 1-3 ТЕОРИЯ ИГР

Теория игр есть теория математических моделей принятия оп­ тимальных решений в условиях конфликтов или неопределенно­ сти (Воробьев, 1968).

В соответствии с приведенной формулировкой основным объ­ ектом изучения теории игр являются модели принятия оптималь­ ных решений в условиях конфликта. Подобные модели назы­ ваются играми (Фон Нейман, Моргенштерн, 1970).

Введем некоторые определения. Стороны, участвующие в кон­ фликте и принимающие решение, называются коалициями дей­

ствия;

 

 

 

 

Множество подобных коалиций — Rg.

 

Возможность каждой из К ЕВ Rg

коалиций действия назы­

ваются стратегиями. Множество

всех

стратегий — SK-

Стороны, отстаивающие общие интересы, есть коалиции инте­

ресов.

 

 

 

 

Множество подобных коалиций — Ru.

 

Система, обозначающая правила-игры, —Г.

 

Отношение предпочтения для каждой коалиции >

к характе­

ризует в определенной ситуации цели участников конфликта.

Учитывая изложенное, игра формально может быть определена

следующим образом.

 

 

 

Игрой

называется система

 

 

 

 

г = <і?а, {SK}KERA,

s ,

Ru,{>K}KeRu>,

 

где Rg, Ru,

S к {К ЕЕ Rg)— произвольные множества; S

акеіідП8к,

^>к {К ЕЕ. Ru) — произвольные

бинарные отношения

на S. Это

выражение формально характеризует все элементы коалиции, их возможности, правила игры и цели игры.

2 А. Р. Шахиович

33


Очевидно, что наиболее характерным признаком игры является множественность коалиции интересов. Если это множество пусто, то его игровая сущность вырождается. Исследование тогда про­ изводится иными математическими методами.

В основу классификации игровых задач могут быть положены различные признаки:

— множественность или единственность коалиций действия;

тип моделей, характеризующий взаимосвязи (вероятностнологические модели, дифференциальные модели, графы); '

цели игры («уничтожение противника» или нахождение ком­ промисса) и т. д.

Достаточно полной классификации игр в настоящее время еще не существует. Пусть і?а и Ru — семейства подмножеств некоторого множества / , элементы которого называются игроками. Можно считать, что всякое подмножество коалиции действия само яв­ ляется коалицией действия. Практически это предположение ни­ как не умаляет общности рассмотрений.

Пусть каждому игроку і ЕЕ / поставлено в соответствие мно­ жество ST (множество индивидуальных стратегий игрока і). По­ ложим для каждого К ЕЕ і?э

 

S к

= П

Si

 

 

 

 

 

 

 

І6К

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

S ЕЕ П Si.

 

 

 

 

Здесь S не задано явно в виде подмножества Л S к. Но всякая си-

 

 

 

 

 

 

деі?а

 

 

туация S, понимаемая как элемент Д £ ; , определяет (в виде своих

 

 

 

 

іег

 

 

 

 

проекций на множества вида nSt)

коалиционные стратегии каждой

из коалиций действия К. Набор же всех таких S к {К ЕЕ Rd)

есте

ственно понимать как элемент Л S к.

 

 

 

 

 

Введем, наконец, для каждого К

ЕЕ Ru

на множестве всех

си­

туаций S принимающую вещественные

значения функцию Лк

(эта

функция Лк называется функцией

выигрыша коалиции

интере­

сов К). Будем считать, что S1

]>

KS2

для К

ЕЕ Rd, если Лк

(SJ ^>

> # * ( £ а ) .

игры можно

 

назвать

коалиционными

играми

Полученные

 

с запрещенными ситуациями.

Пусть Г — бескоалиционная

игра

с запрещенными ситуациями (7?э — Ru

=

Л- Введем в рассмотре­

ние множества

X, элементы которого будем называть позициями,

и множество Т, элементы которого обычно можно интерпретиро­ вать как моменты времени, и фиксируем отображение

f:S->2TxX

34


(т. е. / ставит в соответствие каждой ситуации игры функцию, за­ данную за Т со значениями в X). /-образы ситуаций называются партиями, и на каждой партии fs (где s Œ S) задаются численные выигрыши hi (/s ) каждого из игроков і еЕ / . Так, заданные вы­ игрыши определяют функцию выигрыша игроков:

Ht (s) = hi (f.).

Конкретизированную описанным образом бескоалиционную игру

можно назвать общей позиционной игрой.

 

Пусть

Г — общая

позиционная игра

в смысле предыдущего

примера,

X — конечномерное евклидово

пространство с

элемен­

тами X,

Т — множество

вещественных

чисел, а cp: S

X X X

X Т ->• X. Будем считать, что S состоит из всех ситуаций а, для

которых система дифференциальных уравнений

 

(это равенство понимается как векторное)

имеет при данных на­

чальных

условиях 0,

t0)

единственное решение. Тогда

каждая

ситуация определяет некоторую партию, которую в данном случае принято называть траекторией. Определяемые через ср траектории /s: Т ->- X оказываются однозначными функциями.

Так, определенная игра Г называется дифференциальной иг­ рой. Задача теории дифференциальных игр может быть сформули­ рована следующим образом (Айзеке, 1967).

В некотором векторном пространстве задано дифференциальное

уравнение

 

 

dz

.

.

dt

=<P(z,u,v),

правая часть которого зависит от двух управляющих параметров и ж v. Кроме того, в пространстве R задано многообразие M про­ извольной размерности.

Игра состоит в том, что определенным образом задается изме­ нение во времени управляющего параметра ѵ, а значения управ­ ляющего параметра и выбираются так, чтобы некоторый функцио­ нал (в теории игр называемый платой)

J=\G{z,u,v)-dt+R{T)

о

принимал экстремальное значение. Игра считается законченной, когда

z e M .

Динамика игры рассматривается в фазовом пространстве коор­ динат (см. главу 1-2). Вид функционала определяется конкретной задачей. Большинство практических случаев охватывается двумя

2* 35


типами функционалов: при G "= 0 игра имеет терминальную пла­

ту, при

R = 0 игра

имеет интегральную плату.

Вообще

G (z, и, ѵ)

характеризует

требование к динамике, a R (Т)

харак­

теризует состояние в конечный момент. Наиболее распространен­ ным классом дифференциальных игр являются игры преследо­ вания, т. е. перехваты одного управляемого объекта другим

(Красовский, 1970). Одним из основных

положений теории игр

является теорема фон Неймана о минимаксе.

 

 

 

Применительно к теории дифференциальных игр она может

быть записана

в виде

 

 

 

 

 

 

 

max

min / (и,

ѵ) — min max /

(и, v) =

/0.

 

 

 

Ii

и

 

v u

 

 

 

 

Здесь / 0

— цена платы

или, иначе, / (и, ѵ*) <І / 0

= /

(и*, ѵ*)

scC / (u*, v), где и*, v* — стратегии, характеризующие

седловую

точку.

Выбор

решения в каждом возможном положении

состоит

в определении

каждым

игроком своего

управления

в

функции

фазовых координат и*

(х) или ѵ* (х).

 

 

 

 

С помощью

теории

дифференциальных игр решаются

опреде­

ленные задачи из области военного дела, экономики и др.

 

В данном разделе монографии для'нас представляет

больший

интерес методическая,

а не прикладная

сторона.

 

 

 

Рассмотрим

возможность исследования системы

управления

с помощью теории дифференциальных игр. Впервые на это указал Я . 3. Цыпкин (1968).

Система управления:

+

x (t) =

«(*); x(Q) = x0.

Определим управление

u*(t),

минимизирующее функционал

J(u(t),x0)=\\l-x(t)\dt.

о

Ограничения на управление

0 < и ( * ) < 1 ,

т

\о и (t) dt = T1.

Для перехода к игровой задаче введем очевидное тождество

 

11 — x J = max w(l

x),

тогда

| « М < 1 ,

 

 

т

т

 

min ^ 11

— x [t) I dt — min max

\w(lx(t))dt,

ц о

36