Файл: Материалы по курсу (часть 1).docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.03.2024

Просмотров: 43

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.

1) Детерминированный случай

2) Оптимизация решений в условиях неопределенности

2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.

3) Оценка операции по нескольким показателям.

3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.

4) Геометрическая интерпретация озлп.

Анализ положения l относительно одр.

Дадим геометрическую интерпретацию поиска оптимального решения.

Тогда (x1*, x2*, …, xn*) – оптимальное решение

Некоторые выводы

5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.

6) Симплекс-метод решения задачи лп.

7) Табличный алгоритм замены переменных.

8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.

9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.

10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.

11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.

12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.

13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.

14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.

15. Решение игры в смешанных стратегиях.

16. Игры 2х2 и их решение.

17. Геометрическая интерпретация решений игры 2х2.

18. Решение игр 2хn.

19. Решение игр mх2.

20. Решение игр mxn.

3.2. Элементы теории статистических решений

………………

(1)

СТРОКИ ВЫШЕПЕРЕЧИСЛЕННОЙ СИСТЕМЫ ПИШЕТСЯ ПО СТОЛБЦАМ МАТРИЦЫ ИГРЫ

Разделим все получившиеся на положительную величину ???? и введем обозначения

x1 = p1/????, x2 = p2/????, …, xm = pm/????.

Тогда система (1) превращается в следующую

………………

(2)

Так как р12+…+pm=1, то

x1+x2+…+xm=1/????.

Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/???? принимает минимальное значение.

Мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения x1, x2, …, xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию

L = x1+x2+…+xm

Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию игрока А.

Нахождение . Оптимальная стратегия находится аналогично. Разница заключается в том, что игрок В стремится не максимизировать, а минимизировать выигрыш, а значить максимизировать величину 1/????. Следовательно, вместо условий (2) должны соблюдаться условия

………………

(3)

где yj = qj/ ????, j = 1, 2, …, n.

Требуется так выбрать неотрицательные значения переменных y1, y2, …, yn, чтобы они удовлетворяли условиям (3) и обращали в максимум линейную функцию

L = y1 + y2 + … + yn = 1/????

или, что то же самое, обращали в минимум линейную функцию


L =y1 y2 yn = 1/????

Таким образом, любая конечная игра nxm сводится к задачам линейного программирования.

Возможно, сюда еще надо будет вписать первую часть (теорию) из пункта 3.2., который идет дальше


3.2. Элементы теории статистических решений

ВОЗМОЖНО, ДЛЯ MxN

Неопределенность в данном случае, это не какой-то разумный и враждебный противник, а природа. Это незаинтересованная сторона, у нее нет сознательных действий. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.

У стороны А имеется m возможных стратегий: А1, А2, …, Am, о природе можно сделать n предположений: S1, S2, …, Sn. Последние можно рассматривать как состояния или стратегии природы. Наш выигрыш aij при каждой паре стратегий (Ai, Sj) задается матрицей, приведенной в табл.1. Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является наиболее выгодной для него.

Ai

Sj

S1

S2

Sn

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

Sj – неизвестные состояния больного организма, а стратегии Ai – возможные планы лечения. Выигрыш aij – эффективность лечения, например вероятность выздоровления. В качестве такой вероятности можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.

Учитывая, что состояниями природы мы не управляем, кроме показателя aij можно ввести другие, отражающие удачность выбора данной стратегии именно в данной ситуации. К таким показателям относится риск. Риском rij игрока А при пользовании стратегии Аi в условиях Sj называется разность выигрышем, который он получил бы, если бы знал условия Sj, и выигрышем, который он получит, не зная их и выбирая стратегию Аi. Следовательно,


rij = βj aij

При поиске оптимальной стратегии игрока А в зависимости от выбранного показателя aij или rij либо максимизируется выигрыш, либо минимизируется риск.

Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск, то этот объединенный показатель fij, названный «сочетанным показателем полезности», вычисляется в виде

fij = aijrij

Чем больше fij, тем лучше, т.к. больше выигрыш и меньше риск, поэтому при оптимизации выбора Аi показатель fij нужно максимизировать.

Пусть, для примера, больной организм может находится в одном из трех состояний: S1, S2, S3 – а у врача есть три варианта лечения: А1, А2, А3. Применение лечения Аi к больному в состоянии Sj приводит к вероятности выздоровления aij. Пусть значения aij задаются матрицей Ma в виде таблицы 2.α

Таблица 2

Ai

Sj

S1

S2

S3

A1

0,95

0,90

0,85

A2

0,97

0,92

0,75

A3

0,99

0,75

0,60


α1=0,85

α2=0,75

α3=0,60

β1=0,99 β2=0,75 β3=0,85

Рассчитаем по этой матрице значения αi приведены справа от соответствующих строк, а значения βj – под соответствующими столбцами. Матрица Mr получается из матрицы Ma вычитанием на основе соотношения

поэтому Mr имеет виды, представленный в табл.3. Наконец матрица Mf сочетанного показателя полезности fij определяется разностью Mf = Ma – Mr и имеет вид табл.4. Для этой матрицы также рассчитаны нижняя и верхняя цена игры


При нахождении минимальных стратегий игр по полученным матрицам Ma и Mf выполняются соотношения α=β, что говорит о наличии устойчивых чистых стратегий, определяемых седловой точкой. Для обеих матриц это оказалась одной и той же 0,85. В таблицах она определяет пару оптимальных чистых стратегий (А1, S3). В общем случае решение находится в области смешанных стратегий.

Наиболее прост для решения случай, когда заранее известны априорные вероятности состояний: P1=P(S1), P2=P(S2), …, Pn=P(Sn), причем P1 + P2 + … + Pn = 1. На практике чаще всего эти вероятности неизвестны. Если они известны, то при использовании показателя aij решение игры находится на основе максимизации среднего значения , где

с учетом вероятностей всех возможных условий, т.е. выбираем такую стратегию Аi, для которой

Очевидно, что при использовании показателя rij решение игры находится на основе среднего риска, т.е.

а для показателя fij

В теории доказывается, что та же стратегия, которая обращает в максимум средний выигрыш , обращает в минимум и средний риск . Там же показано, что при использовании вероятностей состояний применение смешанных стратегий для А не дает ему дополнительных преимуществ, поэтому можно обойтись чистыми стратегиями.