Файл: Материалы по курсу (часть 1).docx

Скачать файл (7,34Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.03.2024

Просмотров: 43

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.

1) Детерминированный случай

2) Оптимизация решений в условиях неопределенности

2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.

3) Оценка операции по нескольким показателям.

3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.

4) Геометрическая интерпретация озлп.

Анализ положения l относительно одр.

Дадим геометрическую интерпретацию поиска оптимального решения.

Тогда (x1*, x2*, …, xn*) – оптимальное решение

Некоторые выводы

5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.

6) Симплекс-метод решения задачи лп.

7) Табличный алгоритм замены переменных.

8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.

9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.

10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.

11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.

12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.

13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.

14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.

15. Решение игры в смешанных стратегиях.

16. Игры 2х2 и их решение.

17. Геометрическая интерпретация решений игры 2х2.

18. Решение игр 2хn.

19. Решение игр mх2.

20. Решение игр mxn.

3.2. Элементы теории статистических решений

………………

(1)

СТРОКИ ВЫШЕПЕРЕЧИСЛЕННОЙ СИСТЕМЫ ПИШЕТСЯ ПО СТОЛБЦАМ МАТРИЦЫ ИГРЫ

Разделим все получившиеся на положительную величину ???? и введем обозначения

x₁ = p₁/????, x₂ = p₂/????, …, x_m = p_m/????.

Тогда система (1) превращается в следующую

………………

(2)

Так как р₁+р₂+…+p_m=1, то

x₁+x₂+…+x_m=1/????.

Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/???? принимает минимальное значение.

Мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения x₁, x₂, …, x_m, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию

L = x₁+x₂+…+x_m

Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию игрока А.

Нахождение . Оптимальная стратегия находится аналогично. Разница заключается в том, что игрок В стремится не максимизировать, а минимизировать выигрыш, а значить максимизировать величину 1/????. Следовательно, вместо условий (2) должны соблюдаться условия

………………

(3)

где y_j = q_j/ ????, j = 1, 2, …, n.

Требуется так выбрать неотрицательные значения переменных y1, y2, …, yn, чтобы они удовлетворяли условиям (3) и обращали в максимум линейную функцию

L = y₁+ y₂+ … + y_n = 1/????

или, что то же самое, обращали в минимум линейную функцию

L =y₁ y₂ … y_n = 1/????

Таким образом, любая конечная игра nxm сводится к задачам линейного программирования.

Возможно, сюда еще надо будет вписать первую часть (теорию) из пункта 3.2., который идет дальше

3.2. Элементы теории статистических решений

ВОЗМОЖНО, ДЛЯ MxN

Неопределенность в данном случае, это не какой-то разумный и враждебный противник, а природа. Это незаинтересованная сторона, у нее нет сознательных действий. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.

У стороны А имеется m возможных стратегий: А₁, А₂, …, A_m, о природе можно сделать n предположений: S₁, S₂, …, S_n. Последние можно рассматривать как состояния или стратегии природы. Наш выигрыш a_ij при каждой паре стратегий (A_i, S_j) задается матрицей, приведенной в табл.1. Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является наиболее выгодной для него.

A_i	S_j
A_i	S₁	S₂	…	S_n
A₁	a₁₁	a₁₂	…	a_1n
A₂	a₂₁	a₂₂	…	a_2n
…	…	…	…	…
A_m	a_m1	a_m2	…	a_mn

Sj – неизвестные состояния больного организма, а стратегии A_i – возможные планы лечения. Выигрыш a_ij – эффективность лечения, например вероятность выздоровления. В качестве такой вероятности можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.

Учитывая, что состояниями природы мы не управляем, кроме показателя a_ij можно ввести другие, отражающие удачность выбора данной стратегии именно в данной ситуации. К таким показателям относится риск. Риском r_ij игрока А при пользовании стратегии А_i в условиях S_j называется разность выигрышем, который он получил бы, если бы знал условия S_j, и выигрышем, который он получит, не зная их и выбирая стратегию А_i. Следовательно,

_rij= β_j– a_ij

При поиске оптимальной стратегии игрока А в зависимости от выбранного показателя a_ij или r_ij либо максимизируется выигрыш, либо минимизируется риск.

Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск, то этот объединенный показатель f_ij, названный «сочетанным показателем полезности», вычисляется в виде

^fij⁼^aij^–^rij

Чем больше f_ij, тем лучше, т.к. больше выигрыш и меньше риск, поэтому при оптимизации выбора А_i показатель f_ijнужно максимизировать.

Пусть, для примера, больной организм может находится в одном из трех состояний: S₁, S₂, S₃ – а у врача есть три варианта лечения: А₁, А₂, А₃. Применение лечения А_i к больному в состоянии S_j приводит к вероятности выздоровления a_ij. Пусть значения a_ij задаются матрицей M_a в виде таблицы 2.α

Таблица 2

A_i	S_j
A_i	S₁	S₂	S₃
A₁	0,95	0,90	0,85
A₂	0,97	0,92	0,75
A₃	0,99	0,75	0,60

α₁=0,85

α₂=0,75

α₃=0,60

β₁=0,99 β₂=0,75 β₃=0,85

Рассчитаем по этой матрице значения αi приведены справа от соответствующих строк, а значения β_j– под соответствующими столбцами. Матрица M_r получается из матрицы M_a вычитанием на основе соотношения

поэтому M_r имеет виды, представленный в табл.3. Наконец матрица M_f сочетанного показателя полезности fij определяется разностью M_f = M_a – M_rи имеет вид табл.4. Для этой матрицы также рассчитаны нижняя и верхняя цена игры

При нахождении минимальных стратегий игр по полученным матрицам M_a и M_f выполняются соотношения α=β, что говорит о наличии устойчивых чистых стратегий, определяемых седловой точкой. Для обеих матриц это оказалась одной и той же 0,85. В таблицах она определяет пару оптимальных чистых стратегий (А₁, S₃). В общем случае решение находится в области смешанных стратегий.

Наиболее прост для решения случай, когда заранее известны априорные вероятности состояний: P₁=P(S₁), P₂=P(S₂), …, P_n=P(S_n), причем P₁ + P₂ + … + P_n = 1. На практике чаще всего эти вероятности неизвестны. Если они известны, то при использовании показателя aij решение игры находится на основе максимизации среднего значения , где

с учетом вероятностей всех возможных условий, т.е. выбираем такую стратегию А_i, для которой

Очевидно, что при использовании показателя r_ij решение игры находится на основе среднего риска, т.е.

а для показателя f_ij

В теории доказывается, что та же стратегия, которая обращает в максимум средний выигрыш , обращает в минимум и средний риск . Там же показано, что при использовании вероятностей состояний применение смешанных стратегий для А не дает ему дополнительных преимуществ, поэтому можно обойтись чистыми стратегиями.

Смотрите также файлы

Методичка.pdf

Табличный алгоритм.pdf

КР (вариант 5).pdf

IOOD_Lab.pdf

ODZ_TEOR_VER.docx

Файл: Материалы по курсу (часть 1).docx

3.2. Элементы теории статистических решений

Смотрите также файлы

Информация

Списки файлов

Дополнительно