Файл: Клемин А.И. Инженерные вероятностные расчеты при проектировании ядерных реакторов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 226
Скачиваний: 1
сти |
в таких |
ситуациях, которые могут |
быть |
классифицированы |
как |
«игры с |
природой». |
|
|
|
Игровая |
задача возникает всякий раз, |
когда |
имеет место кон |
фликтная ситуация, в которой интересы одной стороны сталкива ются с интересами другой. При этом обе стороны своими активны ми действиями стремятся достигнуть как можно большего успе ха для себя и свести к минимуму успех противной стороны. Перед каждой стороной или просто «игроком», естественно, встает вопрос: какими должны быть эти действия, т. е. какой должна быть опта-, мальиая стратегия, дающая возможность получить максимальный выигрыш (минимальный проигрыш).
Для того чтобы разработать алгоритм, позволяющий находить оптимальную стратегию, необходимо схематизировать конфликт ную ситуацию. Для получения такой схемы, которая обычно назы вается просто «игрой», можно активные действия одной стороны обозначить Л;, а действия другой (которые часто представляют со бой конкретные состояния неодушевленных объектов, т. е. при
роды) S}: |
Если известны потери |
Ии |
одной |
стороны |
(выигрыши |
|
другой), |
являющиеся |
результатом |
применения всех |
возможных |
||
пар действий той и |
другой стороны, |
можно |
составить уже зна |
комую нам таблицу потерь (табл. 14.1), или платежную матрицу (см. табл. 13.1).
Т а б л и ц а |
14.1 |
|
Потери для игры / и х я |
St |
s, |
л, |
П |
п |
п 2 а |
Аг |
П,і |
||
А пі |
rimi |
|
П,;і2 |
п 1 п
... п2 „
... П/ЛЛ
Задача теории игр — разработка рекомендаций по выбору оп-' тимального и рационального образа действия каждого из против-, ников. При этом предполагается, что матрица игры (см. табл. 14.1) задана. Ее составление целиком и полностью находится в компетен-' ции специалиста, который ставит и решает конкретную игровую задачу.
Игры классифицируются в зависимости от ряда свойств. Так,'
если число действий сторон конечно и соответственно равно |
тип, |
то игра называется конечной размером т Хп. В противном |
случае |
игра бесконечна. Если выигрыш одной стороны всегда равен проиг-'
рышу другой, то говорят, что игра имеет н у л е в у ю |
с у м м у . ' |
Наиболее разработана теория конечных игр двух сторон |
с нулевой' |
суммой, которые, кстати, наиболее распространены в |
техничес-" |
ких приложениях. |
|
Технические игровые задачи имеют одну существенную особен ность. В самых общих чертах она заключается в следующем. Инже неры, имея дело с материальными объектами, стремятся получить от них максимальную отдачу при минимальных расходах. Но ряд процессов в устройствах и механизмах подчинен случайным за конам. Если бы состояние объекта было известно точно, то выбор действия инженера для получения оптимума не представлял бы трудностей. А так как выбирать решение часто приходится в ус ловиях неопределенности (из-за случайности, неполноты данных об истинном состоянии, настоящем или будущем), выбранное дей ствие может быть далеко не лучшим. Таким образом, стремимся
действовать наиболее правильно, |
а результат не всегда получается |
||
оптимальным — неодушевленные |
объекты (природа) как |
бы про |
|
тивятся, мешают получить больший выигрыш |
(меньшие |
потери). |
|
В связи с этим выбор технических решений при |
неопределенности |
||
называется игрой с природой. |
|
|
|
Подобного рода игры имеют нулевую сумму, так как предпола гается, что выигрываем то, что теряет природа, и наоборот. При таком подходе одной стороной является человек, имеющий набор действий At, а противной стороной — природа (объект) с воз можными состояниями Sj. Причем предполагается, что вероятности этих состояний P{Sj) неизвестны.
Пример. В инструкцию для операторов на АЭС должен быть включен пункт о действиях при внезапном падении расхода через один из каналов реактора (канального типа). Для этого, предполо жим, требуется выбрать оптимальное решение в условиях, когда на пульте управления (в период работы реактора на номинальном уровне мощности) прибор показывает, что расход через некоторый
канал |
Gh |
упал больше, |
чем |
на 50% |
относительно |
номинала Gk- |
||||||
|
В данном случае возможными состояниями Sj объекта могут |
|||||||||||
быть |
следующие: |
|
|
|
|
|
|
|
|
|||
515 2 |
— отказ канала первого типа (пережог за период в несколько |
|||||||||||
минут) — мгновенный |
отказ; |
|
менее 1 ч ) — по |
|||||||||
— отказ |
канала второго |
типа (за |
период не |
|||||||||
53 |
степенный |
отказ; |
|
|
|
|
|
|
||||
— отказ |
датчика |
прибора |
(расходомера); |
|
|
|||||||
5 4 |
— отказ |
показывающего |
прибора. |
|
|
|
||||||
|
В свою очередь, действия операторов могут быть, например, |
|||||||||||
такими: |
|
|
|
|
|
|
|
|
|
|
||
Аг |
— проверка показывающего прибора в течение примерно 15 мин, |
|||||||||||
|
при его исправности экстренное снижение мощности реактора |
|||||||||||
А2 |
на 50%; |
|
|
|
|
|
|
|
|
|
||
— постепенное |
снижение |
мощности |
реактора |
на |
50%; |
|||||||
А3—экстренное |
|
снижение |
мощности |
реактора |
на |
50%; |
||||||
Л 4 |
— экстренная |
остановка |
реактора; |
|
|
|
||||||
А5 |
— никакие |
действия |
не |
предпринимаются. |
|
|
||||||
|
Тщательный |
технико-экономический анализ потерь, связанных |
||||||||||
с остановкой реактора |
(в том числе ложной), с экстренным или по- |
степенным |
снижением его МОЩ |
|
|
|
Т а б л и ц а |
14.2 |
|||||||||
НОСТИ, |
со |
стоимостью |
канала, с |
|
П о т е р и , отн. |
ед. |
|
|
|||||||
последствиями разного типа от |
|
|
|
||||||||||||
|
|
|
Состояние объекта |
/ |
|||||||||||
казов, |
с работой канала в опас |
Действие |
|
||||||||||||
оператора |
|
5 ; |
|
|
|
||||||||||
ном режиме |
|
(50% |
Gk), |
приво |
|
1 |
•s, |
|
1 s< |
||||||
дящей к сокращению его ресурса |
|
• At |
12 |
5 |
5 |
|
0 |
||||||||
и т. д., допустим, |
показал, |
что |
|
|
|||||||||||
|
АІ |
• 12 |
4 |
4 |
|
4 |
|||||||||
потери |
могут |
быть |
оценены ве |
|
А3 |
6 |
5 |
5 |
|
5 |
|||||
личинами, |
|
|
приведенными |
в |
|
АІ |
8 |
4 |
10 |
|
10 |
||||
табл. |
14.2. |
|
|
|
|
|
|
|
Аь |
12 |
13 |
.0 |
|
0 |
|
Каждая конкретная величина |
|
|
|
|
|
|
|
||||||||
потерь |
П г ? |
является |
результа |
|
|
|
|
потери |
по |
||||||
том решения |
|
следующей экономической задачи: какие |
|||||||||||||
несем, |
если |
примем |
решение |
Ait |
а |
объект |
при этом |
будет |
нахо |
||||||
диться |
в состоянии |
Sj? |
Как |
уже |
отмечалось, |
условно считают, |
|||||||||
что |
потери |
П ; ; |
|
для |
противной |
стороны |
(объекта, |
||||||||
природы) |
представляют |
собой выигрыши. |
|
|
|
|
|
||||||||
Итак, |
какое же |
действие |
(стратегия) будет |
оптимальным, |
ка |
кое решение оператору следует принять, какими критериями при выборе решения руководствоваться?
§ 14.2. Критерии выбора оптимальных решений (стратегий)
Минимаксный критерий. Поскольку вероятности состояний объекта pj = P{Sj} неизвестны, то при выборе оптимальной стра тегии можно поступить самым осторожным образом, рассчитывая
.на наихудшее априорное распределение вероятностей pj. Худшим вариантом, очевидно, был бы случай, в котором вместо пассивной природы был бы активный мыслящий противник. Следовательно, наиболее осторожному подходу к выбору оптимальной стратегии будет отвечать использование так называемого принципа мини- макса, который применяется для нахождения стратегий в активной игре двух противников [118—121]. Согласно этому принципу, принимающий решение (рассчитывая на наихудший случай) на : ходит сначала максимально возможные потери при каждом из
своих предполагаемых действий |
At (і = 1, 2 |
т); |
|
|
П 4 = т а х П и , |
|
(14.1) |
||
|
_ |
і |
|
|
а затем выбирает то действие, |
которому соответствует |
минимальное |
||
значение этих максимальных |
потерь |
|
|
|
т і п П і = = т і п т а х П г ї = = с в . |
|
(14.2) |
Противник, будучи осторожным, также рассчитывает на худший случай, т, е. выбирает такую стратегию, при которой его мини мально возможный выигрыш максимален:
т а х т і п П , ; = с н . -. |
3) |
j... І
Итак, минимаксный критерий реализуется следующим образом. Каждый из противников, просматривая свои стратегии по табл. 14.1, записывает наихудший разультат, который он может получить при каждой из них, затем выбирает из этих результатов наилучший (для себя) и принимает соответствующую ему стратегию.
Величина |
св называется |
в е р х н е й ц е н о й |
и г р ы, |
а с„ — |
||
н и ж н е й. |
Если св |
= си |
= v, то говорят, что игра |
имеет |
с е д - |
|
л о в у ю т о ч к у . |
В примере § 14.1 седловую точку |
можно легко |
||||
найти, просматривая |
табл. |
14.2. Но прежде чем |
перейти |
к этой |
процедуре, необходимо вычеркнуть из таблицы потерь дублирую щие стратегии и заведомо невыгодные, над которыми доминируют другие.
Так, если для t'-й и А-й строк платежной матрицы |
выполняется |
неравенство |
|
n u ^ n h ] для всех / = 1, 2, ...,п, |
(14-4) |
то говорят, что строка і доминирует над строкой k и последнюю следует вычеркнуть (стратегию k невыгодно применять, поскольку при ней потерн больше, чем при стратегии і). Иногда говорят, что стратегия k подчинена стратегии і. Аналогично Sr доминирует над Si при
П і г ^ г П а для всех і — 1, 2 , т . |
(14.5) |
В табл. 14.2 S3 доминирует над 5 4 . После вычеркивания столб ца S4 обнаруживаем, что строка А2 доминирует над Аг. В резуль тате вычеркивания строки Аг таблица потерь приобретает вид табл. 14.3.
Т а б л и ц а |
14.3 |
Потери после вычеркивания подчиненных стратегий, отн. ед.
7 |
' |
|
S . |
макс тт . |
|
|
|
|
/ |
У |
|
|
12 |
4 |
4 |
|
12 |
А3 |
6 |
5 |
5 |
6 = |
с в |
А4 |
8 |
4 |
10 |
|
10 |
Аь |
12 |
13 |
0 |
|
13 |
min тт |
6 = с н |
4 |
0 |
— |
В последних столбце и строке таблицы выписаны соответственно максимальные проигрыши (потери) для стратегий Аг и минималь ные выигрыши для стратегий 5у. Выберем из действий А2, А3, А4, Аь то, которому соответствуют минимальные (из максимальных) потери. Таким действием будет А3. То же можно сделать для сос тояний Sj. Если бы природа была игроком, то она выбрала бы свою