Файл: Сирл, С. Матричная алгебра в экономике.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 185

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

где максимизация выполняется отдельно для двух элементов а(1). Для элемента уг (1) имеет место совпадение двух величин, и мы про­ извольно выбираем правило 2 как оптимальное решение. Для элемен­ та v2 (1) правило 1 (ничего не делать) максимизирует выражение. Таким образом, вектор оптимальных решений d (1) имеет вид:

d ( 1) = Ыг (\) 4 (1 )]' = [2 1]'.

(16)

Если следовать вектору оптимальных решений, то уравнение (15) будет таким:

 

 

 

у(1)

' 1,7

'

 

 

 

(17)

 

 

 

°,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь рассмотрим

уравнение

(13)

при

п = 2:

 

о(2) - Мах {?<*> Д Я<*» о (1)} = Max {<?<1) +

Р<1>v (1),

qW +

pw v (1)} =

W

 

 

 

 

 

 

 

 

 

 

= Max.

1,7

0,7

0,3'

1,7

>

1,7'

1

0,7

0,3

1,7'

0,2

0,6

0,4

.0,2

 

п

 

0

0,2

 

.0,1.

 

 

 

 

—Мах |

2,95'

)

2,95

1

 

 

(18)

 

 

 

 

1,30

1,80

Г

 

 

Для элемента v1 (2) снова имеет место совпадение, и мы опять про­ извольно выбираем правило 2 в качестве оптимального решения1. Для элемента о2 (2) оптимальным решением будет правило 2 (всегда ремонтировать машину, если она этого требует). Вектор оптимальных решений для периода 2 имеет вид:

d (2) = Ыг (2) dt (2)]' = [2 2]',

(19)

и если следовать оптимальным решениям в течение обоих периодов,

•то уравнение (19) будет таким:

о(2)

'2,95'

(20)

1,80

 

 

Эта процедура может быть повторена при п = 3, 4, ... до тех пор, пока не будет пройдено нужное количество периодов.

Для п — 3

v (3) = Мах {д(/г) -|- Р</г) v (2)} =

 

 

{h}

 

 

 

 

 

 

 

Мах "1,7'

1

"0,7

0,3

2,95

'

1,7

0,7

0,3"

"2,95"

0,2.

0,6

0,4

1,80

)

.0,1

+ 1

0

1,80

 

 

 

'4,305

5

"4,305"

4,305'

 

(21)

 

 

 

2,69

3,05

Г

3,05

 

 

 

 

 

 

 

1 Для первого элемента v(n) всегда будет иметь место совпадение, поскольку оба решающих правила идентичны для состояния 1 (ничего не делать).

2 1 8


при этом

d (3) = [2 2]'.

Заметим, что если до конца остался лишь один период времени, то неоптимально ремонтировать машину, а если до конца осталось два или три периода, то будет оптимально ее отремонтировать, если она находится в состоянии 2 (требует регулировки)1.

а) ОПТИМАЛЬНЫЕ СТАЦИОНАРНЫЕ СТРАТЕГИИ

Только что рассмотренный метод решения позволяет нам получить оптимальные решающие правила для случая, когда до конца осталось п переходов. Предположим, что мы заинтересованы в прибыльности системы в течение большого срока времени и хотели бы максимизиро­ вать ожидаемое вознаграждение g за период. Эта задача может быть решена повторным применением методов, описанных в параграфе 4, т. е. мы можем взять по очереди все решающие правила, вычислить соответствующие матрицы Р и R, вектор стационарных вероятностей х', вектор ожидаемого вознаграждения за следующий период q и ожи­ даемое стационарное вознаграждение g = x'q. Тогда простое сравне­ ние величин g для различных решающих правил определит оптималь­ ную стационарную стратегию, т. е. то решающее правило, которое максимизирует стационарное ожидаемое вознаграждение,? за период2. Например, стационарной стратегией для примера из предыдущего параграфа, максимизирующей ожидаемое вознаграждение, является «ремонтировать машину, если она этого требует», и ожидаемое вознаг­ раждение равно 1,33 доллара за период (см. упражнение 13).

б) ОПТИМАЛЬНЫЕ СТРАТЕГИИ С ДИСКОНТОМ

Во многих проблемах экономики при рассмотрении денежных потоков в различные моменты времени следует принимать во внима­ ние изменение стоимости денег с течением времени. По этой причине было бы весьма желательным иметь возможность дисконтирования будущих доходов; ктомуже привлечение соображений, связанных сдисконтированием, к нашей проблеме выбора решения приведет к тому, что полученная оптимальная стратегия будет быстрее сходиться к опти­ мальной стационарной стратегии при п, стремящемся к бесконечности.

Дисконтирование непосредственно дополняет рассмотренную на-

ми схему; пусть а = ^ 1 ^ — дисконтный множитель, соответствую­

1Общее применение рекурсивной оптимизации, которую мы только что опи­ сали, называется динамическим программированием. Для предварительного ознакомления см. [3], а для более полного изучения см. [1] или [2 ].

Существуют другие методы, которые обеспечивают систематический поиск оптимальной стационарной стратегии без анализа всех возможностей, см. [5].

2 1 9



щий процентной ставке г за период. Тогда уравнение (13) принимает вид:

v (п) —Max {q(k) +

v (п— 1)},

(22)

 

 

далее — рассмотрение аналогично предыдущему.

Упражнения

1. Две машины А и В сдаются в аренду по одной и той же цене. Эти машин имеют следующие различные матрицы вероятностей перехода, соответствующих состояниям «работает хорошо» (состояние I) и «требует регулировки» (со­ стояние 2):

машина А машина В

 

РА

0,9

0 , Г

Рв =

"0,8

0,2'

 

 

 

0 ,6

0,4

0,7

0,3

 

 

 

 

 

 

 

Определите стационарные вероятности для обеих машин.

Какую из машин

стоит арендовать?

 

определила,

что вероятность ветреной погоды после

2.

Лыжная база АВС

ясного

дня равна 0,3, а вероятность хорошей погоды после ветреного дня равна

0,8. Выпишите матрицу вероятностей

перехода. Каковы стационарные вероят­

ности ясных и ветреных дней?

 

 

 

 

 

3.

Компания ACME по прокату автомобилей выдает автомобили напрокат

в трех аэропортах:

А, В и С. Клиенты возвращают автомобили в эти аэропорты

в соответствии с таблицей вероятностей:

 

 

 

 

 

Таблица переходных вероятностейз

 

 

 

 

Куда

А

В

 

С

 

 

 

Откуда

 

 

 

 

 

 

 

 

А

 

0 , 8

0 , 2

 

0

 

 

 

В

 

0 , 2

0

 

0 , 8

 

 

 

С

 

0 , 2

0 , 2

 

0 , 6

 

 

 

 

 

 

 

 

 

 

з

 

а)

Вычислите вектор х ', удовлетворяющий равенствам х'

= х Р и 1=1

= 1.

Представляет ли этот вектор стационарные вероятности? Объясните ответ.

одном

б)

Компания

ACME

планирует построить ремонтную

станцию в

--из трех аэропортов. Какой из них вы порекомендовали бы для этой цели? По­ чему?

4.Рассмотрите матрицу вероятностей перехода для двух состояний,

заданную в общем виде:

p J P ii Р» .

21 Р22_

Определитеэлементы вектора стационарных вероятностей х' = [kj, п21 через элементы Р. (Напоминаем, что сумма элементов любой строки равна 1.)

5. Поведение рынка ценных бумаг обнаруживает следующую тенденцию: сделки, в которых изменение цен направлено в одну сторону, сменяются сдел­ ками, в которых это изменение направлено в другую сторону. Предположим, что условная вероятность возрастания цен после предшествовавшего периода

220


их падения равна 0,75, и также наоборот. Определите соответствующие состоя­

ния и выпишите матрицу вероятностей

перехода для этой системы. Каковы

стационарные вероятности?

 

 

6 . Рассмотрите марковскую цепь со следующей матрицей переходов:

0,7

0,3

0

Р = 0,8

0,2

0

0

0,2

0,8

а)

Если процесс начинается с состояния 1 и произошло уже много перехо­

дов, то какая доля этих переходов приходится на переходы из состояния 1 в сос­

тояние 2? (Указание.

Предварительно

 

вычислите стационарные вероятности).

б) Повторите задание а в предположении,

что процесс начинается с сос­

тояния

3.

 

 

 

 

 

если он находится в городе

1, то с ве­

7. Водитель такси обнаружил, что

 

роятностью 0 ,8 он повезет следующего пассажира в город 2 , в остальных слу­

чаях будет поездка по городу

1. Если же он находится в городе

2, то с вероят­

ностью 0,4 он повезет следующего пассажира в город 1, в остальных случаях

будет поездка по городу 2. Средний

доход от

каждого вида поездок таков:

между городами — 2

доллара (в любом направлении), внутри любого города —

1 доллар.

 

 

 

 

 

вероятностей

 

Р и матрицу

вознаграж­

а) Выпишите матрицу переходных

 

 

дений R

и вычислите стационарные вероятности пребывания в каждом городе.

б) Вычислите вектор ожидаемого

вознаграждения в ближайший переход.

в) Вычислите стационарное ожидаемое вознаграждение за период.

8 .

Сирт, Дэвидсон и Томпсон в работе [4] с помощью марковских цепей опи­

сали

поведение лиц,

пользующихся

кредитом

и переходящих

из состояния

«уплачено» в такие состояния, как «задолженность один месяц», «задолженность

два месяца», «задолженность три и более месяцев».

Рассмотрите

следующие

три состояния и соответствующие переходные вероятности и вознаграждения

для упрощенного варианта их модели:

 

 

 

 

 

 

 

состояние

1 — уплачено;

 

один

месяц;

 

 

 

 

 

состояние

2 — задолженность

 

 

 

 

 

состояние

3 — задолженность два и более месяцев;

 

 

 

 

 

 

' 0 ,8

0 ,2

0

 

"10

5

0

 

 

 

 

 

 

0,5

0

0,5

,

=

10

5

0

 

 

 

 

 

 

0,3

0

0,7

 

 

10

5

0

 

 

Предположите, что в некотором магазине 1000 лиц пользуются кредитом. Подсчитайте стационарное ожидаемое вознаграждение за период.

9. Некоторый производитель кофе анализирует возможность проведения рекламной кампании, направленной на привлечение покупателей к его сорту кофе. Из данных, полученных при исследовании рынка, ему удалось оценить нынешние вероятности того, что покупатели сменят «наш сорт» на «какой-либо другой», и наоборот. Обе вероятности равны 0,2. Исследователи рынка, исходя из предположения о неизменности рекламы конкурента, предварительно оцени­ вают результаты кампании следующим образом: единственным изменением вероятностей будет возрастание с 0,2 до 0,3 вероятности смены «какого-либо сорта» на «наш сорт».

а) Предположите, что проведение рекламной кампании стоит 70 миллионов долларов (нынешняя оценка всех будущих затрат) и что на рынке 50 миллионов покупателей кофе. Каждый покупатель в среднем приносит 2 доллара прибыли (рассчитываемой до уплаты налогов). Если учетная ставка равна 20% в год, то следует ли производителю проводить рекламную кампанию? (Предположите, что стационарность наступает очень быстро.) (Указание. Матрица вознагражде­ ний не нужна; работайте непосредственно со стационарными вероятностями.)

221