Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 690

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

684

Глава 9

Временной интервал между измерениями, с

О

0,1

0,2

0,3

0,4

Временной

интервал между измерениями^

Ф и г . П . 9 . 4 . l e . Изменение

ошибки измерений

в зависимости от интервала

оценивания

(неустойчивая

модель).

Обозначения

см. на фиг. П.9.4.ІД.

а ненаблюдаемая ошибка вводится следующим образом:

Y (t) = h (t) y (t)

+

8 (t).

Затем предполагается, что элементы матриц г (t) и x (t) являются случайными величинами (X (t) — случайный входной сигнал)

Оценивание параметров

обыкновенных

дифференциальных

уравнений 685

с ковариационной

матрицей

 

 

 

 

 

Х

<х (т)гГ(т>)

QT (<)S(0

Ô ( * - T ) ,

 

*{[ет]

Г

 

ЬS (t)Tlt)

 

 

 

где ô (t) — дельта-функция Дирака.

 

 

 

Уравнения для оценивания

у (t) впервые были выведены Кал-

маном [16]:

 

 

 

 

 

 

 

 

• ^ Г =f О У (0 +к

[Y (0-h (t) у (01,

 

(9.4.21)

где

 

 

 

 

 

1

 

 

K(*) = [Q(*)

 

 

 

 

 

Ковариационная матрица й (^) для у (г!) при заданном

значении

Y (t) вычисляется

из матричного уравнения Риккати

(аргумент t

опущен) :

 

 

^(«J + g^SWir- (О-

 

 

Ю + Qfr + gQgr_(fihT

+ gS) r-4Srg^ + hQ),

(9.4.22)

Й (0) = Q0.

Если матрица Й0 вырождена, уравнения остаются справедливыми. Однако, если вырождена матрица Г, необходимо внести изменения (см. литературу в конце этой главы).

9 . 5 . М Е Т О Д К В А З И Л И Н Е А Р И З А Ц И И В С О Ч Е Т А Н И И С М Е Т О Д О М Н А И М Е Н Ь Ш И Х К В А Д Р А Т О В

Метод квазилинеаризации в сущности представляет собой неко­ торый способ решения нелинейных (по зависимой переменной) дифференциальных уравнений либо в моделях с начальными зна­ чениями, либо в моделях, в которых выделены граничные условия. Последняя модель в разд. 9.1 называлась моделью с граничным значением. Квазилинеаризация применительно к оцениванию пара­ метров является испытанной стратегией, которую можно сочетать с любым критерием оптимального оценивания, хотя обычно она используется с методом наименьших квадратов.

В качестве введения к методу квазилинеаризации рассмотрим задачу нахождения решения системы детерминированных уравне­ ний:

ft

Уг, • • -, Уѵ) = 0, і = 1, 2, . . ., v.

(9.5.1)

В матричных обозначениях эти уравнения записываются в виде

f(y) = 0.

(9.5.2)

Левую часть уравнения (9.5.2) можно разложить в ряд Тейлора относительно некоторого начального приближения у( 0 > следующим


686

 

 

Глава 9

 

 

 

образом:

 

 

 

 

 

 

 

 

f ( y ) ^ f ( y < 0 ) ) +

J(y<»>)

( y - y ' 0

' ) ,

(9.5.3)

где

J (у< 0 ) ) — матрица

Якоби. Аргумент матрицы J показывает,

что

ее элементы

вычисляются при значении

у ( 0 ) :

 

 

 

 

dU

dfi

dfi

 

 

 

J<°> =

J (y< 0 ) )

=

 

 

 

 

 

 

 

 

 

 

J y=y (0)

 

При решении уравнений (9.5.1) методом Ньютона — Рафсона сле­ дующее после у ( 0 ) приближение для у получается приравниванием нулю правой части соотношения (9.5.3) и разрешением получив­ шегося уравнения относительно у:

y (l) = y ( 0 , _ J - l ( y ( 0 ) ) f (0)).

В общем итерационная схема Ньютона — Рафсона основана на ис­ пользовании рекуррентного соотношения

y<n> = y<n -i>_(J<n -i>)-4 (у<"-І>).

(9.5.4)

Допустим теперь, что моделью служит уравнение (9.1.10), некоторая система нелинейных дифференциальных уравнений, параметры а которой требуется оценить, как и набор начальных условий:

dy*

î(a,y*,x,t),

у*(0) = Уо*- (9.5.5) = (9.1.10)

dt

(Символ * используется здесь для того, чтобы отличить отклики этой модели от соответствующих переменных в последующих соотношениях.) Если правую часть уравнения (9.5.5) заменить линеаризованным выражением для f (ос, у *, x, t), то для нахож­ дения у * (і) можно использовать метод последовательных приб­ лижений, так как правая часть уравнения (9.5.5) будет линейной на каждом цикле итерации. Беллман и Кал аба [17] показали, что этот метод квазилинеаризации обладает свойством квадратичной сходимости.

Задачу оценивания коэффициентов в дифференциальных урав­ нениях и начальных условий можно преобразовать в задачу оце­ нивания только начальных условий, рассматривая постоянные коэффициенты модели как функции времени. Тогда получается


Оценивание параметров обыкновенных дифференциальных

уравнений

687

дополнительная система

дифференциальных уравнений:

 

- ^ -

= 0,

0^(0) = ссь

 

 

- ^ •

= 0,

а2(1) = а2,

 

 

da*.

; 0, am ( 0) = a m ,

dt

которую следует добавить к уравнениям (9.5.5). При этом образует­

ся модель

с

начальным

значением

 

 

 

 

 

 

 

У(0) = Уо,

 

(9.5.6)

где

 

 

( Г ,

X,

t)

Г

*

г *

-

 

 

 

 

 

 

 

2/1

 

 

 

 

 

 

г/о, 1

*

 

#2

/2 (г/*,

X,

t)

 

г/о,2

г/2

 

 

 

 

 

 

 

 

 

У%

, х = Хг}

/Дг/*,

X,

t) ,

Уо =

г/о, v

 

 

.0

0

 

 

 

а 4

« т .

.0 .

. 0

 

 

_0&т .

Заметим, что f (у *, x, t), конечно, не является функцией пара­ метров, так как при оценивании функции f значения а и у 0 предпо­ лагаются известными из предыдущей итерации.

Заменяя правую часть уравнения (9.5.6) линеаризованным выражением для функции f (у, х, і), получим рекуррентное соот­ ношение, необходимое для расчетов

dy<n+l>

= J(»)y (»+l) + f(y|,n>, X , 0 - J ( n ) y

(9.5.7)

dt

Чтобы начать процесс итераций, выбирают некоторую началь­ ную оценку для уо, у'0т, включающую в себя оценки начальных условий уравнений (9.5.5) и оценки параметров. Необходимо так­ же получить исходную функциональную зависимость у< 0 ) (t)t чтобы использовать в уравнении (9.5.7), постулируя ее или инте­

грируя какую-нибудь

(приближенную) форму уравнения (9.5.6)

в интервале 0 ^ t ^ tf.

Улучшенное решение модели у ( 1 ) (t) можно


688

 

 

 

 

Глава

9

 

 

 

 

 

 

найти,

используя

l

уравнение (9.5.7):

(0,

a

(0)

 

 

 

i

g

 

 

 

 

 

 

 

 

 

= f <0), X , 0

+ J

(y>-y ),

(9.5.8)

где матрица J ( 0 )

с

элементами dft

< 0 ) , х, t) Іду^ по

предположе­

нию,

существует.

 

 

 

 

 

 

 

 

 

 

Так как уравнение (9.5.8) является линейным дифференциаль­

ным уравнением,

то

некоторое

частное

решение

Ур'(і)

можно

численно определить

на интервале 0 ^

£<!fy,

полагая

неизвест­

ные начальные условия равными некоторым удобным значениям, например нулевым:

d\a>

-J- = J(0)y«) + f (у(0,; Х ; i ) _ J ( 0 , y ( 0 , 5

yJ.u(0)=o.

Общее решение уравнения (9.5.8) равно сумме этого частного решения и решения однородного уравнения [уравнения (9.5.7) с отброшенными двумя последними членами]:

ѵ-\-т

 

У ш ( 0 = У И 0 + 2 c f h f ( i ) ,

(9.5.9)

j'=i

где hj1 ' (t) представляет собой v -j- m линейно независимых решений (также найденных численно) однородной системы дифференциаль­ ных уравнений

=

j<o,h <i,( h /

( 0 ) = à .

(9.5.10)

с начальными условиями,

заданными

с помощью +

1)-мерного

вектора bj, все элементы которого равны нулю, кроме /-го, кото­ рый равен единице.

Для получения окончательного выражения для у ( 1 ) (t) осталось лишь выбрать коэффициенты с(1 >. Статистические аспекты про­ цедуры оценивания проявляются именно здесь, ибо коэффициенты

Cj выбираются

так, чтобы

удовлетворить

критерию минимума ф

в выражении

(9.2.1) или

(9.2.2) метода

наименьших квадратов

или некоторому другому критерию. Если подставить выражение

(9.5.9) для Ч!" в (9.2.1) при t

= tt и аналитически

минимизировать

ф, полагая дф/dcj — 0, =

ѵ + 1, v + 2, . . .,

v + m, то полу­

чим систему линейных алгебраических уравнений, которую можно разрешить относительно су.

ѵ-\-т

 

S ytjCj + Wj^O, j = i,...,v + m,

(9.5.11)

5 = 1


Оценивание параметров обыкновенных

дифференциальных

уравнений

689

где

 

 

 

ч

 

 

 

b

 

 

 

= j [hfw ( y p - Y ) +

( y p - Y ) T w h , ] * .

 

 

о

 

 

 

(При использовании выражения (9.2.2) следует заменить интег­

рал

на сумму от

і = 1

до п.)

 

 

 

 

Коэффициенты с7-, вычисленные таким образом, дают возмож­

ность рассчитать

новое

приближение

для

начального вектора

у0 .

Если г/о,і 7 Уо,2) • • •» Уо,» — известные

фиксированные

зна­

чения, то уравнения (9.5.11) образуют

систему m линейных

урав­

нений для m параметров модели, а вектор начальных условий в кон­ це первой итерации будет иметь вид

7 1 * л

2/О

г/о,2

ѵ( 1 ) = 2/0,t) .

J o

а'1'

 

Всю процедуру можно повторить, чтобы найти а < 2 ) и у<2> и т. д., до тех пор пока изменения оценок (всех или некоторых) не станут меньше некоторого заранее выбранного числа. Точность оценок рассчитывается таким же образом, как описывалось в разд. 9.1.

Так как матрица J'n> содержит много нулевых элементов и имеет специальную структуру, то, учитывая эту структуру, можно све­ сти к минимуму расчеты на цифровой вычислительной машине [18]. Для любого расчетного метода квазилинеаризация обладает квад­ ратичной сходимостью, если процедура сходится. Однако здесь выявляются также и недостатки метода Ньютона — Рафсона, описанные в разд. 6.2.3, такие, как сходимость к локальному, а не к истинному оптимальному значению и осцилляции. Для пре­ одоления этих трудностей можно использовать способы, рассмот­ ренные в разд. 6.2.