Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 701

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Оценивание

параметров

обыкновенных

дифференциальных

уравнений

649

Иначе говоря, если найденную численно производную придет­ ся использовать при оценивании в качестве отклика, то ошибка в стохастической зависимой переменной резко возрастает. Следо­ вательно, можно сделать вывод, что общий совет по возможности избегать численного дифференцирования экспериментальных дан­ ных вполне обоснован. В методе оценивания с помощью «ошибки уравнения», описанном в разд. 9.6, будет предполагаться, что используются наблюдения самих производных, а не производные, вычисленные по наблюдениям величин.

9.2. О Ц Е Н И В А Н И Е М Е Т О Д О М Н А И М Е Н Ь Ш И Х К В А Д Р А Т О В

Поскольку оценивание параметров методом наименьших квад­ ратов не требует априорного знания распределения ненаблюдае­ мых ошибок, дает несмещенные оценки, т. е. %{Y(t)} =у (t)t и приводит к минимальной дисперсии среди всех линейных несме­ щенных оценок, то метод наименьших квадратов широко использу­

ется как для эмпирических моделей, описанных в части

I I этой

книги, так и для

моделей,

основанных на

явлениях

переноса.

Если наблюдения

Y для

откликов модели

представляют

собой

непрерывные функции времени в интервале

от t = 0 до

t = tf,

то критерий Маркова (или строгий метод наименьших

квадратов)

требует минимизировать величину

 

 

 

ф=1 | [ Y - 4 T ] r r - M Y — V ] * ,

 

(9.2.1)

 

о

 

 

 

 

где Г ковариационная матрица (или, возможно, матрица соот­ ветствующих весов), описанная в разд. 5.5, а ф — проинтегриро­ ванное по времени значение квадрата ошибки (интеграл квадрата ошибки). Если наблюдения проводились в дискретные моменты времени tt, i = 1, 2, . . ., п, то, согласно критерию Маркова, следует минимизировать величину

п

 

 

Ф = т 2

[Y (tt) — (ti)f Г"1 [Y (tt) W (tt)].

(9.2.2)

i =

i

 

(В выражениях (9.2.1) и (9.2.2) множитель V 2 иногда опускается.) Если, как в гл. 5, матрица Г является диагональной (все недиаго­ нальные элементы равны нулю), то ф соответствует критерию «взве­ шенных наименьших квадратов»; если же Г = ofl, получается критерий «обыкновенных наименьших квадратов».


650

Глава 9

 

9.2.1.

Дискретные

наблюдения

Чтобы минимизировать ф для дискретных наблюдений, можно формально продифференцировать выражение (9.2.2) по у 0 и а, a затем приравнять получившиеся выражения соответственно нулевому вектору 0 и нулевой матрице 0. Получим следующую сис­ тему нелинейных (по оценкам) уравнений *):

дф

2 [Y - W (â, уо, tt)f Г 1

(tt)

W («, уо, t,) =

0Г ,

2

 

І=І

 

 

(9.2.3)

дф

_ 2 2 [Y - W (â, уо, ti)f

Г'1

(tt) ± W («, уо, tt)

= 0.

да =

i=l

Подобную систему уравнений можно получить и для непрерывных данных, заменяя суммы по дискретным значениям на интегралы по времени. Уравнения (9.2.3) образуют систему n -\- n х п = = п (п + 1) нелинейных уравнений, которые используются для

получения n (n + 1) оценок

элементов а и у 0 .

Для того чтобы получить

оценки точности оценок а и у 0 , необ­

ходимо сделать некоторое предположение относительно распреде­ ления ненаблюдаемых ошибок, например постулировать совмест­ ное нормальное распределение. Чтобы получить оценки точности оценок Y, решение модели необходимо приближенно представить в виде линейной функции параметров, разлагая это решение в ряд относительно оценок этих параметров, как описано в разд. 6.4. В тех случаях, когда аналитическое решение для модели неизвест­

но, можно подставить и линеаризовать приближенное

аналитиче­

ское решение.

Если

предполагается,

что Г =

а|І, то

выражение

(6.4.3)

дает приближенную

ковариационную

матрицу для эле­

ментов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ь =

а

 

 

 

 

 

 

 

 

 

 

Уо J

 

 

 

!)

Символ

d47dß

означает

 

(v х то)-матрицу

Якоби,

составленную

из производных

 

 

 

 

 

 

 

 

 

 

 

 

3ßi

àh

"

" '

dßm

 

 

 

 

 

 

дЧ2

дУ2

 

 

дЧ2

 

 

 

 

д$

ößi

ö ß 2

'

' '

ö ß m

•Прим ред.

 

 

 

 

 

 

 

 

 

 

 

 

 

9V0

зѵ0

 

 

dWv

 

 

 

 

 

 

 

ö ß 2

*

'

<5ßm

 

 

 



Оценивание параметров обыкновенных дифференциальных

уравнений

651

а выражение (6.4.5) определяет приближенную совместную дове­ рительную область. Если Г Ф а\1, то элементы матрицы Г нужно оценивать, как описано в разд. 5.5, а оценка ковариационной мат­ рицы для Ь, согласно изложенному в разд. 5.1, равна

 

 

 

 

 

 

Cov {b} «

( X T f

 

 

 

 

где символ ^ означает, что при вычислении матричных

элементов

используются

оценки

параметров.

 

 

 

 

 

В качестве примера использования уравнений (9.2.3) примени­

тельно

к

конкретной

модели

возьмем скалярные

уравнения

(9.1.1)

-

(9.1.3). Дифференцируя

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

і=1

 

 

 

 

 

 

 

по

г/о,

а

затем

по

а

и заменяя

в получившихся

выражениях

у0

и а

на

их оценки,

получаем

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

2

[Y

(tt)

-

y0eâti + i?- (1 - eâti))

eâti =

О,

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

2 [Y(ti)~y0eâti

+

 

 

^(l-eàii)]x

 

 

 

 

it!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X { ^ o

e * f i — g - - « « « ) - 1 ] }

= 0 .

 

Используя

уравнения

(9.2.3),

необходимо

помнить

следующие

важные положения: 1) ненаблюдаемая ошибка добавляется к детер­ минированному отклику специальным образом, 2) в оценках используются одновременно все п откликов и 3) в критерий не вхо­ дит никакая априорная статистическая информация, за исключе­ нием, быть может, той, которая вводится с помощью матрицы Г.

Так как уравнения (9.2.3) нелинейны,

для определения

значений

а

и у о необходимо

применить

какой-нибудь

численный

метод

решения, например метод Ньютона — Рафсона. Как

объяснялось

в

разд. 6.2, эта необходимость

нередко вынуждает

выбрать

один

из методов оптимизации вместо того,

чтобы

работать

непосред­

ственно с уравнениями (9.2.3).

 

 

 

 

 

 

 

9.2.2.

Вычислительные

проблемы

 

 

 

Основная трудность, с которой сталкиваются при оценивании методом наименьших квадратов моделей, основанных на явлениях переноса, такая же, как указывалась в разд. 5.5, 6.2 и 6.3, а именно, как успешно провести оптимизацию ф для нелинейной модели.


652

Глава 9

В силу сложного характера решений модели можно ожидать появ­ ления локальных оптимумов; следовательно, является важным выбор начальных приближений. Если бы начальные приближения можно было выбрать так, чтобы основные временные постоянные *)

а

У

 

 

 

 

Ф и г. 9.2.1.

Характеристики

устойчивого

и

неустойчивого

решений моделей процесса.

а — устойчивое

решение

детерми­

нированной модели; б — неустой­

чивое решение

детерминированной

 

модели.

 

Л данные, собранные в обведен­

ной

контуром

области, описывают

установившееся

состояние

модели

и

не затрагивают величину а.

В — данные, собранные в отмечен­

ной

области,

наиболее

сильно

t

влияют на

оценки.

Ö

модели были величинами того же порядка, что и основные времен­ ные постоянные измеренных откликов, то эту трудность можно

было бы

уменьшить.

 

~

Кроме

того, возникает еще

одна новая

проблема, связанная

с планированием эксперимента,

— проблема

устойчивости детер­

минированной модели. Если модель устойчива, то зависимая пере­ менная достигает некоторого асимптотического значения во вре­ мени (или по расстоянию). Чтобы успешно оценить параметры модели, основную часть экспериментальных данных следует получать в первых опытах (фиг. 9.2.1). Если модель неустойчива, так что детерминированное решение неограниченно возрастает, данные также нужно получать надлежащим образом, или взвеши­ вать, если последние наибольшие отклики не должны преобладать над более ранними.

х ) То есть показатели

экспоненты, связанные с f, в решении модели,

которые я в л я ю т с я просто

собственными значениями матрицы а .