Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 725

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

360 Глава 5

зывается неверной и не согласуется с дисперсией У, подсчитанной для модели I I I . Например, для случая, когда нужно предсказать величину У и ее дисперсию при xt = — 1 , х2 1, из фиг. П.5.3.16 видно, что Var {Уц} « 0,12, тогда как Ѵаг { 7 Ш } ж 2,3. Следова­ тельно, в модели I I дисперсия Y значительно занижается. Кроме того, модель I I дает смещенную оценку У. Из фиг. П.5.3.1в ВИДНО, что при ХІ = — 1 , х2 = 1 смещение приблизительно равно 2,2, и даже вблизи экспериментальных точек математическое ожидание смещения лежит в пределах от 0 до 0,4.

Безусловно, данные этого примера имитированы. Однако дей­ ствительно важно, чтобы переменные в эксперименте были по воз­ можности ортогональны друг другу.

Пример 5.3.2. Дисперсионный анализ

В этом примере проводится дальнейшее исследование приме­ ра 5.2.1. Результаты дисперсионного анализа, согласно табл. 5.3.1,

 

 

 

 

 

Таблица

П.5.3.2а

 

Дисперсионный

анализ

 

 

 

 

Число

 

Сумма

Средний

Отноше­

Источник

рассеяния

степеней

 

ние дис­

V

квадратов SS

квадрат

 

 

свободы

персий

Обусловленный

регрессией:

5

 

1,031-10-2

2 , 0 6 2 - Ю - 3

3,05

Отклонения относительно ли ­

5

 

3,383-10-3

6 , 7 6 7 - Ю - 4

 

нии регрессии:

 

 

 

 

 

Общий

10

1,370-10-2

представлены в табл. П.5.3.2а. Так как Fi-a (5, 5) = 5,05, гипотезу

о том, что ß = 0, следует принять, что соответствует выводу, сде­

ланному в примере

5.2.1.

 

Дисперсионный

анализ, согласно табл. 5.3.2, состоит в после­

довательном исключении групп переменных. Например, выби­ раются две различные группы, которые исключаются из полной

модели: 1) х3, ж4 и жБ, 2) х5, а;4, х3, х2 и х^. Если сначала

исключает­

ся х3, а затем ж4 , то сумма квадратов для х 4 , ASS =

7,281 - Ю - 6 ,

полученная в примере 5.2.1, не совпадает со значением 5,615 -10- 5 , приведенным в табл. П.5.3.26. Подобное отсутствие согласованно­

сти наблюдается и для х5 ( 1 , 3 8 - Ю - 4

и 6,051 - Ю - 5 ) . Сумма квадра­

тов, соответствующая исключению

сразу всех переменных х3,


 

 

Линейные

модели с

несколькими

переменными

361

 

 

 

 

 

 

 

Таблица

П.5.3.26

 

 

 

 

Число

 

 

Средний

Отношение

Источник рассеяния

степеней

 

SS-105

 

квадрат-105

дисперсий

 

 

 

 

свободы V

 

 

 

Исключается

х3

 

1

 

2,246

2,246

3,319

Исключается

х 4

после

1

 

5,615

5,615

8,297

исключения

х3

 

 

 

 

 

 

Исключается

х5

после

1

 

6,051

6,051

8,941

исключения

х3

и г 4

 

 

 

 

 

Исключаются

х3,

х$, х$

3

 

13,91

4,637

6,852

 

 

 

 

Число

 

 

Средний

Отношение

Источник рассеяния

степеней

 

SS-104

 

квадрат-10*

дисперсий

 

 

 

 

свободы V

 

 

 

Исключается

х5

 

1

 

1,32

1,32

0,196

Исключается

х^

после

1

 

0,026

0,026

0,003

исключения

х5

 

 

 

 

 

 

Исключается

х3

после

1

 

0,036

0,036

0,005

исключения

х& и х$

 

 

 

 

 

Исключается

хг

после

1

 

2,83

2,83

0,418

исключения х3,

ж4 и х&

 

 

 

 

 

Исключается

 

после

1

 

98,6

98,6

14,6

исключения

xz,

х3, х±

 

 

 

 

 

и х5

 

свободный

1

 

787

787

116

Исключается

 

член

после

исключе­

 

 

 

 

 

н и я

всех ХІ

 

 

 

 

 

 

 

х 4 и х5 , ASS =

1,391-Ю- 4 , оказывается незначимой

согласна

^-критерию. Этот анализ показывает, что

действительно может

быть значимой

переменной.

 

 

5.4. О Ц Е Н И В А Н И Е П Р И З А В И С И М Ы Х

О Ш И Б К А Х

 

Обычным методом наименьших квадратов не удается

получить

удовлетворительных (в смысле разд. 3.1) точечных и интерваль­

ных оценок параметров модели, если предположить, что ненаблю­ даемые ошибки не являются независимыми. Этот раздел является продолжением разд. 4.6, но посвящен рассмотрению моделей с несколькими независимыми переменными. Основное предположе­ ние 4 разд. 4.2 теперь не выполняется; вместо этого предполагает­

ся,

что ошибки ег в

модели (5.1.2) сериально коррелированы,.

т. е.

Ш {e^ei + 1 } =*= 0,

но

все еще

 

g {et} = 0,

 

(5.4.1)

 

Ш {хигг} = % {xtzet}

= . . . = % {xtqet} = 0.


362

Глава

5

 

 

Здесь, как и в разд. 4.6, индекс t

обозначает порядок

следования

наборов данных во времени (t =

1, 2, . . .,

п) для

некоторого

стационарного процесса.

 

 

 

 

Чтобы определить, нужно

ли

применять

методы

оценивания

этого раздела, следует провести проверку сериальной корреляции,

например с помощью критерия Дарбина — Ватсона,

описанного

в разд. 4.6. Если проверка показывает, что сериальная

корреляция

слаба или отсутствует, то обычный метод наименьших квадратов даст удовлетворительные результаты. В матричных обозначениях

остатки равны E = (Y — Y).

Если установлено, что сериальная корреляция имеет место

{причем значения Y вычисляются по наилучшему уравнению регрессии), то можно распространить метод, описанный в разд. 4.6 для модели, содержащей одну независимую переменную, на случай нескольких независимых переменных. Оценки параметров ß p модели (5.1.2) можно переписать в форме, несколько отличной от той, которая использовалась в разд. 5.1:

g

п

 

2

A P h S (xth — Xh)Yt

 

bp =

.

(5.4.2)

где Д — определитель матрицы q X q, составленной из элементов

n

 

 

 

 

 

 

2

[хц — Xi) (xtj — xj), т. е. элементов матрицы

(х'т х'),

которая

отличается от матрицы г х) тем, что в матрице х опущен

столбец

из

единиц,

a Ді 7 - — минор Д. Кроме

того, b'0 =

Y ЪуХ^ — . . .

, . . bqXq.

 

 

 

 

 

 

Как и в разд. 4.6, подставляя Yt

в выражение

(5.4.2), можно

образовать

разности

 

 

 

 

 

 

g

n

 

 

 

 

 

2 Apd

2

(xth Xh)et

 

 

 

 

( b P - h ) = ~ — ^

 

<5-4-3)

 

 

(&;-P;) = ë -

2 (bfc-ßk)

 

(5-4.4)

где

n

2 e*

n

Если"взять члены с одним и тем же запаздыванием во времени,

можно записать выражения для математических ожиданий {bp — ßp)2 , (br — ßr) (bs — ß s ), (fe0 — ßo)2 и т. д.; детали расчета


Линейные

модели с несколькими

переменными

363

можно найти в работе [9]. Приведем здесь лишь окончательное выражение, которое дает _ приближенную оценку ковариации

(br, bs):

 

 

 

 

ч

я

 

 

 

 

 

Соѵ {bT, bs} ~

i = 1 І = 1 Д 2

 

,

 

(5.4.5)

cli = Su (0) +

(1) +

gij

( - 1 ) + £»j (2)

+

 

 

 

 

 

 

n

+

j(-2)

+

. . . + g i j

{k0) +

gi}(-ko),

 

 

 

 

 

 

 

 

 

 

8ij(k)=

S

(xn — Xi) (xt+h. } — X))

EtEt+h,

 

gij(

— k) =

g}i(k),

 

 

 

 

 

 

kQ — индекс обрыва

данных,

 

 

 

 

 

 

Et

= Yt—bo—bixn

. . . —bqxtq

= Yt

¥t.

 

Выражение (5.4.5) дает оценку, которая используется при опре­ делении совместной доверительной области и при проверке гипотез.

Существует много других моделей, в которых ошибки et не являются независимыми, но из-за недостатка места нельзя описать их здесь; список соответствующей литературы приведен в конце гл. 4.

5.5. О Ц Е Н И В А Н И Е Д Л Я М О Д Е Л Е Й С Н Е С К О Л Ь К И М И ЗАВИСИМЫМИ П Е Р Е М Е Н Н Ы М И

Нередко процесс включает более чем одну зависимую пере­ менную, или отклик, как показано на фиг. 5.5.1. Каждая выходная

Входные каналы

Выходные каналы

• у,

Процесс •У»

Ф и г . 5.5.1. Процесс с несколькими откликами .

переменная может быть представлена в виде линейной комбинации входных переменных. Например, модель на фиг. 5.5.1 можно записать в виде

Yi

=

ßü«i«2 +

ßl2«2«3 + ßl3«l«3 + ei,

Y2

=

ß2 ie*1 +

ß22«2 + ß 2 3 « 3 + e2 .


364

Глава 5

Оценивание

моделей с несколькими зависимыми переменными

в некотором отношении отличается от оценивания моделей с одной зависимой переменной. Замечания, сделанные в этом разделе, справедливы как для линейных, так и для нелинейных моделей, так что модель будет записываться в общем виде

ТІІ

=

Ш {Yi

I х} =

Л (ß, х),

г]2

-

Ш { Y2

I x} =

U (ß, х),

ть =

g { Yv

I x} =

/„ (ß, x),

где индекс ѵ соответствует последнему уравнению. В общем случае не существует универсального выбора «наилучшего» критерия для оценивания ß.

Поскольку в предыдущих разделах было показано, что макси­ мально правдоподобные оценки параметров обладают рядом жела­ тельных свойств, естественно исследовать максимально правдо­ подобные оценки для модели с несколькими зависимыми пере­ менными.

Рассмотрим модель, в которой наблюдения Y связаны с откли­ ками следующим образом:

Ун

= ть- + ец

 

Yzi

 

i = l , 2, ., n.

(5.5.1)

= f]zi -f- E 2 i

 

(Первый индекс относитсяv

к eномеру модели, а индекс і

обозначает

Y i

= î]oi 4* c i

 

номер набора экспериментальных данных.) Если предположить, что каждая из ошибок гті распределена нормально и независимо от других с математическим ожиданием, равным нулю, и постоян­ ной дисперсией о*гг, которая может быть различной для разных моделей, а ковариации между моделями равны crr s , то можно записать плотность распределения вероятности, тождественно совпадающую с выражением (5.1.11) для наблюдений с одним откликом:

р(уг\х,

ß, a n . ) =

fcnexp(-^eT-JLe,),

(5.5.2)

где величина

к была дана в связи с соотношением

(2.3.7), а 8 Г

определялась

ранее

как

 

 

 

 

Yri

— і>і