Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 695

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Линейные

модели с одной

переменной

287

Мепдел показал, что если эксперимент наилучшим образом описы­ вается моделью В, но для него по каким-либо случайным причинам выбрана модель А, то при Хі = 1, хг = 2, . . ., хп п, т. е. при изменении х па единицу и отсутствии разрывов между испыта­ ниями,

п

 

S

xtYi

 

 

 

 

 

b = i=J

.

 

 

 

(4.6.9)

 

t=l

 

 

 

 

 

Var {b} = 4

+

*

a?,

(4.6.10)

1 '

5 » ( и + 1)(2л +

1) 1

x

'

где волнистая черта сверху означает, что оценка вычислена некор­ ректно.

Рассмотрим отношение дисперсии некорректной оценки к дис­ персии корректной оценки:

_Ѵаг{6} __ 6 2«2 + 2n + l Var {bB} 5 (ra + 1) ( 2 / t + l )

При n - > оо это отношение стремится к 1,2; следовательно, оцен­ ка Ъ лишь немного менее эффективна, чем корректная оценка Ъв . Однако если бы дисперсия оценки Ъ тоже вычислялась в пред­ положении, что экспериментальные данные описываются моделью А, тогда как в действительности справедлива модель В, то можно было бы показать, что математическое ожидание некорректно вычисленной дисперсии равно

g {Var1

1 {Ъ}} = - , 3

( ? t w l ° L ; •

 

 

>> 5и(/і +

1) (2/1 +

1)

 

Теперь можно образовать

отношение

 

 

% { Ѵ а г { & } } _

3 ( и + 2)

 

f / f i H V

V a r { ö B }

5(/г +

1)(2/г +

1) -

ѵ ч . и . и /

С ростом п это отношение непрерывно уменьшается, что свиде­ тельствует о том, что стандартная ошибка в угловом коэффициенте существенно занижена. Например, при п = 10 квадратный корень, из правой части выражения (4.6.11) равен только 0,175. Следова­ тельно, применение формул разд. 4.3 к модели В приведет к значи­ тельному завышению точности оценки углового коэффициента, хотя сама эта оценка весьма хороша, так как

n

T . x,Y,


288

Глава 4

Заметим, что отношение математических ожиданий b и Ъв равно единице (при Дх7- === 1):

і=1

п

3=1

 

 

 

і=1

 

 

Tl

 

ß z n +

S

 

Ш{ЪВ) = Ш

3=1

ß-

 

Мендел исследовал также поведение остатков в моделях А я В. Он показал (фиг. 4.6.1), что для больших значений п данные, описываемые моделью А, случайным образом разбросаны по обе стороны линии регрессии, тогда как при описании с помощью модели В длинные последовательности данных располагаются по одну сторону от этой линии. Эти характерные черты помогут раз­ личить модели (если можно провести большое число наблюдений для различных х).

Пример 4.6.1. Оценивание в случае накопленных данных

Этот пример иллюстрирует анализ накопленных данных для химической реакции. В течение некоторого эксперимента периоди­ чески брались и анализировались пробы и таким образом были получены следующие данные [10]:

Время

l f f ( д ш 1 я

Виемя

l g ( д о л я

ми»

оставшейся

\Г„~'

оставшейся

м и н

сахарозы. 10)

м и н

сахарозы-10)

0

1,000

50

0,735

10

0,954

60

0,685

20

0,895

70

0,628

30

0,843

80

0,581

40

0,791

 

 

Анализ этих данных по

обычным

формулам, приведенным

в разд. 4.3, дал для модели

ße +

ßi* следующие значения:

 

 

 

Оценка

Стандартная

 

 

 

ошибка

 

 

 

1,0024

0,00170

Квадратный

корень

из

-0,005303

0,0000357

0,00276

 

суммы

квадратов

 

 

 

остатков

 

 

 

 

-

 

 

 

 

 


Линейные

модели

с одной

переменной

289

Следовательно, для уровня значимости а = 0,05 и t = 2,365

оценка доверительного

интервала для ßi дается неравенствами

— 0,005387 ^ ß t < . — 0,005219.

Однако

корректный

анализ,

использующий модель накопленных ошибок, должен был дать следующий результат:

 

 

Оценка

Стандартная

 

 

ошибка

К

 

1,00

0

by

"корень из

—0,005238

0,000166

Квадратный

0,00469

 

суммы

квадратов

 

 

остатков

 

 

 

Свободный член имеет нулевую ошибку, так как просто равен первому измеренному значению. Корректно оцененный довери­

тельный интервал имеет вид 0,00563 ^

ß 4 <'0,00485; это пока­

зывает, что точность оценки, найденная

неверным методом анали­

за, оказывается выше, чем должна быть.

 

 

4.6.2.

Коррелированные

остатки

 

Хорошо

известно,

что при получении данных

в определенной

временной

последовательности остатки

обычно

коррелированы.

В таком случае естественно поставить вопрос, насколько хороша процедура оценивания методом наименьших квадратов, изложен­ ная в разд. 4.3 или 4.4. Гренандер [11] и Розенблат [12] исследова­ ли этот вопрос для временного ряда; они пришли к заключению, что, если действительно имеют место значительные корреляции, оценки дисперсий параметров по методу наименьших квадратов оказываются смещенными и неэффективными.

Некоторое внимание здесь можно уделить лишь краткому описанию предположений Волда [13] относительно одной подходя­ щей процедуры оценивания коэффициентов и их дисперсий в про­

стых линейных

моделях с коррелированными

остатками. Модели

с несколькими

независимыми

переменными

будут рассмотрены

в разд. 5.4. Дл я знакомства с методами идентификации и

оцени­

вания параметров во временном

ряде, т. е. в эмпирических

моде­

лях, которые явно зависят от времени, можно обратиться к другим работам [15, 16].

Чтобы установить наличие корреляции в последовательном ряде значений, нужно применить критерий сериальной корреля­ ции. Критерий Дарбина — Ватсона [17] сериальной корреляции



290

Глава 4

 

величин е был предложен

для случая независимых

переменных,

являющихся внесистемными,

т. е. для величин е,

статистически

не зависящих от х. Следовательно, он не является вполне строгим, если, как это имеет место для временного ряда, некоторые из величин x измеряются с запаздыванием. Этот критерий весьма

прост:

требуется

лишь вычислить

статистику D для серии

из

п измерений:

 

 

 

 

 

 

 

D=^—n

,

(4.6.13)

 

 

 

t=l

 

 

 

где Et

— остаток

(Yt — Yt)

в момент

времени t, a (Et

— Et_i)

правая

последовательная

разность.

 

 

 

На фиг. 4.6.2 представлены распределение D и области, в кото­ рых гипотеза о сериальной корреляции принимается или отвер­ гается. В табл. В. 10 приведены значения верхних Du и нижних Di

р(Л)

 

 

Область не­

 

Область

 

Область не

 

 

 

 

 

 

принятия

?

принятия

 

принятия

 

 

 

 

 

 

Положи­

 

 

 

Отрицатель

 

 

 

 

 

 

тельная се­

 

 

 

неюсериаль­

 

 

 

 

 

 

риальная

 

 

 

наякорре­

 

 

 

 

 

 

О корреляция

Ли

2

 

ляция

В

 

 

 

 

 

Дг

 

4

 

 

 

Ф и г. 4.6.2. Распределение D,

используемое

при проверке

сериальной

кор ­

реляции

(нуль-гипотеза состоит в том,

что

сериальная к о р р е л я ц и я

отсут­

 

 

 

 

ствует).

 

 

 

 

 

границ

критерия. Если

величина

D,

вычисленная

по форму­

ле (4.6.13), оказывается

меньше, чем Dь или превосходит

значе­

ние 4 — DI,

то следует считать, что сериальная корреляция

имеет

место. Если величина D заключена внутри интервала

между

Du

и 4 — Du,

справедливо

противоположное утверждение. В

обла­

стях, помеченных знаком вопроса, этот критерий не позволяет принять определенное решение.