Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 717

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Линейные модели с несколькими

переменными

337

5.2.1. Доверительные интервалы и доверительная

область

Доверительный

интервал для каждого отдельного параметра ß&

в векторе ß можно

оценить, используя ^-распределение. Стандарт­

ная ошибка оценки bk получается из оценок элементов главной диагонали выражения (5.1.14):

Sbk = 0 - b f e = VsyCkk.

Доверительный интервал для ßf e при некотором уровне значимо­ сти а образуется точно так же, как в разд. 4.3:

bh

ti-a/zSy

i

Vchh

< ßfe < bk +

ti_a/2Sy

Vchk,

 

 

 

 

J i

 

 

Y,

 

v

= n — q — 1.

 

(5.2.1)

Так как b0

 

 

 

 

 

(напомним, что величина с0 о равна обратной величине числа набо­ ров данных, если все веса равны единице) и доверительный интер­ вал для ß 0 имеет вид

bo — h-a/zSbo < ßo < b0 4- ^_œ / 2 sb o .

(5.2.2)

Для модели (5.1.2), в которой

з _

ßo = ßo S ßb^fe» fc=l

дисперсия b'0 равна

Var {b'B} = Var {b0} +j]x\ Var {bk}. ft=i

Доверительный интервал для ßg с выбранным уровнем значимости а выражается неравенствами (5.2.2), в которых величины sbo и Ь0 заменены соответственно на s'bg и Ь'0.

В разд. 4.3 было показано, что дисперсия Yi в уравнении

регрессии Yt =

Ь0 4-

(xt — х)

равна

Var

{Yi}

= Var {b0}

+ (xt - xf Var {b,}.

Аналогично дисперсия вектора Y в модели (5.1.1) с учетом соот­ ношения (5.1.14) определяется как

Var { Y } = Var {xb} = x Var {b} = o% xcxr . (5.2.3)


338 Глава 5

Д ля одиночного набора данных

ѴЭГ {Y;} = [1 {Xii — Xi) . . . (Xiq — Xq)]

X

 

c00

c0q'

Xi i X\

X

 

 

•Cqo •

 

 

(Все элементы в первой строке и первом столбце матрицы с, за исключением с00, равны нулю.)

В доверительном интервале для и, при данном уровне значимо­

сти а используется оценка стандартной ошибки

 

Sf_ = s ?

Vxicxf.

 

Yi — ti-a/2SYi<^i<Yi-\-ti-a/2SY,

v = n—q—l.

(5.2.4)

С помощью эмпирической модели можно делать два типа предсказаний: точечные и интервальные. Для проверки предска­ зательной способности некоторой модели, очевидно, следует срав­ нить предсказания и соответствующие экспериментальные данные. Делая некоторые предсказания о случайной переменной, полагают, что предположения, которым удовлетворяет эта переменная, не претерпевают никаких изменений (если же они и меняются неко­ торым образом, то это следует учесть). Предсказываемое (точеч­ ное) значение Yn+i для одного дополнительного наблюдения или одного дополнительного периода времени определяется выраже­ нием

 

 

 

Yn+\

=

чп+і

+ е п + 1 ,

 

 

 

 

 

так что % {Frt+i} =

Лп+іі поскольку % {e n +i} = 0. Если

 

исполь­

зовать наилучшую

оценку Î]„+I, Yп+4,

то дисперсия

+i

(при

0-1. = <rSn + 1 =

о-у.)

будет

равна

 

 

 

 

 

 

 

Оу*+ і = Var

 

= Var {Yn+i}

+ Var { e n + 1 } =

 

 

 

 

 

 

 

 

 

 

 

 

 

= a^ X n + 1 cx^ + i +

0 y . .

(Если при

x n + 1

проведено

m

повторных

наблюдений,

то

Var {er e +i} =

(1/m) ay..) Доверительный интервал для п п +

1

можно

построить,

заменяя

в

неравенстве

(5.2.4)

SA на

sy*

n+1

Vs i

 

 

1

 

 

 

 

 

 

 

 

 

 

Y x n + 1 c x £

j +

sy.,

как в

разд. 4.3.

 

 

 

 

 

Совместную

доверительную

область

для параметров

 

ßf t

при

заданном уровне значимости a можно

получить точно

так же,

как описывалось в разд. 4.3; в матричных обозначениях

 

уравне-


 

Линейные

модели с

несколькими

переменными

339

ние,

эквивалентное

(4.3.28),

имеет

вид

 

 

 

(ß - Ь)т х % х (ß _

Ь) =

4

(q + 1) Л - а ,

(5.2.5)

где

является табличным значением F для q +

1 и /г — (q - f 1)

степеней свободы.

На фиг.

5.2.1

изображена

доверительная

область для линейной (по параметрам) модели влияния магнит­ ного поля на испарение воды. Длинная, вытянутая доверительная область, такая, как на фиг. 5.2.1, означает, что значения пара­ метров плохо оценены; более желательна небольшая сферообразная область. Длинная, узкая область возникает главным образом

Ф и г. 5.2.2. Неправильная довери­ тельная область, построенная по отдельным доверительным пределам.

вследствие высокой степени корреляции оценок различных пара­ метров. Одним из практических следствий такой высокой корре­ ляции является то, что небрежно оцененное неправильное значе-

09*


340 Глава 5

ние одного из параметров можно сбалансировать при проведении подгонки компенсирующим неправильным значением другого пара­ метра, так что в целом подгонка модели даст почти столь же

хороший результат, какой получается при использовании

наилуч­

ших оценок параметров. Этот вопрос обсуждается в гл. 8

в связи

с планированием экспериментов. На фиг. 5.2.2 показана

область

в пространстве параметров, ограниченная индивидуальными дове­ рительными интервалами. Полезно сравнить эту область с истин­

ной совместной

доверительной областью на

фиг. 5.2.1. Поверх­

ность суммы

квадратов задается

уравнением, аналогичным

(4.3.28а):

 

 

 

 

Фі-а = <£мин ( 1 +

Fi_a)

5.2.2.Проверка гипотез

Методы проверки гипотез, приведенные здесь, аналогичны

методам,

рассмотренным

в

разд.

4.3.

 

 

1. Для проверки-гипотезы

о том, что все параметры ß 0 = ßi =

= ß 2

=

. . . = ß g = 0 ,

нужно

составить

отношение

дисперсий

 

 

 

ss

 

 

_

w'«-r__

 

(5.2.6)

 

 

 

St-

 

 

Sé-

 

 

 

 

 

Y

г

 

 

Y •

 

 

 

 

 

 

 

 

 

i

 

 

Если

это отношение больше чем F^a

(g+1 , п — q — 1)

с данным

уровнем

значимости а,

то

 

эта гипотеза

отвергается.

 

2.

Можно проверить

также

гипотезу о том, что некоторые из

параметров ßf e равны нулю. В таком случае нужно разбить пара­ метры ßf e на две группы, помеченные индексами I и I I , и проверить

гипотезу о том, что все параметры из группы

I I

равны нулю

(не делая никаких предположений о группе

I) .

Составляется

отношение дисперсий, в котором числитель равен среднему

квадра­

ту по

группе I I :

 

 

 

 

( b T G w ) a + i i ) - ( b T G w ) l

 

 

 

•V« i+iD—vi

(5.2.7)

 

 

Si-

 

Если

это отношение

превышает величину

 

 

Fi-a

І ( ѵ ( і + І І ) — vi), n — q — 1],

 

гипотеза отвергается. Этот критерий помогает решить, следует ли включать в модель некоторые из переменных или же их следует исключить из модели. Заметим, однако, что если гипотеза ß n = 0 принимается и коэффициенты исключаются из модели, то возни-


Линейные модели с несколькими переменными 341

кает смещение оценок ненулевых коэффициентов, как объяснялось

в связи с соотношением

(5.1.17).

 

 

 

3.

Дл я проверки гипотезы о том, что параметр ßf e равен задан­

ному

значению

вычисляют статистику

 

 

 

 

 

\bh-K

I

 

/ г о о\

 

 

th

= ——==-.

 

(5.2.8)

 

 

 

SY.Vckh

 

 

 

 

 

 

г

 

 

 

Если tu оказывается

больше, чем й - а / 2 для

п q — 1 степеней

свободы, гипотеза

ßf e = ߣ отвергается.

ß*, где ß * — вектор

4.

Дл я проверки гипотезы о том, что ß =

заданных значений

ß, составляют

отношение

дисперсий

 

 

( b - ß * ) r x T x ( b - ß * ) / ( g + l )

 

(5.2.9)

 

 

 

•т.

 

 

 

 

 

 

 

 

Если это отношение превышает величину F^a

 

(q -f- 1, n — q — 1)

при заданном уровне значимости et, гипотеза

отвергается.

Используя нулевую гипотезу Н0

(отсутствие различия), можно

также проверить, что общая структура модели и предположения, лежащие в ее основе, в прогнозируемый период такие же, как и в период сбора данных. Если эта гипотеза принимается, то оценка уравнения регрессии удовлетворительно описывает не только уже полученные, но и новые данные. Если гипотеза Н0 отвергается, то или изменяются характеристики случайной пере­ менной Y, или модель не способна охватить новые данные. Не исключено, что реализуются и обе эти возможности. Дл я проверки такой гипотезы используется статистика t, рассчитан­ ная для величины У * + і .

В случае множественной регрессии ^-критерий для гипотезы, что ß = 0, уже точно не совпадает с критерием t (точнее, t2) для ß = 0, как утверждалось в.примере 4.3.1. Таким образом, иногда можно прийти к различным выводам в зависимости от применяе­ мого критерия проверки. Рассмотрим модель, похожую на мо­ дель (5.1.1а):

- Л .

-

1= 1, 2, . . . , п

(5.2.10)

Yt-Y=2Zfo(Xij-xj)

+ £i

о ^ п

і=і

 

Pj -> и.

 

Можно выбрать такой масштаб для независимых переменных хц, чтобы

n

УІ и Х1)2 = п, / = 1,

g.