Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 680

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Линейные модели с одной переменной 243

Математические ожидания Ь0 и bj соответственно равны (сум­

мирование ПРОИЗВОДИТСЯ ОТ І = 1 ДО П И 2.Рг ( ж і — ж) = 0)

2^ ~~YP~~^

2 Pi {xt — «)[ßo-r-ßi(*i — x)]

2Pi (^г — ^ ) 2

Отсюда видно, что bo и bt являются несмещенными оценками. Ана­

логично для дисперсий Ь0 и Ьі получаем

(здесь Oy. постоянна)

Var {bo} = % {(бо-ßo)2

} = Var {Ц^Щ

=

 

 

 

 

 

l

Z J P'

J

 

 

 

 

 

2pVar{Y\}

o^Pi _ o-y.

(4.3.10)

 

 

( S f t ) 1

_

(2«Г

 

 

Var

= g { ( 6 , - ß , ) 2 } = Var I ^

^ "

i f

j

=

 

=

2 Pi (ч - *)2 V a r ^ =

2 Pi to -

*)2V a -yJ ^

0yi

(4 3 11)

 

[2м*і-*)аГ

12P'(**-*)8]*

S ^ ^ - Ï ) 2 '

 

Частным случаем рассмотренной выше линейной модели явля­ ется прямая и = ßa;, проходящая через начало координат. Можно показать, что оценка углового коэффициента равна

 

n

 

 

 

2

ptfixi

 

а ее дисперсия

Ъ = ъ=Ч2p**.

(4-3-)

і = і

а 2

 

 

 

 

Ѵаг{Ь} = п

1 У;

(4.3.11а)

2 РІ*\

і=1

Теперь осталось найти лишь несмещенную оценку су , что

можно сделать с помощью следующей теоремы (теорема разложе­ ния для ^-распределения):


244 Глава 4

 

Если сумма

квадратов п переменных Wt,

W2,

• • -, Wn

пред­

ставлена в виде

к сумм квадратов Su

S2,- • -, Sh

соответственно

с ѵ і> ѵ 2 , • • ч vh

степенями свободы, то

 

 

 

 

 

 

 

х * = 2

=

5 I + 5 2 + . . . + 5 f c .

 

 

 

 

 

 

 

i=i

 

 

 

 

 

 

 

Кроме того,

чтобы

величины

»Sj, jS"2? • • •?

 

были статистически

независимы

и распределены

по закону %2 соответственно

с ѵ4 ,

ѵ 2 ,

. . ., vh

степенями

свободы,

необходимо

и достаточно,

чтобы

 

 

 

 

V i + ѵ 2 + - • • + ѵ й = п.

 

 

 

 

 

В конце главы приведен список литературы, где можно

найти

доказательство

этой теоремы.

 

 

 

 

 

 

 

Необходимое

разложение

в данном

случае

можно выполнить

следующим

образом. Если обе стороны

тождества

 

 

(Yij

- тц) =

и

-

Yi)

+ (Yt

-

Yt) +

(Yi -

Ці)

=

 

 

= (Yu - Yt) + (Yt - Yt) + (b0 - ß0 ) + (it - ß,) (a-i - я)

возвести в квадрат и просуммировать по і и то можно легко показать, что смешанные произведения обратятся в нуль или вслед­ ствие ограничений (4.3.4), налагаемых методом наименьших квад­ ратов, или из-за обращения в нуль суммы по /'. Например, смешан­ ное произведение

2 2

 

{Ytj-Yt)iXt-Yt)

І=І j=i

 

 

равно нулю, так как суммирование

по /' дает

S

(Yu~Yt)

= 0.

3 = 1

 

Смешанные произведения

типа

 

2 (Yt-Yt)

(ftt - ß O

i=l

равны нулю в силу второго уравнения (4.3.4). После отбрасывания смешанных произведений остаются следующие суммы квадратов:

2 2 (г«у-лОа = S 2( У * / - ^ ) а +

г=1 j=l

г=1 j= l

 

+ S

р £ (Fe — ^ ) 2 + ( & о — ß o ) 2 S p i +

( & i - ß i ) a S ^ t e - * ) 2 -

i= l

t=l

г=1

(4.3.12)


Линейные модели с одной переменной 245

Слева стоит полная сумма квадратов разностей между эксперимен­ тальными значениями и математическим ожиданием Y при данном x. Первый член справа является суммой квадратов отклонений внутри набора данных (сумма квадратов ошибок), второй член представляет собой сумму квадратов отклонений относительно эмпирической линии регрессии (остаточная сумма квадратов), третий член — сумма квадратов отклонений Ъ0 от ß 0 , а четвер­ тый— сумма квадратов отклонений Ь1 от ß j 1 ) .

Интерпретировать эти члены проще всего с помощью фиг. 4.2.2. Первый член правой части есть мера экспериментальной ошибки, полученной в каждом отдельном эксперименте, выполненном при различных значениях х; второй член служит мерой эффективности линейной модели для подгонки экспериментальных данных. Левая

часть

равенства (4.3.12)

является суммой

квадратов,

аналогич-

 

 

71

 

 

 

 

ной выражению (2.3.9) с

2 pt степенями свободы и распределенной

 

І=І

 

 

 

равен-

как оу. x2 - Можно показать, что каждый член правой части

 

 

 

п

 

 

 

ства (4.3.12) распределен по закону сгу.ѵ2 с

2 РІпі

п

—2,

1 и 1

 

 

1

І=І

 

 

 

степенями свободы соответственно.

 

 

 

 

На

сумму квадратов

ошибок наложено п связей, по

одной

на каждую величину Yt,

которая вычисляется. Остаточная

сумма

квадратов удовлетворяет двум ограничениям, по одному на каждое из выражений (4.3.3), а оставшиеся две степени свободы распреде­ ляются по одной между двумя последними суммами квадратов, так как каждая из них содержит по одной переменной, Ь0 или Ь4 . Можно также утверждать, что Ь0 является случайной величиной,

распределенной по нормальному закону относительно

ß 0 ,

&і —

случайная величина, нормально распределенная

относительно ß t ,

и что Ь0

и &! статистически независимы.

N

равенства

Если

оценивать о*у по второму члену правой части

(4.3.12),

который представляет собой взвешенную сумму

квад­

ратов остатков

 

 

 

 

71

 

(4.3.13)

 

^ = -j^2^Pi(Yi-Yi)',

 

і = 1

*) В отечественной литературе первый член называют суммой квадратов, связанной с дисперсией, характеризующей ошибку опыта, или суммой квад ­ ратов, связанной с «чистой» ошибкой. Второй член называют суммой, обус­ ловленной неадекватностью. Остаточной суммой квадратов у нас принято

пvt

называть сумму ^ 2

~ Yt)2.— Прим.

ред.

і = 1 і = 1

 

 


246 Глава 4

то легко показать, что s? будет

несмещенной оценкой

O y . , если

модель корректна,

ибо, согласно

разд. 2.3.2, Ш{%2 (для п

степеней

свободы)} = п.

Действительно,

 

 

п

 

 

 

g { l T ^ 2 ^ ^ - ^ ) 2 } = 1

^ 2

g { a M 2

( Д л я

п ~ 2 ст. СВ . )}=:

і=1

 

 

 

 

 

2

 

 

 

 

стУ-

% 2 ( Д л я

« — 2

ст. св.)} = о-уг

=

-^І2

(Тем самым доказывается, что максимально правдоподобная оцен­

ка cry. является смещенной.) Если же линейная модель не коррект­

на, то математическое ожидание s2, не равно GY.

, т. е. s2, дает сме­

щенную оценку ( J Y . .

 

 

Величина

 

 

п ѴІ

_

 

s ! = ± z L b !

 

(4.3.14)

S t=l

тоже является несмещенной оценкой а у.; величина si служит мерой

рассеяния, вызванного экспериментальной ошибкой, тогда как выражение (4.3.13) характеризует неточность подгонки (неадек­

ватность). Следовательно, прежде чем принять какое-либо

решение

по

поводу модели, исследователь

должен проверить

гипотезу

о том, что линейная модель T ] = ß 0

+

ß1 (a; — х) удовлетворитель­

но

описывает экспериментальные

данные, для чего нужно соста­

вить отношение дисперсий s£/s2 (разд. 3.6). Если

s2

d r > ^ i - a ,

где F i - a берется из соответствующей таблицы, гипотезу о том, что линейная модель адекватна, следует отвергнуть. Тогда необхо­

димо выбрать другую

модель.

Если

вычисленное

отношение дисперсий меньше, чем Fi-a,

гипотеза

о том, что

линейная модель адекватна, принимается

(модель правдоподобна, но не обязательно корректна). В этом случае дисперсии s2 и si, являющиеся оценками величины Oy.,

п

можно объединить, чтобы получить лучшую оценку оу. с 2 РІ 2

степенями свободы. При таком объединении каждая из дисперсий входит с весом, пропорциональным соответствующему числу сте-


s! = Varlbo} i =2 1 Pj

 

 

Линейные

модели

с

одной

переменной

 

247

пеней

свободы,

как в

формуле

(2.4.12):

 

 

 

«У.- =

«

 

 

 

=

«

(4.3.15)

 

( S

P i - n ) + ( n - 2 )

 

 

 

 

 

 

 

i=i

 

 

 

 

1=1

 

 

 

Конечно, если повторные измерения Ytj

при

заданном xt

не

про­

изводились, то

дисперсию С у

нужно оценивать лишь по s?,

в ре­

зультате чего величина « у

становится непригодной в качестве оцен­

ки, если модель неправильна. Без повторных данных /^-критерий не может быть применен для проверки гипотезы линейности, но данные можно нанести на график и исследовать визуально. Про­ верка гипотезы ßj = 0 может быть осуществлена, что будет кратко показано.

Таблица

4.3.1

Распределение вариаций относительно модели ii = ßo + ßi(a '—<ю)

Источник

 

Число

 

Сумма квадратов

степеней

Средний квадрат

рассеяния

 

 

свободы

 

1.

Отклонение

bo

(bo - ßo) 2

S

p i

 

 

от ßo

 

 

 

 

 

i = 1

 

 

 

 

 

 

 

 

 

n

 

 

2.

Отклонение

Ьі

 

 

 

i = l

 

 

 

от ßi

 

 

( b i - ß D

2

P j ( * j - * )

2

 

 

 

 

 

2

 

3.

Отклонения

 

 

 

 

 

 

n — 2

 

относительно

 

i = 1

 

 

 

 

 

линии

регрес­

 

 

 

 

 

сии

 

 

 

 

 

 

 

 

 

 

 

 

n

Pi

 

 

 

4.

Отклонения

 

i =

1 ; = 1

 

i = 1

 

внутри

серий

 

 

(ошибка

экспе­

 

 

 

 

 

 

 

римента)

 

 

 

 

 

 

 

 

5.

Общий,

отно­

 

 

 

 

 

n

 

 

 

 

 

S p,

 

сительно

мате­

i =

1 ; =

1

 

 

 

i = 1

 

матических

 

 

 

 

 

 

 

ожиданий г|£

 

 

 

 

 

 

 

 

= Var{bi>

2

P* ( * i - * ) 2

 

 

i =

1

„2

1

 

 

 

n - 2 . .

 

 

i

= 1

 

 

n

Pi

 

2 i S= 1 .j2= 1 C 7 w - V f

i = l

В табл. 4.3.1 приведены различные суммы квадратов и соответ­ ствующие степени свободы, обычно используемые в так называемом дисперсионном анализе, основанном на теореме разложения для ^-распределения и F-критерии для проверки отношения диспер-