Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 679

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

248 Глава 4

сий. Суммы квадратов, разделенные на соответствующие числа сте­ пеней свободы, называются средними квадратами. Каждую диспер­ сию из табл. 4.3.1 можно использовать в качестве оценки величины аУі, но в силу того, что Ѵаг{Ь0 } и Ѵаг {£>!}, как правило, неизве­ стны, для оценки а У і используется объединенная оценка sf'i- В свою

очередь оценки дисперсий коэффициентов

Ъ0 и Ьі можно получить

с помощью Sy;,

подставляя последнюю величину вместо Оуг

в выра­

жения (4.3.10) и

(4.3.11).

 

 

 

 

 

 

 

 

Если расчеты выполняются вручную, могут оказаться полез­

ными следующие

тождества:

 

 

 

 

 

 

 

 

2 Pi{fi-YY

= b\ S Р І ( Х І - Х

) \

 

 

 

 

i = l

 

 

j = l

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

; 2 > ( Г І - ? , ) - = 2 Р І І Т

(ÂPiYi)2

\D Pi

 

 

(Y

i-Y)]2

i = l

 

i = l

 

2 pt

2

pi

 

(xi—xf

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 Pt (xi — x) (Yi

— Y)

= S Pt [xi — x)

Yt.

 

 

i =l

 

 

 

 

i = l

 

 

 

 

 

Дисперсионный анализ, несколько отличающийся от предыду­

щего, можно осуществить, разлагая (Хц

Y) вместо

(Yа

— т]г ),

где Y = ^YijlUpi,

Член Ytj

Y

можно представить

следующим

образом:

 

 

 

 

 

 

 

 

 

 

(Yu -

Y)

= ( У „ -

У,)

+

(У, -

У,) ч-

(У,

-

У).

 

Как и раньше, обе части этого равенства можно возвести в квад­ рат и просуммировать по і и /. Разложение суммы квадратов будет аналогично описанному выше. Результаты представлены в табл. 4.3.2. Суммы квадратов во второй и третьей строках этой таблицы такие же, как и в табл. 4.3.1. Сумме квадратов в четвертой строке соответствует общее число степеней свободы 2.Рг минус 1, причем единица появляется в силу ограничения, наложенного при вычис­ лении У. Как следствие сумма квадратов в первой строке имеет только одну степень свободы.

Сначала можно проверить гипотезу о линейности модели, сос­ тавляя отношение дисперсий sf-fsl и применяя ^-критерий, как объяснялось выше. Если отношение дисперсий не является значи­ мым, линейная форма модели принимается. Затем можно прове­ рить гипотезу, что ßi == 0, составляя отношение sysYi- Если это отношение больше, чем значение Fy-a, из таблиц для некоторого выбранного а, гипотеза ßj = 0 отвергается. На фиг. 4.3.1, а пока-


 

 

 

 

Линейные

модели

с одной

переменной

249

 

 

 

 

 

 

 

 

 

Таблица 4.3.2

 

 

Распределение вариаций относительно среднего

Y

Источник

 

 

 

 

Число

 

 

 

Сумма квадратов

степеней

Средний квадрат

рассеяния

 

 

 

 

 

 

 

 

свободы

 

 

1. Отклонения

 

 

у

2

 

 

 

между значени­

2 Р;(Ѵ->

 

i = 1

ями на

линии

і =

1

 

 

 

регрессии

и об­

 

 

 

 

 

 

 

щим

средним

 

 

 

 

 

 

 

(обусловленные

 

 

 

 

 

 

 

регрессией)

 

 

 

 

 

 

 

2. Отклонения

2

P i

^ i -

Y ^

n — 2

2

 

относительно

i = 1

 

 

 

i = l

 

линии

регрес­

 

 

 

n - 2

сии

 

 

 

 

 

 

 

 

 

 

 

n

Pi

 

 

та

2 2

 

 

 

 

 

 

 

 

3. Отклонения

 

 

(Yu~ro2

2

« i = 1 J = 1

внутри серий

2

S

 

2 T 1

 

 

 

i = U = l

 

_

i = l

 

4. Общий

 

 

n

Pi

 

n

i

= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

i = 1

 

 

 

 

 

2

2 ( r u - r > *

 

 

 

 

 

i = l j = l

 

 

 

 

 

зана ситуация, когда экспериментальные данные гораздо лучшеаппроксимируются оценкой линии регрессии, чем горизонтальной прямой, тогда как для данных на фиг. 4.3.1, б горизонтальная прямая дает столь же хорошую подгонку. Для проверки гипоте­

зы о том, что ßi =

0 или любому другому значению, можно также

применить критерий t, основанный на соотношении

(4.3.20), за­

писанном ниже.

 

 

 

 

 

Еще одну

весьма полезную

форму

дисперсионного анализа

можно получить, разлагая (¥ц

— 0) следующим образом:

(Yij

-

0)

= (Yu - Yt)

+

(Yt -

Yd + (Yt -

0).

Снова выполняя те же действия, получим следующее

разложение

для суммы

квадратов:

 

 

 

 

2 2(^;—0)2=2 2 ( Y U - Y t r

+

 

 

і=1 3=1

 

 

î = l 3=1

 

 

 

 

 

 

 

+

^pi{Yi-Yi)z+

?,pi(Yt-0)K

 

 

 

 

І=І

i=i

 

Первые два члена справа от знака равенства такие же, как в треть­ ей и второй строках табл. 4.3.2. Последний член, представляющий



250 Глава 4

собой отклонения предсказанных значений Y относительно нуля

с учетом весов, в свою очередь можно разложить на сумму квад­

ратов, если подставить оценку уравнения регрессии для Yt:

S

Pi(Yi-Oy

= blJ]

рі + Ъ\^ Pi{xi-xf

=

і=1

 

i=l

i=l

 

 

 

 

^^ÇY-Ofpi+fjiYt-Yfpi.

 

 

 

i=i

i = l

 

Каждый из двух членов в правой части этого равенства можно

интерпретировать как сумму квадратов независимо от того,

вклю­

чен ли в модель лишь параметр ß 0 или оба параметра ß

0 и ßt .

I

X

 

Ö

Ф и г . 4.3.1.

Экспериментальные данные д л я проверки гипотезы ß 4 = 0.

 

а — гипотеза отвергается, б — гипотеза принимается.

Предположим, что модель содержит лишь ß 0 , а параметр ß t вычерк­

нут, так что модель имеет вид Yt

= ß 0

+ &t.

Тогда оценкой ßo

по

методу наименьших

квадратов

могла

бы

служить величина

Ь0

= Y, и

 

 

 

 

 

і=1

і=1

 

і=1

 

Отметим соответствие этой суммы квадратов первому члену раз­ лагаемой суммы квадратов 2 (Y 0) 2Рі- Следовательно, можно

заключить, что второй член

Ъ\ 2 РІ(*І - *) 2

= 6І j\pi?t(xt-x)=

S (Yt — Y)*Pi

i=l

i=l

i=l


Линейные

модели с одной

переменной

251

описывает вклад в сумму квадратов, обусловленный добавлением ßi к модели Yt = ß 0 + вг , так что получается наклонная прямая. Это третье разложение суммы квадратов показано в табл. 4.3.3.

 

 

 

Таблица 4.3.3

 

Распределение вариаций относительно

нуля

Источник

 

Число

 

Сумма квадратов

степеней

Средний квадрат

рассеяния

 

 

свободы

 

1. Обусловлен­

У2

2 Vi

ный регрессией

 

Ьо,

 

i = l

 

n

 

 

6і с поправкой

 

 

на Ьо

bl

i S= lVt Yi {xt-x)

 

2.Отклонения

относительно линии регрес­ сии

3.Отклонения внутри серий (ошибка экспе­ римента)

4.Общий

2 P I ^ - V

i = 1

n Vi

2 2

ян-??

i= 1 3 = 1 n Vt

2 2 -°>2

4 = Y» S Pi

i = l

n

4 = f > 1 2 P i 7 i

n — 2

8 r

S P i " " i = 1

2

S<-=

S Vi i = l

i = l n

n - 2

2n VSt 0^~V

i = l j = l n

i = l

i= l j = i

Спомощью критерия отношения дисперсий можно узнать, насколь­

ко

оправдано

исключение из модели

параметров

ß 0 и ß 4 .

Если

какое-либо из отношений s\lsyi

и s^/sy.

превышает

значение

Fi-a,

соответствующий параметр дает значимый вклад в модель.

 

Пример 4.3.1.

Оценивание и

анализ

имитированных

данных

с

помощью линейной модели

 

 

 

 

 

 

 

В качестве примера заранее известной модели рассмотрим

модель л = ßg + ß t x с ßo = 10 и ß t = 0,2. Наблюдаемые

значе­

ния Y (табл. П.4.3.1 а) имитировались

прибавлением к т) ошибок,

взятых из таблиц случайных нормальных

отклонений со средним

значением, равным нулю, и с единичной дисперсией (из работы [2]). Требуется: 1) получить оценки Ъ'0 и Ъі параметров ßo и ß t , исходя из экспериментальных значений Y; 2) найти доверительные интервалы для ßo» ßi и г| (последний как функцию ж); 3) изобразить