Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 722

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Линейные

модели с несколькими

переменными

351

Вычитая первые g — 1 соотношений (5.3.11) из (5.3.10), получим q — i n

Ъ%—bh= 2

3=1

(ctj—Chj)

2 (xtj—xj)Yt

 

 

 

i=l

 

q — i n

Xj) (Xiq Xq)

n

2 (Xiq

Xq) Y i,

?2

^fej 2(Xij

Ckq

j=l

t=l

 

i=l

 

Ä = l ,

q— 1.

(5.3.12)

Используя соотношение (5.3.11) с k = q, можно переписать систему соотношений (5.3.2а) в виде

 

q

п

 

bt-bk = l ^ - ^ ß -

2

Cqj^iXij-Xj)

Y и

Ä = l ,

. . . ,

g — 1 .

(5.3.13)

Приравнивая правые части соотношений (5.3.12)' и (5.3.13), получим

q—i

 

п

 

 

 

 

 

 

 

3=1

 

i=l

 

 

 

 

 

 

 

 

= ?(2c ^'f e + ^ )

' Ä = 1 .

 

(5-3.14)

 

 

3=1

 

 

 

 

 

 

 

Система соотношений (5.3.14) не должна

зависеть

от

значе­

ния I ; следовательно,

величины

в

круглых скобках

правых

частей

этих соотношений должны

обращаться в нуль. Сумму

по і в (5.3.14) можно исключить,

используя

нормальные

урав­

нения

(5.3.5), что

дает

 

 

 

 

 

 

 

 

2 h

2

(cZj-chj

+ « )

{х*х}и

= 0,

(5.3.15)

 

г=і

з=і

 

 

q Q

 

 

 

 

 

 

 

Ä = l ,

. . . ,

q—i.

 

 

 

Так как коэффициенты bi в соотношении (5.3.15) не зависят от Yt, эти соотношения не зависят от Ъг и каждый коэффициент при Ьг обращается в нуль. Используя для подсчета сумм в полученных

выражениях свойство

ортогональности

chjcji

=

è h i ,

находим

2

 

cts{xTx}ji

=

6 k i - ^ 6 q i

! =

 

 

.

(5.3.16)

p'j

 

 

счя

к = 1,

. . . , g — 1 .

 

Умножая равенство (5.3.16) справа

на

сіт

последовательно

для m =

1,

g — 1 i суммируя по всем значениям I, получим


352 Глава 5

искомое выражение

*

— t-fem

ÇqmÇqk

к, m=i, ..., q—1.

(5.3.3a)

chm

,

i

 

 

Cqq

 

 

 

Наконец, для вычисления сумм квадратов запишем, используя уравнения (5.3.5),

i = i

 

(5.3.17)

h=i

;'=1

Аналогично для модели с

ß g = S,

используя уравнения (5.3.6),

находим

 

 

« - і = 2 y ? - 2 t { x T Y } g -

і=1 — S

{ x T x } h ^ — { x T x } f t g ç ] — 5 2 { X X}gg. (5.3.18)

h = l

j = l

Исключая с помощью равенства (5.3.2а) коэффициент Ъ%, получаем

 

 

 

 

Фч-і

— ?q =

 

(5.3.4а)

 

 

 

 

 

 

 

Исключение

одного

члена из модели

равнозначно

условию

| = 0 .

Таким

образом,

как следует из

равенства (5.3.4),

если

в модели

вычеркивается

параметр ß/,, то

 

 

 

 

 

 

 

 

ASS = — .

 

(5.3.19)

 

 

 

 

 

 

Cftft

 

 

 

Величину ASS часто называют суммой квадратов для xh,

скоррек­

тированной

на все другие

переменные, или суммой квадратов при

заданных других переменных. Сумма квадратов для любой

груп­

пы из р переменных,

скорректированная

на все другие

перемен­

ные,

вычисляется по

формуле

 

 

 

 

 

 

 

 

ASS = bjcp *bp,

 

(5.3.20)

где bp матрица из одного столбца (вектор), составленная только из выбранной группы параметров bh, а с р матрица из соответ­ ствующих элементов с і к .

Допустим, например, что желательно подсчитать общий эффект

исключения переменных xt, хг и х 4 из модели, содержащей Х\, хг,

х3, xt, . . .,

xq.

Каждая переменная х связана с соответствующим

параметром

Ъ.

Тогда

с12

с14

-1

~ъ'г

 

с21 с22

с24

 

Ьг

-Cil с42 С44 _

 

J>4_


Линейные

модели с несколькими

переменными

353

Вообще говоря, сумма квадратов (5.3.19), связанная с исклю­ чением из модели некоторого члена наложением условия ßf t = О, не совпадает с суммой квадратов ASS, вычисленной при исключе­ нии соответствующего члена из модели после того, как из нее уже исключили несколько других параметров. Только в том

случае, когда величины (xk — хъ) образуют ортогональный

набор,

эти суммы квадратов ASS согласуются друг с другом. Таким

образом, нельзя

ожидать, что

сумма

величин

ASS, полученная

в

результате

последовательного применения

формулы

(5.3.19)

к

каждому

параметру, будет

равна

полной

сумме

квадратов

п

 

 

 

 

 

 

 

 

2

Wi (Yt — О)2 для полной модели,

если независимые

перемен-

і=1

 

 

 

 

 

 

 

 

ные не являются

ортогональными.

 

 

 

 

 

Завершая это обсуждение, сделаем следующее резюме: для про­

верки значимости некоторой переменной (или группы перемен­ ных) полной модели можно применить F-критерий для отношения

дисперсий

s2/s^r

, где величина

s2 подсчитывается следующим

образом:

 

 

 

 

«2

 

 

 

ASS

V

Одна переменная

хя

bR/ckk

1

 

Группа из р переменных х

 

р

 

Если

отношение дисперсий

превышает

значение

Fy_a из

табл. В.4 для выбранного уровня значимости, то соответствующая переменная (или группа переменных) дает значащий вклад в пол­ ную модель.

Так как независимые переменные xt могут быть коррелированы, то результаты проверки их значимости с помощью ^-критерия или /^-критерия могут привести к ошибочному заключению о том, что они являются физическими переменными, влияющими на зави­ симую переменную модели. Очевидный значимый вклад в модель,

вносимый

переменной xk,

в

действительности может

явиться

следствием того факта, что на переменную Y влияет переменная хп,

a xk

и хп

сильно коррелированы; при этом переменная

хп

может

даже

не

измеряться.

 

 

 

 

Д л я составления таблицы

дисперсионного анализа,

при кото­

ром последовательно исключаются из модели несколько

пере­

менных,

можно поступить

следующим образом:

 

 

1. Исключить первую переменную и подсчитать ASS по фор­

муле

(5.3.19).

 

 

 

 


Таблица 5.3.2

Дисперсионный анализ при последовательном исключении переменных

Число

Источник рассеяния степеней Сумма квадратов SS Средний квадрат свободы V

1. Исключается (т. е. &і = 0) 1 A S S i = - ^ - 6 1 2

Сa

A S S j ^ A S S i — 0 = ASS!

2.

Исключается хг (т. е. è 2

= 0)

1

 

после и с к л ю ч е н и я

х\

 

 

3.

Исключается х3 (т. е. ü>3

= 0)

1

 

после исключения

х\ и х2 и т. д.

 

4.

Н е п о л н а я сумма

 

 

1

5.

Исключается свободный член Ь0

1

 

на последнем шаге

 

 

 

6.

Отклонения от линии репрессии

п — q1

7.

Полная сумма

 

 

п

8.

Отклонения внутри

наборов

 

A S S i + 2 = b 2 r c - i b 2

ASS2 = ASS 1 + 2 — ASSj

 

ASS 1 + 2 + 3 = b3T c-ib3

 

ASS3 = A S S i + 2 + 3 — A SSi+ 2

 

n

 

 

i = l

 

 

І(У-0)2 = ( У ) > ^ І

 

i = l

1=1

n

 

 

2 «>i ( F i - y i ) 2 =

( Y - x b ) T w ( Y - x b )

i = l

n

»iYÏ

2

 

i = l

См. табл. 5.3.1

ASS2 1

ASS3 1

 

 

(?)2

 

 

i = l

 

 

1

 

 

71

 

 

2 « > і ( у * - У і ) а

2

 

1=1

S r

=

и— q—J1


Линейные модели с несколькими переменными 355

2. Исключить первую и вторую переменные и подсчитать совместную сумму ASS по формуле (5.3.20). Вычесть из нее ASS, подсчитанную для первой переменной, чтобы получить чистый вклад в ASS от исключения второй переменной.

3. Исключить первую, вторую и третью переменные, подсчи­ тать соответствующую сумму ASS по формуле (5.3.20), вычесть ASS для первых двух переменных и т. д.

Исключение каждой дополнительной переменной дает новую совместную сумму ASS, вычитая из которой предыдущую сумму ASS можно найти остаточный эффект исключения этой дополни­

тельной

переменной. Сумма

всех

величин ASS, вычисленных

таким способом для каждого этапа,

будет равна

сумме квадратов

2 wt (Yt

— У)2 , записанной в первой строке табл. 5.3.1. Следует

і=1

 

х{ не

 

 

помнить,

что если величины

являются

ортогональными,

важен порядок исключения переменных, поскольку в зависимости

от него будут

получаться различные

суммы

ASS;.

 

 

п

 

В табл. 5.3.2

показано расщепление

2 wi (Уі

Y)2 н а части,

приведены соответствующие степени свободы и дисперсии, которые используются в F-критерии для отношения дисперсий s2/sy.. В строках 4—б таблицы показано разложение суммы квадратов

п

2 Wi (Yt — О)2 на три части:

г=1

2

wi(Yi-0Y

=

{Y? 2 т+

2 m(Yi-Yif4-

2

 

wt(Yi-Y)\

і=1

 

 

г=1

г=1

г=1

 

 

 

В строках 1—3

дано разложение 2 (Yj — Y)2 в

сумму

квадра­

тов,

связанных

с каждым параметром. В разд.

7.2-

описывается

метод почленного

построения моделей, основанный

на

этих

идеях.

 

 

 

 

 

 

 

Квадрат множественного коэффициента корреляции для Y

слу­

жит мерой подгонки эмпирической модели в целом.

Множествен­

ный

коэффициент

корреляции

есть мера степени

линейной

связи

в целом между зависимой переменной Y и набором независимых

переменных xt.

Можно дать ясную геометрическую интерпретацию

оценки множественного коэффициента корреляции: косинус угла между векторами Y и Y равен множественному коэффициенту корреляции. С узкой точки зрения это простая корреляция между

измеренными

значениями Yt и значениями У г , предсказанными

по уравнению

регрессии.