Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 774

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Ф и 1?, П,7.1.1д,

Определение наилучшей

модели

463

жить, что дисперсия при двух наибольших значениях

суще­

ственно отличается от дисперсии при остальных значениях этой переменной.

И с с л е д о в а н и е

о с т а т к о в

д л я т о г о , ч т о б ы

п р о в е р и т ь , о п и с ы в а ю т с я

 

л и о н и

н о р м а л ь ­

н ы м р а с п р е д е л е н и е м .

На

фиг. П.7.1.1г на нормальной

вероятностной бумаге построен

график

(по методу,

описанному

в примере 2.3.3) для 36

остатков,

вычисленных

по

данным

табл. П.7.1.1а и значениям Y из уравнения (а). Остатки

распре­

делены, по-видимому, по нормальному закону. График зависимо­ сти относительной частоты от величины остатка будет иметь вид известной колоколообразной кривой, симметричной относи­ тельно нуля; его также можно использовать для обнаружения выбросов.

На фиг. П.7.1.1д изображен график зависимости остатков, вычисленных с помощью уравнения (а), от предсказанного откли­ ка Y. Никаких аномалий не обнаружено, за исключением, быть может, остатка, равного 1,80. На графиках типа фиг. П.7.1.ІД можно заметить такие особенности, как: 1) систематические откло­ нения от оценки уравнения регрессии (из-за неадекватности моде­ ли) или 2) непостоянство дисперсии.

7.2. ШАГОВАЯ Р Е Г Р Е С С И Я

Шаговый регрессионный метод состоит в последовательном включении [и (или) исключении] некоторой переменной в перво­ начальную линейную модель и проведении на каждом этапе про­ верки с целью определения, является ли добавляемая переменная значимой. По причинам, изложенным в разд. 5.3, эта процедура наиболее эффективна в том случае, когда независимые переменные

ортогональны, ибо

тогда порядок вычислений не играет роли.

(С ортогональными

планами эксперимента,

удовлетворяющими

этому требованию,

можно познакомиться в

гл. 8.) На каждом

этапе вычислений принимается решение прекратить расчеты и огра­ ничиться данным уравнением регрессии или перейти к новому этапу и заменить данное уравнение регрессии на некоторое новое. Начиная построение модели с некоторого исходного уравнения и используя ортогональные независимые переменные, получают единственную окончательную модель, удовлетворяющую некото­ рому заранее выбранному критерию согласия. При использовании неортогональных переменных различные исходные модели могут привести к различным окончательным уравнениям; следователь­ но, может получиться несколько адекватных моделей. Однако каждое из этих окончательных уравнений является локально оптимальным в том смысле, что оно «лучше» остальных, под­ вергшихся проверке


464

Глава 7

Эфроимсон [7] описал метод включения, или «прямой метод», при котором каждая из независимых переменных (и соответ­ ствующие параметры) поочередно вводится в модель. На каждом этапе к модели добавляется та независимая переменная, которая вызывает наибольшее уменьшение суммы квадратов остатков, при условии, что это уменьшение является значимым. По существу тот же самый алгоритм можно использовать для того, чтобы поочередно исключать независимые переменные из полной модели (метод исключения, или «обратный метод»), если последующее введение другой переменной делает некоторую переменную модели незначимой. Несколько вариантов алгоритма Эфроимсона исполь­ зуется в машинных программах [8, 9].

Принимая на каждом этапе решение, какую из независимых переменных ввести в модель, используют частный коэффициент

корреляции, определение которого еще не было дано.

Предполо­

жим, что в некоторой модели с тремя переменными Хи

Х 2 и Х3

переменные

Хі

и Х 3

рассматриваются соответственно как зависи­

мая и независимая случайные переменные

модели

 

 

 

${ХІ

I Х3}

= ц Х і

+

ß 1 3 3

-

ц.Х з ).

(7.2.1)

Затем в свою

очередь переменные

Х 2 и

Х3

рассматриваются

в качестве соответственно зависимой и независимой

случайных

переменных

модели

 

 

 

 

 

 

 

 

 

Ш{Х2

I Х3}

= цХі

+

ß 2 3 3

-

цХя).

(7.2.2)

Из плотности двумерного нормального распределения вероятно­ сти, полученной в примере 2.3.4, интегрируя по Х3, можно найти условную плотность распределения вероятности

р {ХІ j Хз) = — = — 1

x

 

 

 

 

 

1 <

 

 

 

2"

X е х р

 

 

 

>

 

 

2

 

 

 

 

Математическое

ожидание

величины (Х4 | Х3) равно

 

ë{Xi\X3}

= ]iXi

+ rJXlX3 (^L\

( X . - H - Z , ) ,

(7.2.3)

а ее дисперсия

определяется

выражением

 

 

Var

{ X , I Хз} =

ог^ (1 -

рХіх3).

(7.2.4)

Подобные формулы можно получить для ( Х 2 | Х 3 ) , и они будут использованы ниже.


 

 

 

 

 

Определение

наилучшей

 

модели

 

 

 

 

465

Далее, используя формулы (7.2.1) и (7.2.2), образуем откло­

нения

Хі

 

и

Х 2

от соответствующих

 

математических

ожиданий

Хиз

=

 

X,

-

Ш {X,

I Х3}

=

X j -

цХі

-

ß 1 3

3

-

[ххз), (7.2.5)

Х 2 . 3

=

 

Х 2

-

g {Х 2

I Х 3 }

=

Х2 - )хх2

-

ß 2 3

3

-

(ІІЗ)-(7.2.6)

Символом

 

Хі.3

обозначена

переменная

Хі

после

исключения

из нее влияния

переменной

Х3; подобная

величина

для Х2

обо­

значена символом Х2.3.

Частный коэффициент корреляции

между

X j и Х2

после

исключения

влияния

Х 3

определяется

как

коэф­

фициент

корреляции

Х 4 . 3

и

Х 2 . 3 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р12-3 =

-, /

C o v j X ^ ,

 

Х 2

, 3 }

—•

 

 

 

(7.2.7)

 

 

 

 

 

 

 

У Ѵ а г ^ . з І Ѵ а г ^ . з )

 

 

 

 

 

Теперь

выразим

коэффициент р і 2 . з

через

обычные коэффи­

циенты корреляции рхіх2,

РхіХз

и рх2х3,

из которых влияние пере­

менной Х3

не исключено; корреляция,

например между X t

и Х 2 ,

может существовать только в силу того, что обе эти переменные

каким-либо образом связаны с Х3.

Из формулы

(7.2.5),

исполь­

зуя соотношение (2.2.9),

получаем

 

 

 

Var из} = Var {X,} +

ßj, Var 3}

- 2 ß 1 3 Cov ( X 4 , X3).

 

Сравнивая формулы (7.2.1) и (7.2.3), видим, что ß 1 3

= pxix3

{^xj^x3)-

Следовательно,

 

 

 

 

Var { X , . , } = oXl + р Ѵ з (

) 2 < & . -

 

 

 

хх3 î

 

 

— 2 р а д ( - ^ - ) Р а д 3

^ Х з =

о ^ ( 1 — рХіх3).

(7.2.8)

 

 

ѵ

-Хз '

 

 

 

 

 

Аналогично

Var { Х 2 . 3 } =

а2х2

(1 — Рхцх3)-

Наконец,

 

Cov { X 1

< 3 ,

X 2 . 3 } = g { X b 3 ,

X 2 . 3 } -

Ш{Х,.3)

g { X 2 . 3 } =

 

 

 

 

=

ѴхРХъ

(РХІХ2

РХІХЗ

Px2x3)-

(7.2.9)

Теперь

коэффициент p i 2

. 3 можно

представить в

виде

 

 

 

 

PXiX2 — PxlX<PX2X3

 

п

о \С\\

 

 

 

Vi1

- Р а д ) ( г - Р а д )

 

 

Дл я

получения оценки р і 2 . 3 коэффициента p j 2

. 3 можно

вместо

соответствующих коэффициентов корреляции по ансамблю исполь­ зовать их оценки по некоторой выборке. Хотя формулу (7.2.10) можно распространить на более общий случай, когда вычисляется частный коэффициент корреляции между двумя переменными, из которых исключено влияние нескольких других переменных, однако простейший способ получения оценки частного коэффи­ циента корреляции между Y и одной из многих переменных х,


466 Глава 7

скажем xj,

заключается в том, чтобы включить переменную Х)

в модель и

затем

вычислить величину [103

 

 

ЬУ*Г*Ь&ФІ)=

,ъ,

n / r

( ? - 2 Л 1 )

Вернемся

теперь

к

построению

модели с помощью

шаговой

регрессии. В типичной машипной программе используется неко­ торый список переменных, включаемых в модель в предполагаемой последовательности, и (или) выбирается из полного списка пере­

менная

с наибольшим

частным коэффициентом

корреляции

pYxj-xk-

После того как

одна переменная включена

в модель,

можно добавить вторую переменную, которая имеет наибольший частный коэффициент корреляции среди оставшихся переменных, и т. д. Чтобы установить, является ли добавляемая переменная значимой, можно использовать различные критерии значимости. Однако, как правило, применяется или критерий отношения дис­

персий,

описанный

в разд.

5.2 и 5.3, или критерий, основанный

на статистике

Z =

bj/sb..

 

 

 

 

В приводимом ниже примере в качестве критерия значимости

используется і-критерий для

Р у * . . * , .

Если параметр ансамбля

pYXi-хь

равен

нулю, т. е. если равно нулю математическое

ожида-

ние Ргж.-жь, можно

показать, что оценка дисперсии Оух-хъ

будет

равна

(1 Р У Ж . - Х Ь ) / ^ Г Д Е

ѵ

число

наборов данных

минус

число членов, связанных корреляцией. Если имеет место корре­ ляция между Y и одной из переменных xj, то ѵ = п — 2; если при этом одна переменная xh была уже включена в модель, то v = п — 3 и т. д. Таким образом, статистика t имеет вид

PYXi-Хг,

t =

,

g

1

k

— ( 7 . 2 . 1 2 )

K l - P y v * Ä ) / v ] 1 / 2

Переменная, однажды включенная в модель, позднее может быть исключена из нее, если не будет больше давать значимый вклад в сумму квадратов.

Пример 7.2.1. Шаговая регрессия

Шаговая регрессионная процедура использовалась для опре­ деления членов в модели, описывающей работу шприц-машины (экструдера), которая устанавливает связь между напряжением


 

 

Определение

наилучшей

модели

 

467

сдвига,

температурой,

вязкостью

и

давлением:

 

V = ßo +

ßi (xi Xi) +

ß 2 2 x2) + ß 3

(s3 x3) +

8 ,

где (в

кодированных

единицах)

V — напряжение сдвига;

хх

вязкость; х2

— температура;

х3 — давление.

вид

 

Матрица

наблюдений (где Y

=

V)

имела

 

 

 

 

У

 

ЗС2

КЗ

 

 

 

 

 

3,98

1

 

0

0

 

 

 

 

 

—5,10

0

 

2

—1

 

 

 

 

 

- 1 , 0 3

—1

 

3

2

 

 

 

 

 

9,00

4

 

10

1

 

 

 

 

 

32,0

2

 

0

8

 

 

На первом этапе анализа, используя поочередно каждый отдельный член в качестве модели, получили следующее умень­ шение суммы квадратов:

Добав­

Уменьшение

 

Квадрат част­

Средний

ного коэффициен­

ляемый

суммы

квадрат

та корреляции

член

квадратов

 

 

Хі

28,9

28,9

0,271

х 2

23,5

23,5

0,028

722,0

722,0

0,857

Поскольку частный коэффициент корреляции для х3 оказался наибольшим, хг стала главной переменной. Значимость члена, содержащего х3, проверялась, согласно ^-критерию, с использо­ ванием формулы (7.2.12):

 

 

(0,857)1 / 2 (5 — 2 ) 1 / 2

 

 

 

 

 

4,24.

 

 

 

(1 — 0.857)1 /2

 

Из табл. В.З находим, что ï0 ,95 =

2,35 для трех степеней свободы;

таким образом,

переменная

х3

является значимой и

ее следует

включить

в модель.

 

 

 

Затем

сумма

квадратов

и частные коэффициенты

корреляции

для оставшихся двух членов были вычислены заново в предполо­

жении, что переменная х3 уже включена

в модель (с помощью

соответствующих

действий с матричными

элементами, как объяс­

нялось в разд. 5.3):

 

 

Добав­

Уменьшение

Средний

Квадрат част­

ного коэффици­

ляемый

суммы

квадрат

ента корреляции

член

квадратов

 

А 2

24

91,7

91,7

0,758

х2

68,7

68,7

0,057