Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 719

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

342

Глава 5

Согласно выражению (2.4.32), выборочный коэффициент корреля­ ции для переменных *) Хц равен

n

У, (хц — xj) (xik — xk)

-1 i=l

Pjk~

n-1

xsj x sxkx

 

так что

 

 

 

n

 

 

 

S

(хц Xj) (xih

— xh) = npjh.

(5.2.11)

3=1

Выражение (5.2.6) дает отношение дисперсий, которое нужно использовать в /'-критерии с заменой q + 1 на g степеней свободы, ибо в уравнении (5.2.10) Y не рассматривается в качестве пара­ метра:

 

 

 

 

 

 

 

 

 

у.i

b T G w / g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yi .

 

 

 

 

 

 

 

 

Далее

предположим,

что w =

I ; следовательно,

матрица

G w ,

введенная в связи с соотношением (5.1.10),

равна

G = x T Y .

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s\ _ Ът ( x T Y ) _ b T ( x r x b ) _ b T ab

 

 

 

 

 

 

 

 

 

S 2 -

 

 

OS—

 

 

O S 2 -

 

 

<7S2 -

 

 

 

 

 

 

 

 

 

y .

 

 

 

У.

 

 

1 .

 

4

 

Y-

 

 

 

 

 

 

 

 

 

I

 

 

 

I

 

 

I

 

 

 

I

 

 

 

 

Равенство (5.2.11)

можно

записать

в виде

ct,jk

=

npjk,

так

что

 

 

 

 

 

 

 

 

 

2

ъ)+

2

2

WftW*

 

 

 

 

 

 

 

 

 

 

 

= »

j=l

з=1 ft=l

 

 

 

 

( 5 - 2 - 1 2 )

 

 

 

 

 

y.г

 

 

4

yг.

 

 

 

 

 

 

Подставляя выражение (5.2.8) для bj в равенство (5.2.12),

получим

связь

между

 

Sg/s2 ^

и

tfi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Я

 

х

і

9

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s—

7g

(2,

с з ^ + 2

2 Р з

^

 

К ^

) .

(5.2.13)

 

 

 

Y

i

 

3=1

 

 

3=1 ft=l

 

 

 

 

 

 

 

 

 

Если

все

независимые

переменные

не

коррелированы,

то

Pjh

=

0,

с// s

 

äjj =

 

1/n

и

соотношение

(5.2.13)

сводится к

 

 

 

 

 

 

 

 

 

 

 

î .

1

2

*?•

 

 

 

 

 

. (5-2.14)

 

 

 

 

 

 

 

 

 

г г

 

з= і

 

 

 

 

 

 

 

 

 

1 )

Термин

«коэффициент

корреляции»

здесь

 

не совсем уместен,

так

к а к

независимые

переменные хц предполагаются

детерминированными.—


 

Линейные модели с

несколькими

переменными

343

(При q =

1 это равенство

совпадает с соотношением, полученным

в примере 4.3.1.) При трех и большем числе остаточных

степеней

свободы

уровень значимости

критерия

F (q, n — q — 1) ниже,

чем уровень значимости

критерия F (1, п — q — 1),

который

соответствует уровню значимости критерия t. Таким образом, существует некоторая вероятность, что часть или даже все коэф­ фициенты могут оказаться незначимыми согласно ^-критерию, но отношение дисперсий будет значимым согласно і^-критерию. Это объясняется тем, что значимое отношение дисперсий еще не предполагает значимость любого данного коэффициента, а указы­ вает лишь на существование по крайней мере одной линейной комбинации коэффициентов, значимо отличной от нуля. Если независимые переменные сильно коррелированы и pjh > 0, отно­ шение дисперсий может оказаться очень большим по сравнению со значениями t).

Пример 5.2.1. Оценивание без повторных измерений и без

правильного плана эксперимента 1 )

Основной проблемой, с которой постоянно сталкиваются инже­ неры, является коррозия. По измерениям электрического сопро­ тивления образцов определялась скорость коррозии всасываю­ щих коллекторов двух печных подающих насосов на заводе терми­ ческого крекинга нефти. Образцы были изготовлены из проволоки диаметром 40 мил (1 мил = 0,0254 мм), содержащей 5% Cr и 0,5 % Mo. Наряду со скоростью коррозии проводились измерения: 1) содержания серы в нефти, 2) температуры образца, 3) темпера­ туры в двух крекинговых змеевиках и 4) скорости расхода сырья. Эти данные приведены в табл. П.5.2.1а. Согласно оценке, диаметр проволоки мог измеряться с точностью ~ 4 микродюймов.

Основываясь на приведенных данных, требуется оценить пара­ метры линейной модели, включающей все пять переменных, пере­ численных в таблице. Дл я каждой из переменных нужно опреде­ лить, нельзя ли исключить ее из модели, проверяя, не может ли связанный с ней коэффициент равняться нулю. Отвечают ли эти данные предположениям, используемым при оценивании (разд. 4.2)?

Решение

Так как никаких повторных измерений не производилось, невозможно получить оценку экспериментальной ошибки и с ее помощью проверить, является ли линейная модель правильной. Диапазон температур слишком узок. Поэтому может оказаться, что

х ) В

примере 5.2.1 в связи со сложностью пересчета сохранена амери­

к а н с к а я

система единиц; дл я ориентировки указаны переводные коэффициен­

ты Поим. ое.д.


344

Глава 5

Таблица П.5.2.1а

Скорость коррозии Y,

День дюйм/год (5% Сг, 0,5% Mo)

Полное

содержание серы в исход­ ном сырье xi

Скорость

Темпера­

Темпера­

Темпера­

потока вблизи

тура Ж4

тура хь в

образца Х2,

тура х з ,

в крекин­

крекинго­

баррель/день

вблизи

говом

вом

(1 баррель =

образца

змеевике

змеевике

= 159 дмЗ)

F

1, F

2, F

1

0,117

0,041

16,9

753

922

885

2

0,107

0,041

17,0

748

925

885.

3

0,088

0,040

17,1

749

925

886

4

0,077

0,041

16,6

747

925

887

5

0,091

0,042

17,0

745

934

895

6

0,040

0,008

17,5

743

940

905

7

0,048

0,007

35,0

762

936

9Ü4

8

0,022

0,008

34,5

760

935

895

9

0,077

0,041

33,8

752

928

887

10

0,121

0,041

33,6

752

928

887

11

0,143

0,044

33,2

749

930

887

температура мало влияет на скорость коррозии; если же она

влияет,

это может

привести

к

плохо

обусловленной

матрице

а = х т х . Другим

недостатком

этих данных

является

то, что они

включают лишь два уровня содержания

серы и скорости

расхода

сырья. Тем не менее допустим, что для подгонки к этим

данным

предполагается

использовать

модель

ц = ß 0 +

ßi-ri +

ß2 ^2 +

- j -

ß 3 x 3

+ ß 4 x 4

+

ß5 x5 ,

где смысл обозначений xk

указан

в табли­

це

П.5.2.la.

Результаты регрессионного

анализа

этой

задачи

 

 

 

 

 

 

 

 

 

 

 

Таблица

П.5.2.16

 

 

1,10-Юі

3,54

10-1 2 , 7 2 - Ю 2

8 , 2 6 - Ю 3

1,02-10*

9,80-103

 

 

3 , 5 4 - Ю - і

1,38 10-2 8,35 - Юі

2 , 6 5 - Ю 2

3 , 2 8 - Ю 2

3,14-102

 

 

2 , 7 2 - Ю 2

8,35

10°

7.52103

2,04-105

2,53-105 2,42-105

 

 

8,26-10»

2,65

Ю 2

2,04-105

6,20-10«

7,68-10«

7,36-10«

 

 

1,02-10*

3,28

Ю 2

2.53105

7,68-10в

9 , 5 1 - Ю 6

9,11-10«

 

 

9,80-103

3,14

102

2,42-105

7,36-Юв

9,11-10«

8,73-10«

 

 

5,41-10*- -9,88-103

1,69-101 -

-3,10 •101

_ 4 , б 5 - 1 0 і

1,38-101

 

-9,88-103 3,08-103—1,89.100

4,87 -100

4,49-100

2,22-100

с =

 

1,69-Юі

- -1,89-10° 8,00-10-3-

-1,12 • Ю - 2

- 1 , 8 2 - 1 0 - 2

9,35 - Ю - з

-3,10-101

4,87-100 —1,12-10-2

2,06 • Ю - 2

2,70-10-2- -1,06-10-2

 

-4,65-101

4,49-100 —1,82-10-2

2,70 • Ю - 2

6,38-10-2 -3,68.10~2

 

 

1,38-101

2,22-100

9,35 - Ю - з

-1,06 • Ю - 2

_ 3 t 6 8 - 1 0 - 2

3 , 1 4 - Ю 2

 

 

 

 

 

'9,31.10-1 >

 

 

0,6751'

 

 

 

 

 

 

 

 

3,49-10-2

 

 

2,3064

 

 

 

 

 

 

G =

2,27-101

 

Ь =

0,0012

 

 

 

 

 

 

6,99-102

 

—0,0007

 

 

 

 

 

 

 

 

8,64-102

 

 

-0,0021

 

 

 

 

 

 

 

 

,8,28-102

 

 

0,0020,

 

 

 


Линейные

модели с несколькими

переменными

345

приведены в табл. П.5.2.16 (ради экономии места здесь числа округлены). Точечные оценки параметров ß Ä , индивидуальные доверительные интервалы для ßf t и доверительные интервалы для

 

 

 

 

Таблица

П.5,2.1в

Доверительные интервалы для ß^

 

 

ß 0

=

0,675+/—15,562

 

 

ß i =

2 , 3 0 6 + / -

3,714

 

 

ß 2

=

0,001+/—

0,005

 

 

ß 3

= — 0 , 0 0 0 + / -

0,009

 

 

ß 4

= — 0 , 0 0 2 + / -

0,016

 

 

ß 5

=

0 , 0 0 2 + / -

0,011

 

 

 

 

 

 

Разность между

Доверительные интервалы для тъ

предсказанным

и экспериментальным

 

 

 

 

значениями, %

T i l

:

= 0,098+/ - -0,040

15,9

 

42 =

= 0,095+/ - -0,027

10,8

 

43 == 0,094+/ - -0,024

—7,4

 

Т|4

== 0,099+/ - -0,029

—29,4

 

45

== 0,100+/ - -0,062

— 10,7

 

46 =

= 0,031+/ - -0,060

20,3

 

47

=

= 0,044+/ - -0,059

7,3

 

48 =

= 0,031+/ - -0,061

—42,2

 

49 =

= 0,110+/ - -0,035

- 4 3 , 8

 

410 =

= 0,109+/ - -0,028

9,7

 

411 =

= 0,114+/ - -0,039

19,8

 

r\k (при и>і = 1), записанные в табл. П.5.2.1B, показывают, что данный эксперимент не позволяет принять решение о включении в предполагаемую модель рассмотренных членов.

 

 

 

 

Таблица

П.5.2.1г

 

 

Число

Сумма

Средний

Отношение

Источник рассеяния

степеней

квадратов

квадрат

дисперсий

 

 

свободы V

 

 

 

 

Исключается

х0

1

8,416-10-6

8,416-10-в 1,243-10-2

(свободный член)

Исключается

ху

1

1,724-Ю-з

1,724-Ю-з 2,547-100

Исключается

хг

1

1,850-10-4

1,850-10-*

2 , 7 3 3 - Ю - і

Исключается

х3

1

2,246-10-5

2,246-10-5 3,319-10-2

Исключается

ж4

1

7,281-10-5

7,281-10-5 1,075-Ю-і

Исключается

хь

1

1,328-10-4

1,328-10-4

1,962-Ю-і


346

Глава 5

Если последовательно составлять отношения дисперсий, опи­ санные в начале этого подраздела, чтобы проверить для каждого из параметров ßf t , может ли он равняться нулю, получатся результаты, приведенные в табл. П.5.2.1г. (Символом SS обозна­ чена разность между суммами квадратов с ßf c = 0 и ßf e ф. 0; «исключается xk» означает, что проверяется гипотеза о том, что ßfe = 0.) Так как для а = 0,05 статистика Fi-a (1, п — q — 1) =

=/^0,95 (1, 5) = 6,61, каждая гипотеза о том, что ßf e = 0, в отдель­

ности может бытьпринята. Совершенно ясно, что, как ни услож­ нять рассмотрение этих данных, на песке дом не построишь!

Без дополнительной информации трудно сказать, удовлетво­ ряют ли эти экспериментальные данные предположениям разде­ ла 4.2. Например, температура может оказаться случайной вели­ чиной, а не поддерживаться на заданных уровнях. Если темпе­ ратуру не включать в число переменных и, кроме того, пренебречь малыми изменениями содержания серы и скорости расхода, то имеющиеся повторные значения скорости коррозии можно исполь­ зовать в качестве меры экспериментальной ошибки, которая, очевидно, довольно велика. Наконец, так как измерения прово­ дились последовательно во времени и с одной и той же проволокой,

эти

данные могут относиться к типу,

описанному в разд. 4.6,

т. е.

включать ошибки, не являющиеся

независимыми. Резюми­

руя, можно сказать, что на этом примере хорошо видны трудности извлечения информации из экспериментов, выполненных без должного внимания к вопросам эффективного статистического планирования экспериментов. Подобные проблемы возникают при анализе исторических данных.

5.3. Д И С П Е Р С И О Н Н Ы Й А Н А Л И З

Дисперсионный анализ для модели с несколькими независимы­ ми переменными является прямым обобщением анализа, ранее описанного в разд. 4.3. Табл. 5.3.1, построенная для модели (5.1.1), аналогична табл. 4.3.2 для простой линейной регрессии. Вычис­ ляется сумма квадратов остатков между Yt и Yt, а также сумма квадратов отклонений Yt от итогового среднего Y. Таблица, соответствующая табл. 4.3.1, здесь не показана, хотя ее нетрудно составить как обобщение двухпараметрического случая. В матрич­ ных обозначениях разложение суммы квадратов, «обусловленной

п

Ь», или 2 wi (Yi — О)2» имеет вид

п

2 Witt = Y T w Y = (xb)T w (xb) = b r (xT wx) b = b r (xT wY) = b T G w .