Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 771

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Глава 7

ОП Р Е Д Е Л Е Н И Е Н А И Л У Ч Ш Е Й МОДЕЛИ

Вгл. 4—6 основное внимание уделялось технике получения точечных и интервальных оценок параметров и проверке гипотездля данной эмпирической модели. В этой главе рассматривается вопрос о том, как из нескольких возможных моделей выбрать наилучшую, наиболее подходящую модель, так как именно этот вопрос для исследователя является главным. Например, если требуется осуществить подгонку полинома по некоторым экспе­ риментальным данным просто для того, чтобы использовать эти данные в машинной программе в виде функции (а не в виде таблиц), естественно задать вопрос, сколько нужно взять членов в поли­ номе. В других случаях эмпирическая модель содержит слишком много независимых переменных и тогда исследователю важно выделить наиболее существенные переменные и устранить измодели остальные менее важные переменные. В гл. 8 описывается взаимная связь между планированием экспериментов, построением моделей и процедурой оценивания; здесь же будет показано, как нужно анализировать данные о некотором процессе, полученные, возможно, в неспланированном эксперименте, когда решение провести анализ и оценивание было принято уже после завершения эксперимента. Обсуждение же методов экспериментирования^ позволяющих эффективно различить модели, пока отложим до разд. 8.5.

Итак, цель состоит в том, чтобы выбрать наилучшую из нескольких возможных или предполагаемых моделей. Для линей­ ных моделей, описанных в гл. 5, неразумно с помощью вычисли­ тельной машины рассчитывать все возможные уравнения регрессии, полученные исключением из модели или добавлением последова­ тельных групп переменных, даже если пренебречь возможными нелинейными преобразованиями. Вместо этого исследователь рабо­ тает с ограниченным числом различных моделей и выбирает наилучшую среди них, используя один или несколько системати­ ческих методов. В качестве критериев, позволяющих сделать этот выбор, обычно используются по отдельности или в некоторой комбинации следующие:

1. Наименьшее число коэффициентов, совместимое с разумной ошибкой.


454

Глава 7

2.Простейшая форма, совместимая с разумной ошибкой.

3.Разумные физические основания («вытекает из некоторого закона»).

4.Минимальная сумма квадратов отклонений между предска­

занными и эмпирическими значениями.

5. Минимальная дисперсия s\t (sy. не является несмещенной

оценкой дисперсии, ибо содержит некоторую систематическую составляющую, которая возникает из-за различия между истин­ ной функцией и ее оценкой; см. разд. 5.2.2).

Чтобы уметь строить подходящую модель, прежде всего следует ознакомиться с анализом остатков, который является первым этапом в любой программе оценивания моделей. Затем будет описан шаговый регрессионный метод для линейных моде­ лей, представляющий собой систематический метод оценивания, при котором одновременно выделяются существенные независи­ мые переменные. Наконец, будут рассмотрены некоторые крнте

рии,

с

помощью

которых предлагается различать между собой

две

или

большее

число моделей.

7.1. А Н А Л И З О С Т А Т К О В

В разд. 4.3 и 5.3 использовался дисперсионный анализ для того, чтобы установить, адекватно ли некоторая линейная модель описывает экспериментальные данные. Однако критерий отноше­ ния дисперсий, при котором проверяется, превышает ли отноше­ ние дисперсий sj/sl величину F^a, показывает лишь то, что под­ гонка модели в целом является удовлетворительной. Но даже если модель удовлетворяет .//-критерию, все еще могут иметь место существенные расхождения. Такого рода расхождения часто можно заметить с помощью анализа остатков, т. е. исследуя набор отклонений между экспериментальными и предсказанными значениями зависимой переменной, У,- — Yt = Et.

В регрессионном анализе, как уже отмечалось, используется ряд основных предположений, таких, как независимость нена­ блюдаемых ошибок 8 , постоянство дисперсии и нормальный закон распределения для е. Если модель адекватно описывает данные, то остатки должны обладать такими характеристиками, которые согласуются или по крайней мере не противоречат исходным основным предположениям. Таким образом, анализ остатков является некоторым способом проверки того, что_ то или иное предположение, лежащее в основе регрессионного анализа, не нарушено. Например, если модель подогнана хорошо, остатки должны быть случайным образом распределены относительно значений Y, предсказываемых уравнением регрессии. Систематиче­ ские отклонения от закона случайности указывают на то, что


Определение наилучшей модели 455

модель неудовлетворительна; исследование диаграмм, построен­ ных для остатков, может дать ключ к тому, как улучшить модель.

Графики зависимости остатков от Yt, xt или времени или график распределения остатков по величине предлагалось исполь­

зовать при анализе

остатков

[15]. Д л я

этой цели можно иссле­

довать

знаки остатков

( + или —) и

суммы

знаков

[6]. Можно

также

 

использовать

и

многие из

непараметрических

критериев,

описанных в разд. 3.7.

В

следующем

примере (взятом

из рабо­

ты [5])

представлены пять

характерных

черт

анализа

остатков:

1.

Обнаружение

выброса

(резко

выделяющегося

 

значения,

экстремального

наблюдения).

 

 

 

 

 

 

 

2.

Обнаружение

некоторого тренда

в остатках.

 

 

3.

Обнаружение

резкого

сдвига уровня

процесса.

 

4.

Обнаружение изменений в дисперсии ошибки (обычно пред­

полагается, что

она

постоянна).

 

 

 

 

 

 

5.

Исследование остатков для того, чтобы проверить, описы­

ваются ли они нормальным распределением.

 

 

При

использовании

остатков

для

 

подтверждения

адекват­

ности модели следует помнить о том, что по мере того, как все новые независимые переменные вводятся в эту модель, остатки

'• становятся все менее информативными. Каждый остаток пред­ ставляет собой по существу некоторое взвешенное среднее оши­ бок в; чем больше несущественных независимых переменных х добавляется к модели, тем более похожими друг на друга становят­ ся остатки.

Проводя анализ остатков, исследователь быстро обнаружит, что графическое представление остатков значительно облегчает принятие решения, ибо единственное отклонение, например одно резко выделяющееся значение, может воздействовать сразу на несколько численных критериев.

Пример 7.1.1. Анализ остатков

Были получены имитированные данные для следующей модели:

Y, =

10,8

+

0,А0хі — 0,20^2 +

е,,

 

в которой переменные хх

и хг принимали целые

значения 1, 2,

3,

4, 5 и 6, а ошибки е{

были

случайным образом

распределены

по

нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной 1. Заметим, что модель линейна, а повторные

измерения

не имитировались. Эти данные приведены в табли­

це П.7.1.1а;

числа в круглых скобках над каждым значением Yt

указывают порядок, в котором вычислялись эти значения. Каждой ячейке соответствует некоторый остаток.


456

 

 

 

Глава

7

 

 

 

 

 

 

 

 

 

 

Таблица

П.7.1.1а

\ .

XI

 

 

 

 

 

 

Среднее

 

1

2

3

4

5

6

Сумма

*2

значение

^\

 

 

 

 

 

 

 

1

(28)

Я

(1)

(31)

(36)

(9)

70,4

11,73

10,3

11,3

13,0

12,0

10,6

13,2

 

{ 6 >

(13)

 

(25)

(24)

(19)

 

 

2

10,4

11,5

11,9

13,3

14,2

72,9

12,15

11,6

 

(8)

(30)

(15)

(5)

(34)

(16)

 

 

3

9,7

12,2

10,9

11,8

12,1

12,8

69,5

11,58

 

(27)

(17)

(29)

(12)

(7)

(18)

 

 

4

11,4

11,5

11,0

11,5

11,3

14,5

71,2

11,87

 

(32)

(33)

(22)

(35)

( И )

(10)

 

 

5

10,3

10,6

10,0

11,3

11,4

12,8

66,4

11,07

 

(20)

(2)

(14)

(23)

(21)

(26)

 

 

6

9,6

9,4

11,8

10,2

12,7

12,4

66,1

11,02

Сумма

62,9

65,4

68,2

68,7

71,4

79,9

416,5

 

Среднее

10,48

10,90

11,37

11,45

11,90

13,32

 

11,57

значение

 

 

 

 

 

 

 

Метод линейного оценивания, описанный в

разд.

5.1, для

этих данных

дает

следующую оценку уравнения

регрессии:

 

Y

= 10,52

+ 0,49а;! — 0,19ж2 ;

 

 

(а)

результаты дисперсионного

анализа

представлены

в

табли­

це П.7.1.16.

 

 

 

 

 

 

 

 

 

 

 

Таблица

П.7.1.16

 

 

Дисперсионный анализ

 

 

 

Источник

 

Число

Сумма

Средний

Отношение

рассеяния

степеней

квадратов

квадрат

дисперсий

 

 

свободы V

 

 

 

 

 

Хі

 

1

25,51

25,51

37,5

 

 

 

1

3,68

3,68

5,4

 

Отклонения

от

33

24,05

0,73

 

 

 

линии

рег­

 

 

 

 

 

 

рессии

 

 

 

 

 

 

 

Общий

35


 

Определение наилучшей

модели

 

 

457

 

Линейный член при

будет значимым при а

=

0,001,

тогда

как

линейный член при х2 будет значимым при а

=

0,025.

Заме­

тим, что величина s? оказалась равной 0,73, а

а 2

= 1.

 

 

О б н а р у ж е н и е

в ы б р о с а .

Если значение 9,6 в ячейке

(хі

= 1, х2 = 6) заменить на 13,9 (на 3,9 стандартных

отклонений

большее чем 10), то новый дисперсионный анализ покажет, что пере­ менная х2 не является значимой (табл. П.7.1.1в). Средний квадрат

 

 

 

 

 

Таблица

П.7.1.1в

Источник

 

Число

 

Сумма

Средний

Отношение

рассеяния

 

степеней

V

квадратов

квадрат

дисперсий

 

свободы

 

 

1

 

16,01

16,01

14,0

Отклонения

от

1

 

0,75

0,75

33

 

37,51

1,14

 

линии

рег­

 

 

 

 

 

рессии

 

 

 

 

 

 

Общий

 

35

 

 

 

 

для остатков s2, все еще будет близок к единице, а оценка уравне­ ния регрессии будет иметь вид Y = 10,32 + 0,39^!. На фигу­ ре П.7.1.1а показан график остатков, построенный с помощью этого уравнения. Точка в кружке представляет собой выброс.

ю

m

20

25

35

Порядковый номер

 

Ф и г . П.7.1.1а.

 

Если бы эти данные были

получены

в

реальном эксперименте,

то экспериментальные условия, при которых проводилось это

измерение,

следовало бы проверить

вновь.

О б н а р у ж е н и е

т р е н д а .

Так как исследуемый про­

цесс может

претерпевать

изменения с течением времени, экспери-