Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 777
Скачиваний: 2
Определение |
наилучшей |
модели |
473 |
усложнять модель, осуществлялась подгонка линейных уравне ний регрессии, содержащих члены х, х2 и х3. Для лучшего согла сия вблизи значения х == 61 к полиному была добавлена пере менная 1/(х — 60). Член, содержащий эту переменную, имеет большое значение вблизи ее полюса и пренебрежимо ^мал при больших X.
4000 i |
, |
• данные;
Для того чтобы сделать члены уравнения регрессии^величинами приблизительно одного порядка, в независимые переменные были введены масштабные множители
Хі = x-Ю-2,
х2 = x2 -Ю-4 ,
х3 = х 3 Л 0 ~ в ,
у * = Г . Ю - 3 .
В табл. П.7.4.1а приведены регрессионные коэффициенты для четырех линейных моделей, полученные методом наименьших квадратов с іо, == 1.
Определение наилучшей модели |
475 |
|
pt /(x — 60). Для определения наилучшей из этих двух моделей
воспользуемся критерием Внльямса — Клута.
В табл. П.7.4.ІВ приведены данные и результаты расчетов, необходимые для вычисления по (7.4.2). На фиг. П.7.4.16 показан
Таблица U.7.4.1«
|
|
Р а с ч е ты |
для критерия |
Внльямса — Клута |
|
У |
|
|
Ys — І"і |
|
2 = У _ 1 ( У 1 + У * ) |
0 |
—19 |
118 |
137 |
50 |
—50 |
50 |
143 |
64 |
—79 |
103 |
—53 |
100 |
126 |
96 |
- 30 |
111 |
—11 |
150 |
110 |
69 |
—41 |
90 |
40 |
180 |
113 |
88 |
—25 |
100 |
80 |
210 |
136 |
122 |
—14 |
129 |
81 |
250 |
186 |
182 |
—4 |
184 |
66 |
290 |
257 |
261 |
4 |
259 |
31 |
340 |
334 |
341 |
7 |
337 |
3 |
420 |
465 |
475 |
10 |
470 |
-50 |
520 |
647 |
657 |
10 |
652 |
—132 |
670 |
833 |
841 |
8 |
837 |
— 167 |
910 |
835 |
888 |
48 |
859 |
51 |
1200 |
1305 |
1304 |
—1 |
1305 |
—105 |
1600 |
1593 |
1587 |
—6 |
1590 |
10 |
2100 |
1984 |
1971 |
—13 |
1978 |
122 |
2500 |
2404 |
2389 |
—15 |
2397 |
103 |
2900 |
2847 |
2834 |
—13 |
2840 |
60 |
3300 |
3308 |
3304 |
—4 |
3306 |
—6 |
3700 |
3782 |
3796 |
14 |
3789 |
- 89 |
график зависимости Y — V 2 (Y\ -\- Y^) |
от Y2 — l ' i для всех |
значений Z, исключая первую строку табл. П.7.4.1в, В которой |
|
появилось отрицательное значение Y\. |
Угловой коэффициент |
линии наилучшей подгонки, проходящей через начало координат, вычисленный по формуле (4.3.7а), оказался равным —0,473.
Однако Ѵаг {b} « 8000/13 |
104 = |
0,61 и доверительный интервал |
|
для ß с уровнем значимости а = |
0,05 (*і_а /2 = |
2,13 для 15 степе |
|
ней свободы) имеет вид |
—2,13 ^ ß < 1,19, |
что не позволяет |
|
заключить, что модель 1 |
сколько-нибудь лучше, чем модель 2. |
На фиг. П . 7 . 4 . ІВ изображен график остатков для модели 1. Хотя нельзя заметить никакого продолжительного тренда, остатки все же не являются случайно распределенными. Можно заметить ряд непродолжительных трендов для величин стока 90 ч- 125 м3 /с и 160 -f- 200 мЗ/с. Наличие таких трендов не означает непримени мость модели, но указывает на то, что эту модель можно несколько улучшить.
200 r
Определение |
наилучшей |
модели |
477 |
7.5. С Р А В Н Е Н И Е Н Е С К О Л Ь К И Х У Р А В Н Е Н И Й |
Р Е Г Р Е С С И И |
||
Д ля того чтобы можно было одновременно сравнивать несколь |
|||
ко линейных или нелинейных |
(по коэффициентам) |
оценок уравне |
ний регрессии, Уилкс [15] предложил некоторый критерий, в кото ром все уравнения регрессии рассматриваются на равных основа ниях. Этот критерий сформулирован на основе однородности оста точных сумм квадратов для различных уравнений регрессии. Вильяме [16] дал ясное описание критерия Уилкса, а также указал, что этот метод является по существу приближенным, так как суммы квадратов для уравнений, которые не являются «пра вильными», содержат дополнительную систематическую компо ненту, отсутствующую в «правильном» уравнении.
Напомним, что для одной оценки уравнения регрессии можно осуществить дисперсионный анализ (табл. 5.3.1 и 5.3.2), который приводит к F-критерию как общему критерию значимости регрес сии. F-критерий можно использовать и для сравнения различных оценок уравнений регрессии, если объединить их в линейную комбинацию следующим образом. Пусть различные уравнения
регрессии, |
подлежащие сравнению, обозначены как Y t , У2> |
• • • |
|||||||||
. . ., Yp, |
a |
Y* представляет собой линейную комбинацию |
этих |
||||||||
уравнений |
регрессии: |
|
|
|
|
|
|
||||
|
|
|
|
у * = |
Ь * у 1 + г |
, * у 2 + |
. . . +b*Yp, |
|
(7.5.1) |
||
где |
коэффициенты |
Ь% выбираются |
так, чтобы каждое уравнение |
||||||||
регрессии |
вносило вклад в Y* в соответствии с его |
пригодностью |
|||||||||
в качестве оценки Y*. |
Для удобства коэффициенты Ь% нормируют- |
||||||||||
|
|
|
|
р |
b% — 1. |
|
|
|
|
|
|
ся |
так, чтобы |
51 |
По-видимому, |
разумно |
ограничиться |
||||||
значениями |
Р£ |
в |
интервале |
0 ^ |
ß | ^ 1. |
Введем |
величину |
|
|||
|
|
|
|
|
|
|
р |
|
|
|
|
|
|
|
|
|
|
Y = j2lYb- |
|
(7-5-2) |
Предположим, что величина Уц, где индекс і указывает на то, что предсказанное значение Y относится к і-му набору данных, определяемому у'-м уравнением регрессии, рассматривается в каче стве независимой переменной, и каждой наблюдаемой зависимой переменной Yt (или Yt, если проводились повторные наблюдения) соответствует один такой набор Ytj. Данный критерий позволяет определить, дает ли составная переменная Y* значимое
улучшение по сравнению со средним предсказанием Y. В табли це 7.5.1 дана сводка расчетов, необходимых для проведения дис персионного анализа. Если отношение дисперсий s\ls\ с р — 1