Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 681
Скачиваний: 2
252 |
|
Глава 4 |
|
|
|
|
|
|
|
|
Таблица |
П.4.3.1а |
|
Набор |
X |
Ошибка в |
|
Наблюдаемые |
||
данных |
л |
значения У |
||||
|
|
|||||
1 |
10,00 |
0,05 |
12,00 |
|
12,05 |
|
2 |
10,00 |
- 0 , 5 2 |
12,00 |
|
11,48 |
|
3 |
20,00 |
—1,41 |
14,00 |
|
12.59 |
|
4 |
20,00 |
1,82 |
14,00 |
|
15,82 |
|
5 |
30,00 |
1,35 |
16,00 |
|
17,35 |
|
6 |
30,00 |
0,42 |
16,00 |
|
16,42 |
|
7 |
40,00 |
- 1 , 7 6 |
18,00 |
|
16,24 |
|
8 |
40,00 |
—0,96 |
18,00 |
|
17,04 |
|
9 |
50,00 |
0,56 |
20,00 |
|
20,56 |
|
10 |
50,00 |
—0,72 |
20,00 |
|
19,28 |
на чертеже оценку линии регрессии, доверительные пределы около этой линии и выборочные средние Yt при каждом xf, 4) провести дисперсионный анализ.
Решение
Пусть уровень значимости а равен 0,05. Вычисления будут достаточно подробны, чтобы можно было проследить за каждым шагом (табл. П.4.3.16).
УІРІУІІХІ — Х) |
2-187,3 = 0,1873, |
^РІІХІ-Ъ)* |
2.1000 |
Y = 15,89 + 0,1873 (х—30) = 10,26 + 0,1873z,
n
і=1 |
|
t = l |
i = l |
п — 2 |
|
i = i |
i = l |
= 4 [ 2 . 1 2 9 8 , 9 8 - i ^ ^ - i ^ ^ ] = l . 5,02 = 1,67,
n Pi
s* = i = l 3 =1 |
• 6,95 = 1,39. |
j 2= i |
w - n |
Линейные |
модели с одной |
переменной |
253 |
Заметим, что чрезмерно большая ошибка округления может серьезно нарушить численные результаты, если при вычислениях не сохранять все значащие цифры. Например, если значения Yt
|
|
|
|
|
|
|
|
|
|
|
|
Таблица |
П.4.3.16 |
|
|
|
Pi |
|
|
|
|
|
|
|
|
|
|
|
Рі |
_ |
J=l |
(x |
t |
- X) |
Y |
t |
(x |
t |
- |
x) |
y? |
|
|
|
|
-1 г |
|||||||||
10 |
2 |
|
11,765 |
|
|
—20 |
—235,3 |
400 |
138,41 |
||||
20 |
2 |
|
14,215 |
|
|
- 1 0 |
- 1 4 2 , 2 |
100 |
201,78 |
||||
30 |
2 |
|
16,885 |
|
|
0 |
|
|
|
|
0 |
0 |
285,10 |
40 |
2 |
|
16,640 |
|
|
10 |
|
|
166,4 |
100 |
276,89 |
||
50 |
2 |
|
19,920 |
|
|
20 |
|
|
398,4 |
400 |
396,80 |
||
Сумма |
10 |
|
79,425 |
|
|
|
|
|
187,3 |
1000 |
1298,98 |
округляются не до пятой, а до четвертой значащей цифры, то сум
ма квадратов отклонений будет неверна уже в третьей |
значащей |
||||
цифре. |
|
отношение дисперсий sf/sl = 1,20 |
|
|
|
Можно |
составить |
и |
приме |
||
нить F-критерий, чтобы узнать, значимо ли различаются |
средние |
||||
квадраты. |
Так как |
для а = 0,05 из табл. |
В.4 приложения В |
||
F (3,5) = |
5,41, можно утверждать, что средние квадраты |
незначи |
|||
мо отличаются друг |
от друга и линейная |
модель п = |
|
4- ßjx |
адекватно описывает представленные данные. Затем средние квад раты объединяются по формуле (4.3.15):
|
|
5,02 4 |
6,95 |
1,50. |
|
|
|
|
8 |
|
|
||
|
|
|
|
|
|
|
Из выражения (4.3.10), в котором в качестве оценки oY |
исполь |
|||||
зован объединенный средний квадрат sy. , получаем оценку |
диспер |
|||||
сии коэффициента Ь0: |
|
|
|
|
|
|
Ѵаг{60 }: |
5 |
|
і і ^ _ 0 |
5 |
|
|
|
|
|
10 - u |
' 10 - |
|
|
|
|
і=1 |
|
|
|
|
Из равенства (4.3.11) |
имеем |
|
|
|
|
|
V a r { 6 t ) = |
5 |
2 |
_ = ^ g : |
: 7,5 - Ю - 4 . |
|
|
|
2 |
Pi(xi—x)2 |
|
|
|
|
|
i=i |
|
|
|
|
|
254 |
Глава |
4 |
|
|
|
|
Кроме того, если Y — Ь'0-\-ЬіХ, из выражения |
(4.3.18) |
(см. далее) |
||||
вычисляем |
|
|
|
|
|
|
V a r î & ; } = l , 5 0 [ l + g ] = 0 ' 8 2 5 - |
|
|
||||
4.3.4. Доверительный |
интервал |
и доверительная |
область |
|||
Так как оценки коэффициентов модели Ь0 |
и Ъх |
линейно входят |
||||
в выражение для оценки линии |
регрессии |
Y |
= bo + |
(х — х) |
||
и являются независимыми |
случайными переменными, |
корреляцион |
||||
ные члены исчезают и поэтому |
|
|
|
|
|
|
Var {У;} = Ѵаг{Ь0} + (xt - |
xf Var |
: |
|
|
|
|
|
1 |
(Xi—X)* |
|
|
(4.3.16) |
|
|
|
|
|
|
|
|
|
|
i =l |
|
|
|
|
Заметим, что дисперсия минимальна при xt = |
х. |
|
|
Новое единичное измерение Y, Yfj, в точке xt будет распреде лено относительно r\t с дисперсией Oy. независимо от значения Yi, так что если отклонение У*,- от предсказанной линии регрессии Yi равно (Y*j — Yt), то дисперсия этого отклонения будет равна
oh = Var {Yfj—У;} = Var {Yt}} + Var {Уг } =
1 |
, |
(Xi—~X)2 |
(4.3.17) |
|
|
|
i=l i=l
Если бы модель с самого начала выбиралась в форме т] =
— ßo + ßi^' т о оценка линии регрессии имела бы вид У = Ь'0-{-
+ ЪІХ |
= (b0 — bix) + |
btx, т. e. b'0 — b0 — bYx. |
Дисперсия b'0 |
равна |
Ѵаг{Ь0 } + x2 Var - f^}, или |
|
|
|
Ѵаг{Ь;} = |
а У г |
(4.3.18) |
2 Pi SPJ(*|-Ï)*
a Var{&j} по-прежнему определяется формулой (4.3.11). Учитывая, что оценка bo распределена относительно ßo по нор
мальному закону, для получения доверительного интервала для
|
Линейные |
модели с одной |
переменной |
|
255 |
||
ßo |
можно использовать |
безразмерную |
f-статистику |
Стьюдента |
|||
|
^ • J ü z J o . . . |
|
\ - ß ° , ѵ |
= 2 Р г - 2 , |
(4.3.19) |
||
|
|
1 |
і=1 |
|
|
|
|
которая подчиняется ^-распределению |
с 2 |
— 2 степенями сво |
|||||
боды. Очевидно, следует |
использовать |
объединенную |
оценку |
||||
sy. |
из соотношения (4.3.15), так как она служит лучшей |
оценкой |
величины cry., чем по отдельности si или s2.. Если повторных изме рений Y не производилось, то невозможно вычислить si и в после дующих соотношениях нужно заменить sy. на величину s2, а число степеней свободы — на число степеней свободы s2, т. е. п — 2.
Величина sy. |
называется |
оценкой стандартной ошибки. |
Довери |
|
тельный интервал для ß 0 |
имеет вид |
|
||
|
Ь0 — 11 _a/ 2Sbo < ß0 < |
b0 + 1 1 _a/2sbo. |
(4.3.20) |
|
Аналогично для ßi |
|
|
|
|
h — ßi |
fei |
— ßi |
, V =2P* - 2 > |
( 4 - 3 - 2 1 ) |
|
|
|
||
|
- i=l |
|
|
|
|
Ьі — * і - а / 2 с Ь ! < ßi < |
bi + «i-«/2Sbi- |
(4.3.22) |
100 (1 — а) %-ный доверительный интервал для математического ожидания величины Y} при заданном значении xt 'определяется подобным образом:
t = ^ ~ - |
ѵ = 2 р , - 2 , |
(4.3.23) |
уі=1
Y-*i_a/2Sy |
< м < t + t i - a / 2 s f , |
(4.3.24) |
где sf вычисляется с помощью соотношения (4.3.16), в котором дис персия Oy заменена на sy. . Наконец, если выбрать некоторое дополнительное значение xt, например х*, то доверительный интер вал для математического ожидания дополнительного измерения Yfj будет иметь вид [используется соотношение (4.3.17)]
Yt |
- *i _ a/2*D<Tl* < Yt + h-a/2SD. |
(4.3.25) |
Чтобы найти |
доверительный интервал для среднего Ym по m |
измерениям при дополнительном значении х, нужно заменить пер вый член в квадратных скобках равенства (4.3.17) на величину 1/т, так как дисперсия Ym равна Oy Im.
2 5 6 |
Глава 4 |
Интерпретация всех этих доверительных интервалов такая же, какая была дана в разд. 3.3, а именно что со 100 (1 — а) %-ной надежностью (доверительной вероятностью) рассчитанный интер вал содержит соответствующие величины ß 0 , р\ или и, если выпол нены предположения разд. 4.2. Доверительные пределы для и, определяемые неравенствами (4.3.24), можно нанести на схему вместе с экспериментальными данными, как показано на фиг. 4.3.2.
I |
I I |
I I I |
I I |
I |
I |
I I I I I |
I I |
I |
I I |
|
|
|
X |
|
|
|
X |
|
|
Ф и г . 4.3.2. Оценка |
линии |
регрессии |
Y |
— Ъ0 4- bt |
(х — х) и доверительный |
||||
|
|
|
интервал |
для т). |
|
|
|
||
1 — доверительный |
интервал для отдельного |
измерения |
У при |
г — оценка линии |
|||||
регрессии; |
з — геометрическое |
место доверительных |
пределов для т|. |
Заметим, что в то время, как оценка линии регрессии изображается прямой линией, геометрическое место точек, соответствующих доверительным пределам, представляет собой две кривые, расстоя ние между которыми минимально в точке х.
Здесь невозможно обсудить многие дополнительные вопросы, например какой доверительный интервал следует ожидать в слу чае, если другой экспериментатор повторил бы эксперимент при тех же значениях xt, или как различались бы результаты, если бы эксперимент был повторен для другого набора значений xt. Даль нейшие подробности можно найти в литературе, список которой приведен в конце этой главы.
До сих пор при обсуждении доверительных интервалов для ßo5 ßi или л рассматривался один какой-либо параметр. Так, довери тельный интервал для ß 0 является интервалом, содержащим воз можные значения ординат прямой при х = х для различных моде
лей с одним и тем же угловым коэффициентом; |
доверительный |
интервал для ß t , напротив, является интервалом, |
включающим |
значения угловых коэффициентов для различных моделей с оди наковыми ординатами в точке х. Однако, если требуется опреде лить, описывает ли экспериментальные данные линейная модель,
учитывающая |
одновременно |
изменение |
углового |
коэффициента |
и ординаты при х, необходимо |
оценить совместную |
доверительную |
||
область для ß 0 |
и ß t . Прямоугольник, образованный оценками довери |
|||
тельных интервалов, и оценка совместной |
доверительной области, |