Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 681

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

252

 

Глава 4

 

 

 

 

 

 

 

Таблица

П.4.3.1а

Набор

X

Ошибка в

 

Наблюдаемые

данных

л

значения У

 

 

1

10,00

0,05

12,00

 

12,05

2

10,00

- 0 , 5 2

12,00

 

11,48

3

20,00

—1,41

14,00

 

12.59

4

20,00

1,82

14,00

 

15,82

5

30,00

1,35

16,00

 

17,35

6

30,00

0,42

16,00

 

16,42

7

40,00

- 1 , 7 6

18,00

 

16,24

8

40,00

—0,96

18,00

 

17,04

9

50,00

0,56

20,00

 

20,56

10

50,00

—0,72

20,00

 

19,28

на чертеже оценку линии регрессии, доверительные пределы около этой линии и выборочные средние Yt при каждом xf, 4) провести дисперсионный анализ.

Решение

Пусть уровень значимости а равен 0,05. Вычисления будут достаточно подробны, чтобы можно было проследить за каждым шагом (табл. П.4.3.16).

УІРІУІІХІ — Х)

2-187,3 = 0,1873,

^РІІХІ-Ъ)*

2.1000

Y = 15,89 + 0,1873 (х—30) = 10,26 + 0,1873z,

n

і=1

 

t = l

i = l

п — 2

 

i = i

i = l

= 4 [ 2 . 1 2 9 8 , 9 8 - i ^ ^ - i ^ ^ ] = l . 5,02 = 1,67,

n Pi

s* = i = l 3 =1

• 6,95 = 1,39.

j 2= i

w - n


Линейные

модели с одной

переменной

253

Заметим, что чрезмерно большая ошибка округления может серьезно нарушить численные результаты, если при вычислениях не сохранять все значащие цифры. Например, если значения Yt

 

 

 

 

 

 

 

 

 

 

 

 

Таблица

П.4.3.16

 

 

 

Pi

 

 

 

 

 

 

 

 

 

 

 

Рі

_

J=l

(x

t

- X)

Y

t

(x

t

-

x)

y?

 

 

 

 

-1 г

10

2

 

11,765

 

 

—20

—235,3

400

138,41

20

2

 

14,215

 

 

- 1 0

- 1 4 2 , 2

100

201,78

30

2

 

16,885

 

 

0

 

 

 

 

0

0

285,10

40

2

 

16,640

 

 

10

 

 

166,4

100

276,89

50

2

 

19,920

 

 

20

 

 

398,4

400

396,80

Сумма

10

 

79,425

 

 

 

 

 

187,3

1000

1298,98

округляются не до пятой, а до четвертой значащей цифры, то сум­

ма квадратов отклонений будет неверна уже в третьей

значащей

цифре.

 

отношение дисперсий sf/sl = 1,20

 

 

Можно

составить

и

приме­

нить F-критерий, чтобы узнать, значимо ли различаются

средние

квадраты.

Так как

для а = 0,05 из табл.

В.4 приложения В

F (3,5) =

5,41, можно утверждать, что средние квадраты

незначи­

мо отличаются друг

от друга и линейная

модель п =

 

4- ßjx

адекватно описывает представленные данные. Затем средние квад­ раты объединяются по формуле (4.3.15):

 

 

5,02 4

6,95

1,50.

 

 

 

8

 

 

 

 

 

 

 

 

Из выражения (4.3.10), в котором в качестве оценки oY

исполь­

зован объединенный средний квадрат sy. , получаем оценку

диспер­

сии коэффициента Ь0:

 

 

 

 

 

 

Ѵаг{60 }:

5

 

і і ^ _ 0

5

 

 

 

 

10 - u

' 10 -

 

 

 

і=1

 

 

 

 

Из равенства (4.3.11)

имеем

 

 

 

 

V a r { 6 t ) =

5

2

_ = ^ g :

: 7,5 - Ю - 4 .

 

 

2

Pi(xi—x)2

 

 

 

 

i=i

 

 

 

 

 


254

Глава

4

 

 

 

 

Кроме того, если Y — Ь'0-\-ЬіХ, из выражения

(4.3.18)

(см. далее)

вычисляем

 

 

 

 

 

 

V a r î & ; } = l , 5 0 [ l + g ] = 0 ' 8 2 5 -

 

 

4.3.4. Доверительный

интервал

и доверительная

область

Так как оценки коэффициентов модели Ь0

и Ъх

линейно входят

в выражение для оценки линии

регрессии

Y

= bo +

(х — х)

и являются независимыми

случайными переменными,

корреляцион­

ные члены исчезают и поэтому

 

 

 

 

 

Var {У;} = Ѵаг{Ь0} + (xt -

xf Var

:

 

 

 

 

 

1

(Xi—X)*

 

 

(4.3.16)

 

 

 

 

 

 

 

 

i =l

 

 

 

 

Заметим, что дисперсия минимальна при xt =

х.

 

 

Новое единичное измерение Y, Yfj, в точке xt будет распреде­ лено относительно r\t с дисперсией Oy. независимо от значения Yi, так что если отклонение У*,- от предсказанной линии регрессии Yi равно (Y*j — Yt), то дисперсия этого отклонения будет равна

oh = Var {Yfj—У;} = Var {Yt}} + Var {Уг } =

1

,

(Xi—~X)2

(4.3.17)

 

 

 

i=l i=l

Если бы модель с самого начала выбиралась в форме т] =

— ßo + ßi^' т о оценка линии регрессии имела бы вид У = Ь'0-{-

+ ЪІХ

= (b0 — bix) +

btx, т. e. b'0 — b0 — bYx.

Дисперсия b'0

равна

Ѵаг{Ь0 } + x2 Var - f^}, или

 

 

Ѵаг{Ь;} =

а У г

(4.3.18)

2 Pi SPJ(*|-Ï)*

a Var{&j} по-прежнему определяется формулой (4.3.11). Учитывая, что оценка bo распределена относительно ßo по нор­

мальному закону, для получения доверительного интервала для


 

Линейные

модели с одной

переменной

 

255

ßo

можно использовать

безразмерную

f-статистику

Стьюдента

 

^ • J ü z J o . . .

 

\ - ß ° , ѵ

= 2 Р г - 2 ,

(4.3.19)

 

 

1

і=1

 

 

 

 

которая подчиняется ^-распределению

с 2

2 степенями сво­

боды. Очевидно, следует

использовать

объединенную

оценку

sy.

из соотношения (4.3.15), так как она служит лучшей

оценкой

величины cry., чем по отдельности si или s2.. Если повторных изме­ рений Y не производилось, то невозможно вычислить si и в после­ дующих соотношениях нужно заменить sy. на величину s2, а число степеней свободы — на число степеней свободы s2, т. е. п — 2.

Величина sy.

называется

оценкой стандартной ошибки.

Довери­

тельный интервал для ß 0

имеет вид

 

 

Ь0 11 _a/ 2Sbo < ß0 <

b0 + 1 1 _a/2sbo.

(4.3.20)

Аналогично для ßi

 

 

 

h — ßi

fei

ßi

, V =2P* - 2 >

( 4 - 3 - 2 1 )

 

 

 

 

- i=l

 

 

 

 

Ьі — * і - а / 2 с Ь ! < ßi <

bi + «i-«/2Sbi-

(4.3.22)

100 (1 — а) %-ный доверительный интервал для математического ожидания величины Y} при заданном значении xt 'определяется подобным образом:

t = ^ ~ -

ѵ = 2 р , - 2 ,

(4.3.23)

уі=1

Y-*i_a/2Sy

< м < t + t i - a / 2 s f ,

(4.3.24)

где sf вычисляется с помощью соотношения (4.3.16), в котором дис­ персия Oy заменена на sy. . Наконец, если выбрать некоторое дополнительное значение xt, например х*, то доверительный интер­ вал для математического ожидания дополнительного измерения Yfj будет иметь вид [используется соотношение (4.3.17)]

Yt

- *i _ a/2*D<Tl* < Yt + h-a/2SD.

(4.3.25)

Чтобы найти

доверительный интервал для среднего Ym по m

измерениям при дополнительном значении х, нужно заменить пер­ вый член в квадратных скобках равенства (4.3.17) на величину 1/т, так как дисперсия Ym равна Oy Im.


2 5 6

Глава 4

Интерпретация всех этих доверительных интервалов такая же, какая была дана в разд. 3.3, а именно что со 100 (1 — а) %-ной надежностью (доверительной вероятностью) рассчитанный интер­ вал содержит соответствующие величины ß 0 , р\ или и, если выпол­ нены предположения разд. 4.2. Доверительные пределы для и, определяемые неравенствами (4.3.24), можно нанести на схему вместе с экспериментальными данными, как показано на фиг. 4.3.2.

I

I I

I I I

I I

I

I

I I I I I

I I

I

I I

 

 

 

X

 

 

 

X

 

 

Ф и г . 4.3.2. Оценка

линии

регрессии

Y

— Ъ0 4- bt

(х — х) и доверительный

 

 

 

интервал

для т).

 

 

 

1 — доверительный

интервал для отдельного

измерения

У при

г — оценка линии

регрессии;

з — геометрическое

место доверительных

пределов для т|.

Заметим, что в то время, как оценка линии регрессии изображается прямой линией, геометрическое место точек, соответствующих доверительным пределам, представляет собой две кривые, расстоя­ ние между которыми минимально в точке х.

Здесь невозможно обсудить многие дополнительные вопросы, например какой доверительный интервал следует ожидать в слу­ чае, если другой экспериментатор повторил бы эксперимент при тех же значениях xt, или как различались бы результаты, если бы эксперимент был повторен для другого набора значений xt. Даль­ нейшие подробности можно найти в литературе, список которой приведен в конце этой главы.

До сих пор при обсуждении доверительных интервалов для ßo5 ßi или л рассматривался один какой-либо параметр. Так, довери­ тельный интервал для ß 0 является интервалом, содержащим воз­ можные значения ординат прямой при х = х для различных моде­

лей с одним и тем же угловым коэффициентом;

доверительный

интервал для ß t , напротив, является интервалом,

включающим

значения угловых коэффициентов для различных моделей с оди­ наковыми ординатами в точке х. Однако, если требуется опреде­ лить, описывает ли экспериментальные данные линейная модель,

учитывающая

одновременно

изменение

углового

коэффициента

и ординаты при х, необходимо

оценить совместную

доверительную

область для ß 0

и ß t . Прямоугольник, образованный оценками довери­

тельных интервалов, и оценка совместной

доверительной области,