Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 674

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Линейные модели с одной переменной 239

обычно состоят в следующем:

1. Интервал изменений независимой переменной х слишком мал, так что изменение зависимой переменной по порядку величи­ ны равно ошибке при ее измерении. В качестве крайнего примера укажем, что стократное повторение измерений при одном и том же значении х дает для получения оценки не 100 различных значений, а лишь одно значение У,. Так как число экспериментальных точек должно быть по крайней мере равно числу параметров модели, чтобы можно было произвести их оценивание, изменение незави­ симой переменной в небольшом интервале представляет собой неэффективный эксперимент. Для модели с несколькими незави-, симыми переменными исследователь обнаружит, что, если некото-J рые важные независимые переменные процесса поддерживать при­ близительно постоянными, регрессионный анализ приведет к заключению, что они являются несущественными переменными.

Более того, независимые

переменные,

которые не регулируются,

а просто присутствуют,

по-видимому,

должны вести себя как

случайные величины. Суть экспериментирования состоит в том, чтобы определенным образом менять, насколько это возможно, экспериментальные условия (независимые переменные) и тем самым позволить зависимой переменной быть случайной величиной.

2. Ошибки при измерениях зависимой переменной не являются независимыми. Измерения характеристик процесса могут содер­ жать сериальную корреляцию ошибок, которая, возможно, меняет­ ся с течением времени. Так как любой производственный процесс подвержен влиянию независимых переменных, недоступных кон­ тролю со стороны экспериментатора, таких, как износ установки, образование накипи в теплообменнике, изменения в составе сырья, разные метеорологические условия, перемены персонала и т. п., то четыре вышеупомянутых предположения могут оказаться нереальными. Иногда неконтролируемые переменные такого типа называют скрытыми переменными.

Итак, вся совокупность разрозненных экспериментальных дан­ ных о некотором процессе должна быть тщательно проанализиро­ вана. Наилучшая методика эксперимента должна предусматри­ вать возможность преднамеренных изменений всех контролируе­ мых переменных, как описано в гл. 8. Исследователь, прежде чем применять для оценивания метод наименьших квадратов, должен быть по возможности уверен в том, что имеет всю доступную ин­

формацию об используемом интервале изменений х

по

сравнению

с полным интервалом изменений, о величине

ошибок в

зависимых

и независимых

переменных, о роли возможных посторонних фак­

торов.

Более

общая методика

получения

оценок

описывается

в разд. 4.5, 4.6

и 5.4. Вопросы правильного

планирования экспе­

римента

впервые обсуждаются

в- гл. 8.

 

 

 



240

Глава

4

 

 

 

4.3. О Ц Е Н И В А Н И Е П Р И П О С Т О Я Н Н О Й Д И С П Е Р С И И

 

 

О Ш И Б О К

 

 

 

Эмпирическую модель, коэффициенты которой будут в даль­

нейшем оцениваться,

запишем в виде

 

 

 

a не как

Л = ßo +

ßi

(x - x ) ,

 

(4.3.1)

Л = ß;

+

ß t x ,

 

(4.3.2)

 

 

поскольку, во-первых, оценки b0

и

ôt

параметров ß 0

и ßi

можно

получить, не решая

совместные

системы связанных

уравнений,

что приходится делать в случае,

если

линейная модель записана

в форме (4.3.2), и, во-вторых, оценки ß 0

и ß 4 статистически

незави­

симы, что несправедливо для оценок ß'0 и ß t . Модели с несколькими независимыми переменными в форме (4.3.1) дают лучше обуслов­ ленные матрицы (гл. 5). Итак, ищутся несмещенные оценки пара­

метров

ß 0 и

ßt,

обладающие

наименьшей дисперсией.

Предпола­

гается,

что

ay. = const.

 

 

4.3.1. Оценки,

получаемые

по методу наименьших

квадратов

Метод наименьших квадратов Лежандра состоит в том, чтобы минимизировать сумму квадратов отклонений по оси у на фиг. 4.2.2. В развитие этого метода Гаусс и Лаплас предложили минимизи­ ровать сумму квадратов взвешенных отклонений (рассматривается в разд. 4.4). Здесь будет минимизироваться величина

Ф = 2 <УІ-І\І)*РІ=

S Pi [Yi-fo-Mxt-x)]a,

(4.3.3)

i=l

 

i=l

 

где pi — число

повторных

измерений зависимой

переменной при

данном значении xt. Д л я этого необходимо приравнять нулю част­ ные производные от ф по ß 0 и ß i . (Нетрудно показать, рассматри­ вая вторые производные, что это приводит именно к минимуму ф,

а не к

максимуму.)

 

 

 

 

п

 

 

дф

 

д{^Рі

[ѴІ-%-МХІ-Щ

 

_

і

 

 

 

 

 

n

 

 

 

= - 2 У l ^ i - ß o - ß i ( * * - * ) ] = 0 ,

 

 

 

 

І=І

(4.3.4)

дф

_

i = i

_

 

ößi -

 

oßi

_

 

 

 

 

n

 

= - 2 2 Pi [Yt - ßo - ßi (xt - x)} (xt — x) = 0.


Линейные

модели с

одной

переменной

241

Приводя подобные члены, получим нормальные

уравнения,

в ко­

торых параметры модели ß 0 и ßj заменены их

оценками:

 

п

 

п

п

 

 

 

^іРіУі

= Ь0 ^ І Р І +

ЬІ 2

Pi(xi-x),

 

(4.3.5а)

і—і

 

і=1

i=l

 

 

 

n

 

n

 

n

 

 

2 PiYi(xi — x) = b0

2 Pi (ХІ—Х)^ЬІ

2 РІ(ХІ-Х)2.

(4.3.56)

i=l

i=l

 

i= l

 

 

Заметим, что

 

n

 

 

 

 

 

 

 

 

 

 

 

2Pi {xi—

x) =

0.

 

 

i=l

Следовательно, как отмечалось выше, уравнение (4.3.5а) можно разрешить относительно Ь 0 отдельно от уравнения (4.3.56), которое также просто разрешается относительно bt:

п

 

 

 

 

2 Р?І

 

 

 

 

 

 

ß 0 ^ f c 0 =

i 4

= У ,

 

 

(4.3.6)

 

 

 

 

і=1

 

 

 

 

 

 

 

 

TI

 

 

 

 

 

 

 

 

2 Рі^ г (^г —

х)

 

 

 

 

 

^ = ^ = 2=1

— .

 

(4.3.7)

 

4.3.2. Максимально

2

ж)2

 

оценки

 

 

правдоподобные

 

Точно

такие

же

оценки параметров ß 0

и ß t

можно

получить

 

 

 

 

і=1

 

 

 

 

методом максимального правдоподобия, если к четырем первым

предположениям разд. 4.2 добавить пятое

предположение.

Построим функцию

правдоподобия, рассмотренную в разд. 3.2.1,

основываясь на

плотности распределения

вероятности

 

Р(у\х;

ß0 , ßi, ° f r f ) = y ^

 

е х р [ — Щ Г ^ І — л О ' / ц ] .

£(ßo, ßi, ° y j y ,

ж) =

L =

 

 

 

 

 

 

 

- П ^ Г « Ч . [ - 4 : ( ^ - І О ' Р . ] .

( « . в )

г =і

x i

1


242

Глава 4

В выражении (4.3.8) переменными являются параметры, а значе­ ния Y я X заданы. Тогда

In

 

 

 

 

 

 

71

 

 

 

 

 

 

 

 

(iП=lР*)

 

 

L=

— n l n l / 2 i t — у In o2y. + i - I n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S w { ^ - I ß o + ß i

to-*)]}2

 

 

 

 

 

 

 

2 = 1

2oV

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

Д л я

получения'максимально

правдоподобных"! оценок

потребуем

чтобы

д In L

_ tffln

L

d l n L

,

 

 

 

 

 

 

<?ßo

~ "

*ßi

~

<?(°"2v.) -

'

 

 

 

 

 

 

 

 

г

 

 

что дает три уравнения

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S . { ^ ' - I ß o

+

 

M * i - £ ) ] } p i = 0 ,

(4.3.9а)

 

 

і = і

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S

{ У і - № о +

^ і ( ^ - я ) ] } р і ( « і - * ) = 0,

(4.3.96)

 

j=i

 

 

 

 

 

 

 

 

 

S

p j { F , - [ p o +

& i ( « J - i ) l } ' - n â î r = 0 ,

(4.3.9B)

 

i = i

 

 

 

 

 

 

 

 

из которых первые два совпадают соответственно с уравнениями

(4.3.5а) и (4.3.56) и приводят к выражениям

(4.3.6) и (4.3.7) для

Ь0 и bj. Уравнение

(4.3.9в) дает смещенную

оценку о**.:

п

п

 

г=1

і=в

 

в чем можно будет^убедиться в дальнейшем.

4.3.3. Математические ожидания

и дисперсии оценок;

дисперсионный

анализ

Плотности распределений вероятности для Ъ0 и Ъі можно полу­ чить с помощью теоремы сложения для нормального распределения или теоремы разложения для распределения %2. Однако эти детали, которые можно найти^в курсах статистики, здесь опущены. Так как Ь0 и Ъх являются линейными комбинациями Yt, можно заклю­ чить, что любая из этих оценок распределена по нормальному закону. Прежде всего представляют интерес математические ожи­ дания и дисперсии Ь0 и bit так как эти характеристики необходимы для последующего анализа методов построения моделей.