Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 626

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

122

Глава 3

после чего можно из выраженшг(ж) найти оценку <а параметра со. Если требуется, можно вычислить и асимптотические дисперсии оценок.

3.2.3. Оценивание по Байесу

Современный байесовский подход к проблеме оценивания основывается на использовании априорной информации, т. е. используются известные или предполагаемые распределения оце­ ниваемых параметров. Хотя классический подход к этой проблеме и подход Байеса в какой-то мере различны, они обладают некото­ рыми общими чертами. Оба подхода требуют:

1)

существования набора параметров (значений);

2)

возможности экспериментирования с целью получения неко­

торых

сведений о наборе параметров;

3)взятия выборок для получения информации о случайных величинах;

4)постулирования правил оптимального выбора (в том смысле, что в результате принятого решения получатся оптимальные следствия).

Главное различие между этими подходами состоит в том, что при классическом подходе решения принимают на основе некото­ рой выборки, зависящей от значений параметров и типа экспери­ мента. При байесовском подходе анализ задачи начинается с опре­ деления плотности распределения априорной вероятности значе­ ний параметров на основе прошлого опыта и всей другой доступ­ ной информации. Сам параметр рассматривается как случайная величина. Затем для принятия определенного решения исполь­ зуется функция риска (или потерь), связанная с ценностью экспе­ риментальной информации, наряду с теоремой Байеса [выраже­ ние (А.2) приложения А].

Если функция риска не известна, то, используя теорему Байеса, можно максимизировать само апостериорное распределение. После того как появится выборочная информация, исследователь снова использует плотность распределения априорной вероятно­ сти и теорему Байеса для получения плотности распределения апостериорной вероятности, описывающей его новый уровень знаний о параметре. Апостериорная вероятность служит основой для принятия любых решений, а также априорной вероятностью

для

последующего

анализа.

 

Предположим,

что:

 

 

 

1)

проведено несколько

наблюдений случайной величины X ,

обозначенных вектором

X;

связь X —

2)

имеет место

некоторая

общая функциональная

= /(Ѳ, е) между величиной

X и набором параметров

(вектором),


 

Статистический

анализ и его применения

123

обозначаемым Ѳ, которые требуется оценить; 8—вектор

ненаблю­

даемых

случайных ошибок;

 

 

3)

аналитический

вид

совместной плотности распределения

вероятности р (Ѳ, е)

известен.

 

Оценка Байеса Ѳ параметров Ѳ находится следующим

образом.

Чтобы определить плотность распределения апостериорной веро­

ятности р (ѲI х), применяется

либо

теорема Байеса [выражение

(А.2) приложения А]

 

 

 

 

 

р

( Ѳ І х ) =

Р ^ Ш т ,

(3.2.4)

где р (х IѲ) =

L (Ѳ f x),

либо

может

оказаться

более удобным

использовать

формулу

(2.1.6):

 

 

 

 

 

р(Ѳ\х)

= ^ - .

(3.2.5)

В любом случае в качестве первого шага необходимо написать выражение для плотности распределения вероятности р{х), что можно сделать, по крайней мере в принципе, опираясь на инфор­

мацию, задаваемую известной

плотностью распределения р

(Ѳ, е)

и известной функциональной

связью между X, Ѳ и 8. Если

для

получения плотности распределения апостериорной вероятности используется выражение (3.2.4), вторым шагом является вычисле­ ние р (x I Ѳ). Эту условную плотность также можно получить из известных соотношений при условиях 2) и 3). Третий шаг состоит в том, чтобы вычислить р (Ѳ) по р (Ѳ, s), интегрируя по всем значениям е. Если используется соотношение (3.2.5), плот­ ность распределения вероятности р (Ѳ, х) получается из известных соотношений в предположениях 2) и 3), однако аналитическое рас­ смотрение в этом случае затруднено или просто невозможно.

Последним шагом в обоих случаях после того, как записана плотность распределения апостериорной вероятности, содержащая все сведения о Ѳ, полученные из эксперимента, является в неко­

тором смысле

оптимизация

р (Ѳ |

х). В

частном случае,

когда

требуется максимизировать

накопленную

вероятность

Р {Ѳ = Ѳ},

максимизируют

саму плотность р

(Ѳ | х)

относительно

Ѳ,

чтобы

получить значение Ѳ, соответствующее максимуму на кривой плотности (моду). Если плотность распределения априорной вероятности р (Ѳ) равномерна, такая оценка совпадает с макси­ мально правдоподобной оценкой. Можно использовать и многие другие методы оптимизации, однако они выходят за рамки настоя­

щего

рассмотрения. Примеры оценивания по Байесу приведены

в гл.

8 и 9.


124

Глава 3

3.3. П О Л У Ч Е Н И Е

И Н Т Е Р В А Л Ь Н Ы Х О Ц Е Н О К

В двух предыдущих разделах были описаны некоторые спо­ собы получения точечных оценок параметров и некоторые крите­ рии оценки их качества. Значительно более глубокое утверждение, чем в случае точечной оценки, можно сделать, оценивая довери­ тельный интервал. Доверительный интервал вычисляется по данным из некоторой выборки; фиксированная величина пара­ метра ансамбля заключена между границами этого интервала,

называемыми доверительными пределами, с некоторой

заданной

степенью достоверности,

называемой доверительной

вероятно­

стью. Джонсон и Леоне

проводят поясняющую аналогию

между

доверительным интервалом и бросанием подковы [4]:

 

 

«Доверительный интервал и связанные с ним понятия

несколько

напоминают игру с бросанием, подковы. Рассматриваемым

пара­

метром здесь служит кол (он всегда неподвижен вопреки ошибоч­ ному мнению некоторых игроков). Подкова служит доверитель­ ным интервалом. Игроку, который из 100 бросков подковы попадал на кол в среднем 90 раз, можно приписать 90%-ную достовернось (доверительную вероятность) попадания на кол. Доверитель­ ный интервал, подобно подкове, представляет собой переменную величину. Параметр, как и кол, является постоянной. Для

любого отдельного бросания (для

отдельной интервальной оценки)

кол

(или

параметр)

оказывается

внутри подковы или вне ее.

Можно сделать некоторое вероятностное утверждение

о перемен­

ных величинах, связанных с положениями краев подковы.»

Общая

процедура

получения

интервальной оценки

такова:

1.

Некоторое вероятностное утверждение записывается в мате­

матических символах, содержащих рассматриваемый параметр

ансамбля.

 

 

 

 

 

 

 

 

 

 

 

2.

Аргумент

преобразуется

так,

чтобы

параметр

 

ансамбля

был

заключен между

статистиками,

которые

можно

вычислить

по

выборке.

 

 

 

 

 

 

 

 

 

 

 

В качестве примера получим интервальную оценку для неизве­

стного

среднего

по ансамблю

х

случайной

величины

X,

распре­

деленной

по нормальному закону,

используя

выборочное

сред­

нее

X

и

выборочную

дисперсию

s\.

В разд.

2.4.2,

где

описано

^-распределение,

отмечалось,

что статистика

t =

(X

[ix)^sx

является случайной величиной с плотностью распределения вероят­ ности (2.4.14). Отсюда следует, что еще до получения выборки можно сделать некоторые вероятностные утверждения относи­ тельно величины t, такие, как

P{t^ty} = p { ^ j ^ < t v } = y , (3.3.1)


 

 

Статистический

 

анализ

и его

применения

125

И

 

 

 

 

 

 

 

 

 

 

P{tß<t<ty}

= P \t&<

* ~

^

X < f v

|

=

 

 

 

 

 

 

 

 

= P(t4)-P(tf>)

= y-P,

(3.3.2)

где индекс

у соответствует

верхнему,

a ß — нижнему

пределам

 

 

 

 

V

 

 

 

 

 

 

интегрирования в интеграле

j

р (t)

dt. Если в соотношении (3.3.2)

 

 

 

 

ß

 

 

 

t = О, то интервал по

индексы Y и ß

симметричны

относительно

t симметричен

(фиг. 3.3.1).

Чтобы

сделать

площадь под кривой

распределения на фиг. 3.3.1, в вне интервала равной а/2 4- а/2 ==

= а, было положено ß = 1 — у = а/2.

Таким

образом,

 

Р

{ * а / 2 < - £ = ^ - < * і - в / 2 }

= 1 - а .

 

(3.3.3)

После того как получена выборка, величины

X

и sx

рассма­

триваются как фиксированные числа; вероятностные

утверждения

теперь уже неприменимы, поскольку величина (X \ix)/sx

либо

лопадает внутрь

интервала (Р — 1), либо лежит

вне его = 0),