Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 626
Скачиваний: 2
122 |
Глава 3 |
после чего можно из выраженшг(ж) найти оценку <а параметра со. Если требуется, можно вычислить и асимптотические дисперсии оценок.
3.2.3. Оценивание по Байесу
Современный байесовский подход к проблеме оценивания основывается на использовании априорной информации, т. е. используются известные или предполагаемые распределения оце ниваемых параметров. Хотя классический подход к этой проблеме и подход Байеса в какой-то мере различны, они обладают некото рыми общими чертами. Оба подхода требуют:
1) |
существования набора параметров (значений); |
2) |
возможности экспериментирования с целью получения неко |
торых |
сведений о наборе параметров; |
3)взятия выборок для получения информации о случайных величинах;
4)постулирования правил оптимального выбора (в том смысле, что в результате принятого решения получатся оптимальные следствия).
Главное различие между этими подходами состоит в том, что при классическом подходе решения принимают на основе некото рой выборки, зависящей от значений параметров и типа экспери мента. При байесовском подходе анализ задачи начинается с опре деления плотности распределения априорной вероятности значе ний параметров на основе прошлого опыта и всей другой доступ ной информации. Сам параметр рассматривается как случайная величина. Затем для принятия определенного решения исполь зуется функция риска (или потерь), связанная с ценностью экспе риментальной информации, наряду с теоремой Байеса [выраже ние (А.2) приложения А].
Если функция риска не известна, то, используя теорему Байеса, можно максимизировать само апостериорное распределение. После того как появится выборочная информация, исследователь снова использует плотность распределения априорной вероятно сти и теорему Байеса для получения плотности распределения апостериорной вероятности, описывающей его новый уровень знаний о параметре. Апостериорная вероятность служит основой для принятия любых решений, а также априорной вероятностью
для |
последующего |
анализа. |
|
||
Предположим, |
что: |
|
|
|
|
1) |
проведено несколько |
наблюдений случайной величины X , |
|||
обозначенных вектором |
X; |
связь X — |
|||
2) |
имеет место |
некоторая |
общая функциональная |
||
= /(Ѳ, е) между величиной |
X и набором параметров |
(вектором), |
|
Статистический |
анализ и его применения |
123 |
|
обозначаемым Ѳ, которые требуется оценить; 8—вектор |
ненаблю |
|||
даемых |
случайных ошибок; |
|
|
|
3) |
аналитический |
вид |
совместной плотности распределения |
|
вероятности р (Ѳ, е) |
известен. |
|
||
Оценка Байеса Ѳ параметров Ѳ находится следующим |
образом. |
Чтобы определить плотность распределения апостериорной веро
ятности р (ѲI х), применяется |
либо |
теорема Байеса [выражение |
|||
(А.2) приложения А] |
|
|
|
|
|
|
р |
( Ѳ І х ) = |
Р ^ Ш т , |
(3.2.4) |
|
где р (х IѲ) = |
L (Ѳ f x), |
либо |
может |
оказаться |
более удобным |
использовать |
формулу |
(2.1.6): |
|
|
|
|
|
р(Ѳ\х) |
= ^ - . |
(3.2.5) |
В любом случае в качестве первого шага необходимо написать выражение для плотности распределения вероятности р{х), что можно сделать, по крайней мере в принципе, опираясь на инфор
мацию, задаваемую известной |
плотностью распределения р |
(Ѳ, е) |
и известной функциональной |
связью между X, Ѳ и 8. Если |
для |
получения плотности распределения апостериорной вероятности используется выражение (3.2.4), вторым шагом является вычисле ние р (x I Ѳ). Эту условную плотность также можно получить из известных соотношений при условиях 2) и 3). Третий шаг состоит в том, чтобы вычислить р (Ѳ) по р (Ѳ, s), интегрируя по всем значениям е. Если используется соотношение (3.2.5), плот ность распределения вероятности р (Ѳ, х) получается из известных соотношений в предположениях 2) и 3), однако аналитическое рас смотрение в этом случае затруднено или просто невозможно.
Последним шагом в обоих случаях после того, как записана плотность распределения апостериорной вероятности, содержащая все сведения о Ѳ, полученные из эксперимента, является в неко
тором смысле |
оптимизация |
р (Ѳ | |
х). В |
частном случае, |
когда |
|
требуется максимизировать |
накопленную |
вероятность |
Р {Ѳ = Ѳ}, |
|||
максимизируют |
саму плотность р |
(Ѳ | х) |
относительно |
Ѳ, |
чтобы |
получить значение Ѳ, соответствующее максимуму на кривой плотности (моду). Если плотность распределения априорной вероятности р (Ѳ) равномерна, такая оценка совпадает с макси мально правдоподобной оценкой. Можно использовать и многие другие методы оптимизации, однако они выходят за рамки настоя
щего |
рассмотрения. Примеры оценивания по Байесу приведены |
в гл. |
8 и 9. |
124 |
Глава 3 |
3.3. П О Л У Ч Е Н И Е |
И Н Т Е Р В А Л Ь Н Ы Х О Ц Е Н О К |
В двух предыдущих разделах были описаны некоторые спо собы получения точечных оценок параметров и некоторые крите рии оценки их качества. Значительно более глубокое утверждение, чем в случае точечной оценки, можно сделать, оценивая довери тельный интервал. Доверительный интервал вычисляется по данным из некоторой выборки; фиксированная величина пара метра ансамбля заключена между границами этого интервала,
называемыми доверительными пределами, с некоторой |
заданной |
||
степенью достоверности, |
называемой доверительной |
вероятно |
|
стью. Джонсон и Леоне |
проводят поясняющую аналогию |
между |
|
доверительным интервалом и бросанием подковы [4]: |
|
|
|
«Доверительный интервал и связанные с ним понятия |
несколько |
||
напоминают игру с бросанием, подковы. Рассматриваемым |
пара |
метром здесь служит кол (он всегда неподвижен вопреки ошибоч ному мнению некоторых игроков). Подкова служит доверитель ным интервалом. Игроку, который из 100 бросков подковы попадал на кол в среднем 90 раз, можно приписать 90%-ную достовернось (доверительную вероятность) попадания на кол. Доверитель ный интервал, подобно подкове, представляет собой переменную величину. Параметр, как и кол, является постоянной. Для
любого отдельного бросания (для |
отдельной интервальной оценки) |
||||
кол |
(или |
параметр) |
оказывается |
внутри подковы или вне ее. |
|
Можно сделать некоторое вероятностное утверждение |
о перемен |
||||
ных величинах, связанных с положениями краев подковы.» |
|||||
Общая |
процедура |
получения |
интервальной оценки |
такова: |
|
1. |
Некоторое вероятностное утверждение записывается в мате |
матических символах, содержащих рассматриваемый параметр
ансамбля. |
|
|
|
|
|
|
|
|
|
|
|
|||
2. |
Аргумент |
преобразуется |
так, |
чтобы |
параметр |
|
ансамбля |
|||||||
был |
заключен между |
статистиками, |
которые |
можно |
вычислить |
|||||||||
по |
выборке. |
|
|
|
|
|
|
|
|
|
|
|
||
В качестве примера получим интервальную оценку для неизве |
||||||||||||||
стного |
среднего |
по ансамблю |
\іх |
случайной |
величины |
X, |
распре |
|||||||
деленной |
по нормальному закону, |
используя |
выборочное |
сред |
||||||||||
нее |
X |
и |
выборочную |
дисперсию |
s\. |
В разд. |
2.4.2, |
где |
описано |
|||||
^-распределение, |
отмечалось, |
что статистика |
t = |
(X |
— |
[ix)^sx |
является случайной величиной с плотностью распределения вероят ности (2.4.14). Отсюда следует, что еще до получения выборки можно сделать некоторые вероятностные утверждения относи тельно величины t, такие, как
P{t^ty} = p { ^ j ^ < t v } = y , (3.3.1)
|
|
Статистический |
|
анализ |
и его |
применения |
125 |
|||
И |
|
|
|
|
|
|
|
|
|
|
P{tß<t<ty} |
= P \t&< |
* ~ |
^ |
X < f v |
| |
= |
|
|
|
|
|
|
|
|
|
= P(t4)-P(tf>) |
= y-P, |
(3.3.2) |
|||
где индекс |
у соответствует |
верхнему, |
a ß — нижнему |
пределам |
||||||
|
|
|
|
V |
|
|
|
|
|
|
интегрирования в интеграле |
j |
р (t) |
dt. Если в соотношении (3.3.2) |
|||||||
|
|
|
|
ß |
|
|
|
t = О, то интервал по |
||
индексы Y и ß |
симметричны |
относительно |
||||||||
t симметричен |
(фиг. 3.3.1). |
Чтобы |
сделать |
площадь под кривой |
распределения на фиг. 3.3.1, в вне интервала равной а/2 4- а/2 ==
= а, было положено ß = 1 — у = а/2. |
Таким |
образом, |
|
||
Р |
{ * а / 2 < - £ = ^ - < * і - в / 2 } |
= 1 - а . |
|
(3.3.3) |
|
После того как получена выборка, величины |
X |
и sx |
рассма |
||
триваются как фиксированные числа; вероятностные |
утверждения |
||||
теперь уже неприменимы, поскольку величина (X — \ix)/sx |
либо |
||||
лопадает внутрь |
интервала (Р — 1), либо лежит |
вне его (Р = 0), |