Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 91
Скачиваний: 0
З а м е ч а н и е |
3. Для целей классификации следует |
знать по |
|
ведение |
(і | Xj) |
с ростом t, так как в случае сходимости |
(i |ХД |
к величине Р (i\Xj) имеется возможность классифицировать наблю дение Xj. Для этого можно использовать правило классификации, состоящее в том, что наблюдение Xj относится к классу і0, если
Р(і01X j ) — max P(i\Xj).
Вработе [2] доказана
Т е о р е м а |
1. |
Если |
и |
значения |
Ѳ на t-м и (t |
+ 1)-м |
|
шагах приведенной ранее итерационной процедуры и Ѳб) ф |
|
||||||
тогда |
|
|
|
|
|
|
|
|
|
ln L (0^ + ')) > |
ln £ (Ѳ<г)). |
|
|
||
Можно доказать1, |
что справедлива |
с <С оо |
для |
Ѳ£ Ѳ и P ( t) |
( і | X j ) |
||
Т е о р е м а |
2. |
Если ln |
L (Ѳ) ^ |
||||
и P(t+ и (i I Xj) |
величины, |
полученные на |
t-м |
и (t + 1)-м |
шагах |
итерационной процедуры, то
Нт [Р(< + 1) (i I X })— Pi*>(i j Xj-)] = 0.
Рассмотрим подмножество Ѳ0 множества Ѳ, состоящее из таких точек, которые не изменяются за один шаг итерационной процедуры. Это множество естественно назвать множеством неподвижных точек.
Можно доказать [2], что справедлива
Т е о р е м а |
3. Если множество |
неподвижных точек Ѳ0 состоит |
из изолированных точек |
|
|
Ѳ |
(щ, я 2, •.. , л-k, öj, |
Ѳ2, .. • , ѲА) £ 0Q, |
то при числе итераций t -> оо сходится к одной из точек Ѳ и эта точка является решением системы уравнений
д ln L (Ѳ) _ Q
дѲ |
|
- - W J ( і = і , 2 ,..., k), |
2 |
дпі |
і= 1 |
Система уравнений, записанная в теореме 3, является хорошо из вестной системой уравнений правдоподобия, которая может быть
1 В работе [2] не указано условие ограниченности in L (0), которое необхо димо для доказательства теоремы 2.
68
для Ѳ; = (Ѳі;, Ѳ2), как указано в [4], представлена в виде
я,-
|
|
|
/=1 |
|
|
|
|
|
2}Р{І\ Xj) - 1п/^ |
І 8іи |
^ |
= о, |
|
П |
|
/= 1 |
1 1 |
дѲи |
|
|
|
Р(ЦХі) |
д \nfjXj I §и , е2) |
= 0 |
(і = 1, 2 ,..., к). |
||
2 |
2 |
|||||
/= 1 |
і= 1 |
|
дѲг |
|
|
|
Множество решений уравнений правдоподобия Ѳх шире, чем мно жество неподвижных точек Ѳ0 итерационной процедуры, так как кро ме точек максимумов множество Ѳх содержит множество точек мини мумов функции правдоподобия, некоторые точки перегиба и т. д. Поэтому естественнее находить процедуры определения максимума ln L (Ѳ), а не процедуры решения уравнений правдоподобия.
2. Смеси нормальных классов
Исследуем теперь задачу оценки параметров смеси, состоящей из известного числа k классов. При этом известно также, что каждый объект X класса і представляет собой элемент нормальной генеральной
совокупности N (üj, 2) и at различны для разных классов, а 2 |
совпа |
||
дают, |
но неизвестны компоненты ни at (і = 1, 2, ..., k), |
ни 2. |
Кроме |
того, |
неизвестны априорные вероятности классов л г (і = |
1, 2, |
..., k). |
Легко проверить [3], что в этом случае
exp [а/ Kj + ßi]
P(i\Xj)
2exp [агХу- + ßj]
i= 1
где
«i = 2 |
и ßi = — |
1at + ln n i. |
Учитывая результаты предыдущего параграфа, нам следует опре делить процедуру, которая максимизировала бы
lnL ; = 2 |
P ^ (i \X j) ln |
- г ( х і - аіу |
|
L (2 < /2I2 1/ 2 |
|||
i= 1 |
|
для at и 2 , или, учитывая замечание 2, определить процедуру, которая максимизировала бы
S1 п Іг =
і= 1
=2 |
2 |
(2я)Р/2| 2 і,/2 |
«=i /= 1 |
69
если только Р^Ці \ X t)-= g\j каким-либо способом уже получены. Эта процедура даст нам величины Ѳц-+1)-=а(/ +1) для (гЧ~1)-го шага
и 02+ 1> = 2(Ж > по Данным ѲіУ |
и Ѳ^°. |
Две |
последующие теоремы |
|
определяют точку максимума для ln Lt |
|
k |
ln Lt в итерационной |
|
и |
2 |
|||
процедуре, приведенной в п. 1 |
настоящего |
і—1 |
||
параграфа. |
Для простоты их формулировки будем опускать индекс t, подчер
кивающий |
связь |
с |
шагом процедуры. Если последовательность gu |
|||||
(і = |
1,2, |
...,& ;/ |
= |
1,2, ..., |
п) такова, что |
|
||
|
|
|
|
|
П |
|
П |
|
|
|
g i j> 0 , |
s |
8ti = g t > ° < |
S g i = n, |
|
||
|
|
|
|
/=1 |
|
I—i |
|
|
то справедливы следующие теоремы. |
|
последователь |
||||||
Т е о р е м а |
4. |
Пусть |
gtj — определенная выше |
|||||
ность и / (U I Ѳг)—р-мерные нормальные плотности, такие, что Ѳг= (аи |
||||||||
2 г). |
Тогда для любых векторов-столбцов Хь Х 2, ..., |
Хп величины |
||||||
ln Li |
(i = |
1, 2, ..., |
п) достигают максимума при |
|
V
|
|
|
|
|
8l |
1=1 |
|
|
|
|
|
|
|
Т е о р е м а 5. Пусть |
gtj — определенная |
выше |
последователь |
||||||||||
ность и / |
(U\ Ѳг) —р-мерные нормальные |
плотности, такие, что Ѳг = |
|||||||||||
= (аг, 2), |
тогда для любых векторов-столбцов Хь Х2, ..., Х„ величина |
||||||||||||
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 ln Li |
достигает максимума |
при |
|
|
|
|
|
||||||
і= і |
|
|
|
|
|
|
|
|
|
|
|
|
|
а, |
|
~ |
2 |
в « х >- 2 |
|
2 |
2 |
< |
|
* |
! |
- “ .)' |
|
и |
|
|
/ = 1 |
|
|
|
І=1/=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
п |
|
|
|
|
|
|
шах |
V |
InL, |
|
— ^ |
[In (2л)] — |
|
In |
|
||
|
|
|
„ |
|
~2 |
|
|||||||
|
|
|
at. 2 |
I= 1 |
|
|
|
|
|
|
|
||
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
При доказательстве этих теорем используется следующая |
|||||||||||||
Л ем м а. |
Пусть Хх, Х2, ..., Х п—р-мерные векторы-столбцыgj^ О |
||||||||||||
для / = |
1, |
2, .... |
п и g1 + g2 + |
... + gn = g > |
0. |
|
|||||||
Тогда для |
любого I |
|
|
|
|
|
|
|
|
|
|||
2 |
|
— |
|
— |
= 2 |
gt(x J — a)(Xj— а)' + g { a — l ) { â ~ І)', |
|||||||
/= 1 |
|
|
|
|
/=і |
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
т |
/2= і* |
х '- |
|
|
|
|
70
Доказательство этой леммы совершенно аналогично доказатель ству леммы 3.2.1 из работы [1, с. 66].
Далее, используя рассуждения, аналогичные тем, которые приве дены в работе [1, с. 66—67], получим, что
|
k |
|
|
|
|
|
|
|
k |
n |
|
|
2 ln L, |
|
|
|
2 |
2 |
g ij + J - \ n \ W |
2 2 |
ga- |
||
|
/= 1 |
|
2 1п(2 я ) i= |
1/ = 1 |
|
i= l/=1 |
|
||||
|
|
|
|
|
|
|
k |
g i {ai— a ) ' x¥{ai— â), |
|||
|
2 |
|
|
|
|
|
2 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
где |
= |
а ¥ |
= 2 |
*• |
|
|
|
|
|
|
|
|
Результат леммы 3.2.2 из [1, с. |
67] завершает доказательство тео |
|||||||||
ремы 5. Теорема 4 доказывается аналогично. |
|
|
|
||||||||
|
Таким образом, |
показано, что при заданных |
|
|
|
||||||
|
|
ра) (i I Xj) = |
expk; {t) X' + Pi (0] |
, |
|
|
|||||
|
|
|
|
|
2 |
exp [ос/ (t) Xj + ßi (*)] |
|
|
|
||
где |
|
|
|
|
/'= 1 |
|
|
|
|
|
|
|
2« > |
|
|
|
|
|
|
|
|
|
|
|
«г (*) = |
‘ |
И |
ß* (t) = 2 - â; (t) 2 (0 â; (t) + |
ln я |° , |
||||||
величины |
|
k |
n |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|||
|
2 a + i ) = — 2 |
|
|
|
|
a f ) ( X } - w y |
|
||||
|
|
|
n i=l/=l |
|
|
|
|
|
|
||
|
|
|
|
|
|
2 |
P(0 (i I Xj) Xj |
|
|
|
|
|
|
|
|
; « ) _ / = 1___________ |
|
|
|
|
|
||
|
|
|
|
|
|
2 |
p(0 (/i^ ) |
|
|
|
|
|
|
|
|
|
|
/=1 |
|
|
|
|
|
максимизируют |
2 |
lnZ.£. |
|
|
|
|
|
|
|
||
|
|
i=l |
|
|
|
|
|
|
|
|
|
Далее легко получить, что |
|
|
|
|
|
|
|
||||
|
|
|
я (< + |
і ) . |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
/=і |
|
|
|
|
|
|
ѳ(t+ ,,- M |
<+I). ^ |
+1), 2«+і))- |
|
|
|
||||
Если существуют пределы |
|
|
|
|
|
|
|
||||
|
|
|
1 іт я /0 = |
я г, |
1 іта-° = йг, |
|
|
|
|||
|
|
|
/ 00 |
|
|
|
t~УОО |
|
|
|
|
|
|
|
|
t = |
1, 2, ... , k, |
|
|
|
|||
|
|
|
|
|
П т 2(0 = 2 |
|
|
|
|||
|
|
|
|
|
£->■oo |
|
|
|
|
|
71
то точка Ѳ = (jtjL, я 2, nh, аь а2, ..., ak, 2) является точкой макси мума функции правдоподобия, возможно, правда, что этот максимум
является локальным. |
в |
качестве начальных |
данных |
можно |
задать |
||
Легко |
видеть, что |
||||||
не точку |
Ѳ(°) = |
(яі0), |
..., |
л40), а '0’, ..., а[0), |
2 (0)), а |
набор величин |
|
а і (0), ßj (0), с |
помощью которых можно получить Р(°) (і I Xj) |
и т. д. |
Именно такая итерационная процедура предлагается в работе [3]. З а м е ч а н и е . Точки, для которых Р (i [X,-) = l/k являются
неподвижными точками итерационной процедуры, но представляют собой посторонние точки, так как в этом случае а* = а (і = 1, 2, ..., k).
В случае двух классов (k = 2), как показано в работе [3], проце
дура сильно упрощается. Для |
произвольных а' |
(0) = (а2 (0), ..., |
||
ah (0)) и ß (0), имеем |
|
|
|
|
(1 I Xj) |
------■---- — --- —— |
, |
||
|
1 +ехр [а' (0) Xj + ß (0)] |
|||
Р(0) (2 I Xj) = |
1 —Р<0>(1 I Xj), |
|
||
|
V |
рО)(/ \Xj)X} |
|
|
а<°>-І=2___________ |
у |
|
||
и1 |
— |
|
|
|
|
V |
p(0)(f|Xj) |
|
|
|
/ = 1 |
|
|
2 P{0){i\Xj).
Далее определяются уточнения а и ß следующим образом:
Ѵ-Наі0)- а [ 0])___________
і - п(°) (1 - я (0)) (4 °> -4 °> )' У - 1( 4 ° ) - 4 ° ) )
ß ( l ) = ------ а'(0) (4°) + |
|
тО) |
|
а<2°>) + In |
|||
где |
|
|
т(0) |
|
|
|
|
V = ^ V ( X j - X ) ( X j - X Y , |
|||
* = ~ |
І |
|
Xj. |
п |
-Ad |
|
|
|
/= 1 |
|
Подставляя а (1) и ß (1) вместо а (0) и ß (0), можно итерационную процедуру продолжить до тех пор, пока значения а и ß не перестанут
изменяться. Далее, после того как значения а и ß установятся, можно определить оценку ковариационной матрицы
У[={ X j - â i) ( —x j - â 1y p ( i \ x ])У +
лтЛ П
/= 1
+ (X j- "a 2) ( X j - â 2) ’ P (2 \X i)].
72