Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 91

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

З а м е ч а н и е

3. Для целей классификации следует

знать по­

ведение

(і | Xj)

с ростом t, так как в случае сходимости

(i |ХД

к величине Р (i\Xj) имеется возможность классифицировать наблю­ дение Xj. Для этого можно использовать правило классификации, состоящее в том, что наблюдение Xj относится к классу і0, если

Р01X j ) — max P(i\Xj).

Вработе [2] доказана

Т е о р е м а

1.

Если

и

значения

Ѳ на t-м и (t

+ 1)-м

шагах приведенной ранее итерационной процедуры и Ѳб) ф

 

тогда

 

 

 

 

 

 

 

 

 

ln L (0^ + ')) >

ln £ (Ѳ<г)).

 

 

Можно доказать1,

что справедлива

с <С оо

для

Ѳ£ Ѳ и P ( t)

( і | X j )

Т е о р е м а

2.

Если ln

L (Ѳ) ^

и P(t+ и (i I Xj)

величины,

полученные на

t-м

и (t + 1)-м

шагах

итерационной процедуры, то

Нт [Р(< + 1) (i I X })— Pi*>(i j Xj-)] = 0.

Рассмотрим подмножество Ѳ0 множества Ѳ, состоящее из таких точек, которые не изменяются за один шаг итерационной процедуры. Это множество естественно назвать множеством неподвижных точек.

Можно доказать [2], что справедлива

Т е о р е м а

3. Если множество

неподвижных точек Ѳ0 состоит

из изолированных точек

 

Ѳ

(щ, я 2, •.. , л-k, öj,

Ѳ2, .. • , ѲА) £ 0Q,

то при числе итераций t -> оо сходится к одной из точек Ѳ и эта точка является решением системы уравнений

д ln L (Ѳ) _ Q

дѲ

 

- - W J ( і = і , 2 ,..., k),

2

дпі

і= 1

Система уравнений, записанная в теореме 3, является хорошо из­ вестной системой уравнений правдоподобия, которая может быть

1 В работе [2] не указано условие ограниченности in L (0), которое необхо­ димо для доказательства теоремы 2.

68


для Ѳ; = (Ѳі;, Ѳ2), как указано в [4], представлена в виде

я,-

 

 

 

/=1

 

 

 

 

 

2}Р{І\ Xj) - 1п/^

І 8іи

^

= о,

П

 

/= 1

1 1

дѲи

 

 

 

Р(ЦХі)

д \nfjXj I §и , е2)

= 0

(і = 1, 2 ,..., к).

2

2

/= 1

і= 1

 

дѲг

 

 

 

Множество решений уравнений правдоподобия Ѳх шире, чем мно­ жество неподвижных точек Ѳ0 итерационной процедуры, так как кро­ ме точек максимумов множество Ѳх содержит множество точек мини­ мумов функции правдоподобия, некоторые точки перегиба и т. д. Поэтому естественнее находить процедуры определения максимума ln L (Ѳ), а не процедуры решения уравнений правдоподобия.

2. Смеси нормальных классов

Исследуем теперь задачу оценки параметров смеси, состоящей из известного числа k классов. При этом известно также, что каждый объект X класса і представляет собой элемент нормальной генеральной

совокупности N (üj, 2) и at различны для разных классов, а 2

совпа­

дают,

но неизвестны компоненты ни at (і = 1, 2, ..., k),

ни 2.

Кроме

того,

неизвестны априорные вероятности классов л г =

1, 2,

..., k).

Легко проверить [3], что в этом случае

exp [а/ Kj + ßi]

P(i\Xj)

2exp [агХу- + ßj]

i= 1

где

«i = 2

и ßi = —

1at + ln n i.

Учитывая результаты предыдущего параграфа, нам следует опре­ делить процедуру, которая максимизировала бы

lnL ; = 2

P ^ (i \X j) ln

- г ( х і - аіу

L (2 < /2I2 1/ 2

i= 1

 

для at и 2 , или, учитывая замечание 2, определить процедуру, которая максимизировала бы

S1 п Іг =

і= 1

=2

2

(2я)Р/2| 2 і,/2

«=i /= 1

69


если только Р^Ці \ X t)-= g\j каким-либо способом уже получены. Эта процедура даст нам величины Ѳц-+1)-=а(/ +1) для (гЧ~1)-го шага

и 02+ 1> = 2(Ж > по Данным ѲіУ

и Ѳ^°.

Две

последующие теоремы

определяют точку максимума для ln Lt

 

k

ln Lt в итерационной

и

2

процедуре, приведенной в п. 1

настоящего

і—1

параграфа.

Для простоты их формулировки будем опускать индекс t, подчер­

кивающий

связь

с

шагом процедуры. Если последовательность gu

=

1,2,

...,& ;/

=

1,2, ...,

п) такова, что

 

 

 

 

 

 

П

 

П

 

 

 

g i j> 0 ,

s

8ti = g t > ° <

S g i = n,

 

 

 

 

 

/=1

 

I—i

 

то справедливы следующие теоремы.

 

последователь­

Т е о р е м а

4.

Пусть

gtj — определенная выше

ность и / (U I Ѳг)—р-мерные нормальные плотности, такие, что Ѳг= (аи

2 г).

Тогда для любых векторов-столбцов Хь Х 2, ...,

Хп величины

ln Li

(i =

1, 2, ...,

п) достигают максимума при

 

V

 

 

 

 

 

8l

1=1

 

 

 

 

 

 

Т е о р е м а 5. Пусть

gtj — определенная

выше

последователь­

ность и /

(U\ Ѳг) —р-мерные нормальные

плотности, такие, что Ѳг =

= (аг, 2),

тогда для любых векторов-столбцов Хь Х2, ..., Х„ величина

k

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ln Li

достигает максимума

при

 

 

 

 

 

і= і

 

 

 

 

 

 

 

 

 

 

 

 

 

а,

 

~

2

в « х >- 2

 

2

2

<

 

*

!

- “ .)'

и

 

 

/ = 1

 

 

 

І=1/=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

шах

V

InL,

 

— ^

[In (2л)] —

 

In

 

 

 

 

 

~2

 

 

 

 

at. 2

I= 1

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

При доказательстве этих теорем используется следующая

Л ем м а.

Пусть Хх, Х2, ..., Х п—р-мерные векторы-столбцыgj^ О

для / =

1,

2, ....

п и g1 + g2 +

... + gn = g >

0.

 

Тогда для

любого I

 

 

 

 

 

 

 

 

 

2

 

 

= 2

gt(x J — a)(Xj— а)' + g { a — l ) { â ~ І)',

/= 1

 

 

 

 

/=і

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

/2= і*

х '-

 

 

 

 

70


Доказательство этой леммы совершенно аналогично доказатель­ ству леммы 3.2.1 из работы [1, с. 66].

Далее, используя рассуждения, аналогичные тем, которые приве­ дены в работе [1, с. 66—67], получим, что

 

k

 

 

 

 

 

 

 

k

n

 

 

2 ln L,

 

 

 

2

2

g ij + J - \ n \ W

2 2

ga-

 

/= 1

 

2 1п(2 я ) i=

1/ = 1

 

i= l/=1

 

 

 

 

 

 

 

 

k

g i {ai— a ) ' x¥{ai— â),

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

где

=

а ¥

= 2

*•

 

 

 

 

 

 

 

 

Результат леммы 3.2.2 из [1, с.

67] завершает доказательство тео­

ремы 5. Теорема 4 доказывается аналогично.

 

 

 

 

Таким образом,

показано, что при заданных

 

 

 

 

 

ра) (i I Xj) =

expk; {t) X' + Pi (0]

,

 

 

 

 

 

 

 

2

exp [ос/ (t) Xj + ßi (*)]

 

 

 

где

 

 

 

 

/'= 1

 

 

 

 

 

 

2« >

 

 

 

 

 

 

 

 

 

 

«г (*) =

И

ß* (t) = 2 - â; (t) 2 (0 â; (t) +

ln я |° ,

величины

 

k

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 a + i ) = — 2

 

 

 

 

a f ) ( X } - w y

 

 

 

 

n i=l/=l

 

 

 

 

 

 

 

 

 

 

 

 

2

P(0 (i I Xj) Xj

 

 

 

 

 

 

 

; « ) _ / = 1___________

 

 

 

 

 

 

 

 

 

 

 

2

p(0 (/i^ )

 

 

 

 

 

 

 

 

 

/=1

 

 

 

 

максимизируют

2

lnZ.£.

 

 

 

 

 

 

 

 

 

i=l

 

 

 

 

 

 

 

 

Далее легко получить, что

 

 

 

 

 

 

 

 

 

 

я (< +

і ) .

 

2

 

 

 

 

 

 

 

 

 

 

 

/=і

 

 

 

 

 

ѳ(t+ ,,- M

<+I). ^

+1), 2«+і))-

 

 

 

Если существуют пределы

 

 

 

 

 

 

 

 

 

 

1 іт я /0 =

я г,

1 іта-° = йг,

 

 

 

 

 

 

/ 00

 

 

 

t~УОО

 

 

 

 

 

 

 

t =

1, 2, ... , k,

 

 

 

 

 

 

 

 

П т 2(0 = 2

 

 

 

 

 

 

 

 

£->■oo

 

 

 

 

 

71


а(1):

то точка Ѳ = (jtjL, я 2, nh, аь а2, ..., ak, 2) является точкой макси­ мума функции правдоподобия, возможно, правда, что этот максимум

является локальным.

в

качестве начальных

данных

можно

задать

Легко

видеть, что

не точку

Ѳ(°) =

(яі0),

...,

л40), а '0’, ..., а[0),

2 (0)), а

набор величин

а і (0), ßj (0), с

помощью которых можно получить Р(°) I Xj)

и т. д.

Именно такая итерационная процедура предлагается в работе [3]. З а м е ч а н и е . Точки, для которых Р (i [X,-) = l/k являются

неподвижными точками итерационной процедуры, но представляют собой посторонние точки, так как в этом случае а* = а (і = 1, 2, ..., k).

В случае двух классов (k = 2), как показано в работе [3], проце­

дура сильно упрощается. Для

произвольных а'

(0) = (а2 (0), ...,

ah (0)) и ß (0), имеем

 

 

 

 

(1 I Xj)

------■---- --- ——

,

 

1 +ехр [а' (0) Xj + ß (0)]

Р(0) (2 I Xj) =

1 —Р<0>(1 I Xj),

 

 

V

рО)(/ \Xj)X}

 

 

а<°>-І=2___________

у

 

и1

 

 

 

V

p(0)(f|Xj)

 

 

 

/ = 1

 

 

2 P{0){i\Xj).

Далее определяются уточнения а и ß следующим образом:

Ѵ-Наі0)- а [ 0])___________

і - п(°) (1 - я (0)) (4 °> -4 °> )' У - 1( 4 ° ) - 4 ° ) )

ß ( l ) = ------ а'(0) (4°) +

 

тО)

а<2°>) + In

где

 

 

т(0)

 

 

 

V = ^ V ( X j - X ) ( X j - X Y ,

* = ~

І

 

Xj.

п

-Ad

 

 

/= 1

 

Подставляя а (1) и ß (1) вместо а (0) и ß (0), можно итерационную процедуру продолжить до тех пор, пока значения а и ß не перестанут

изменяться. Далее, после того как значения а и ß установятся, можно определить оценку ковариационной матрицы

У[={ X j - â i) ( x j - â 1y p ( i \ x ])У +

лтЛ П

/= 1

+ (X j- "a 2) ( X j - â 2) ’ P (2 \X i)].

72