Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 87
Скачиваний: 0
Г л а в а II
КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ. ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ: РАСЩЕПЛЕНИЕ СМЕСЕЙ НА ОСНОВЕ ОЦЕНКИ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ
§ 1. СМЕСИ И УСЛОВИЯ ИХ РАЗЛИЧИМОСТИ
Прежде чем приходить к формальному описанию смеси, оста новимся на простейшем примере. Допустим, что необходимо распознавать рукописные цифры, соответствующие 0, 1, 2, ..., 9. Каждая цифра, например 8, может быть написана многими способами, соответствующими почеркам различных людей. Таким образом, мы будем иметь дело с целой группой написаний, которые относятся к понятию цифры 8, т. е. будем иметь дело с однородной группой на
писаний.
Но различных цифр десять, поэтому можно говорить о смеси десяти однородных групп, соответствующих различным цифрам. Следователь но, при разбиении совокупности рукописных цифр на группы мы сталкиваемся со смесью не более чем десяти однородных в некотором смысле групп.
При разбиении совокупности городов (семей, производственных предприятий, стран) на однородные группы, естественно, могут наб людаться аналогичные явления. Поэтому каждая однородная группа обладает какими-то общими признаками и каждый объект этой группы может иметь индивидуальные (случайные) отличия.
Говоря более формально, каждая”однородная группа может быть представлена в виде генеральной совокупности, задаваемой своей функцией плотности распределения вероятностей /(£У|Ѳ), где пара метр Ѳможет играть, например, роль номера класса.
Часто при классификации объектов, как в нашем примере, имеют дело не с одной, а с целой серией (конечной или бесконечной) однород ных групп, каждая из которых представлена в некоторой пропорции, т. е. имеют дело со смесями однородных групп. При этом возникает задача: выяснить, имеем ли мы дело со смесью или с одной однородной группой, другими словами, не является ли смесь однородных в некото ром смысле групп, однородной группой в том же самом смысле.
57
1. Математическая постановка задачи
Пусть имеется семейство плотностей распределений
F -- {/ (U IѲ); Q ^ R ^ c z R m, |
UeRP} |
|
и пусть G = {G (Ѳ)} — семейство смешивающих распределений. |
||
Мы не включаем в G неинтересный для нас |
случай так называемых |
|
вырожденных распределений I, т. е. |
таких функций G (Ѳ), которые |
|
имеют скачок от 0 до 1 в одной точке. |
Функция плотности распределе |
ния, или h (U) = ^ f (U I Ѳ) dG (Ѳ) (интеграл в смысле Лебега-Стил ьтье-
са) называется смесью (G-смесью) семейства F. Когда G (Ѳ) пробегает все точки класса G(J I, то h (U) пробегает класс Н, называемый клас сом смесей.
Класс смесей Н различим, или проще, смесь h (U) различима, если из равенства
h(U) — ^f(U\Q) dG(Ѳ) = J / ( і/1Ѳ)dG* (Ѳ)
следует, что G (Ѳ) == G* (Ѳ) для всех G (Ѳ) £ G (J I-
Если все смешивающие функции имеют скачки в конечном числе дискретных точек, а в остальных точках не изменяются, то класс смесей называется классом конечных смесей.
Возможность различимости класса конечных смесей
H = \h(U):h(U)= І Ct f ( U )Ѳг), |
Сг> 0 |
2 |
Сг= 1, |
|||
I |
і= 1 |
|
|
|
»=1 |
|
|
HU I Ѳ) 6 F, |
6 = 1 , |
2, ...J |
|
|
|
означает, что из соотношения |
|
|
|
|
|
|
|
2 c tf(u\Qt)= |
2 C ' i f i u w ) |
|
|||
|
i= 1 |
|
/ = 1 |
|
|
|
следует kx = |
k\ для любого 1 ^ |
i ^ |
k найдется 1 |
^ |
j ^ k x такое, что |
|
Ci = Cj и f {U I 0j) = f (U I Ѳ)). |
Примеры различимых и неразличимых |
|||||
смесей появятся несколько позже. |
|
|
|
|
2. Некоторые свойства классов различимых смесей
Семейство F аддитивно замкнуто, если для любых Ѳх и Ѳ2
f (U \ ®i)*f (U \Ѳ2) = / (GIѲ, + Ѳ2) и /(С/|Ѳ1 + Ѳ2) e-F-
Символ * означает обычную операцию свертки, т. е.
/ (^ I Ѳі) * / (£/1Ѳ2) = § / (U-—Y I Ѳх) f {YI Ѳ2) dY.
58
Если Ѳ— одномерный параметр, т. е. т = 1, то класс смесей Н адди
тивно-замкнутого семейства F = )/ (U I Ѳ); |
Ѳ с R 1: Uc- R p различим |
ПО, 11]. |
^ |
Для конечных смесей известно еще несколько свойств [7]. Для раз личимости класса конечных смесей конечного семейства F = {/х (U),
h (U), fh (U)’ U 6 ^ 1} необходимо и достаточно, чтобы существо вало k действительных чисел ІІЪ U2, ..., Uh ..., Uh, для которых
матрица || § / г (U) dU, 1 ^ |
i, j ^ /гII была бы невырождена. Отсюда, |
— со |
1 |
в частности, следует, что классы конечных смесей конечного семейст ва нормальных и Г-распределений различимы.
Для различимости класса Н конечных смесей, но бесконечного
семейства F необходимо и достаточно, чтобы семейство F (U | Ѳ) ==
и
J f (U I Ѳ) dU было линейно, независимо по параметрам Ѳ [7].
— 00
Отсюда следует, что:
— семейство Fx конечных произведений (р — целое положи тельное число множителей) экспоненциальных распределений разли чимо, т. е. образует класс различимых смесей;
— семейство |
р-мерных нормальных распределений |
F2 образует |
|
различимые конечные смеси; |
|
||
— семейство |
F = F 1(JF2 |
образует различимые конечные смеси; |
|
— множество |
конечных |
смесей распределений Коши |
различимо; |
— f(U\Q) — плотность распределения с одномерным |
параметром |
||
Ѳ. Семейство F плотностей / |
(U | Ѳ) с параметром сдвига образует раз |
личимые конечные смеси.
Таким образом, очень широкий класс конечных смесей различим. Чтобы не создалось ложного впечатления, что неразличимых
смесей нет, приведем несколько примеров. |
одномерных |
нормальных |
||||
П р и м е р |
1. Рассмотрим |
семейство |
||||
распределений, |
задаваемых |
плотностями |
f (U |Ѳ), |
где |
Ѳ £ R 2, |
|
U £ R1, Ѳ' = |
(у, о2), т. е. неизвестно ни математическое |
ожидание |
||||
у, ни дисперсия а2. Рассмотрим класс |
нормальных |
смешивающих |
||||
распределений {/ (Ѳ) = / (Ѳ |а, |
а2)], где |
а и а2 — какие-либо неизве |
||||
стные числа. В этом случае смесь |
|
|
|
|
h(U) = lf(U\Q)f(Q)dö^f(U\a, о2 + а[)
принадлежит семейству нормальных распределений и поэтому может быть представлена следующим образом
f(U\a, |
ol + o*) = lf(U\y, |
о2) f(U\a, a2) d y = |
||
= $/(£/)#, s2)f(U\a, |
s\)dy, |
если |
s2 + s2 = o2 + o2. |
|
Наконец, / (U | a, |
a2 + a2) = |
J / (U\y, o\ |
+ o2) dG (у), где G (у) £ I |
и имеет скачок в точке а. Это значит, что нормальная смесь h (U) =
— f(U\a, о2 + а2) может быть представлена несколькими раз
59
ными способами, т. е. является либо одним представителем класса, либо бесконечной смесью различных представителей этого же клас са. Другими словами, специальная смесь различных наборов из
представителей нормального класса, о |
котором мы ничего не знаем |
|
(т. е. ни средних, ни дисперсий) опять |
является набором |
предста |
вителей из того же нормального класса. |
А это означает, что о нор |
|
мальной совокупности можно говорить |
как об однородной |
группе, |
так и о некоторой специальной смеси бесконечного числа однород ных нормальных групп.
П р и м е р 2. Пусть семейство состоит из равномерных распреде
лений с неизвестными параметрами, т. е. |
Ѳ' = (а, а) £ R2 и плотность |
||
|
О |
при |
£ /> а + сг, |
/ (ДI Ѳ) —/ (£/1а, а) |
— |
при а —а ^ ^ У ^ а + а , |
|
|
2о |
|
|
|
О |
при |
U < а —а. |
Рассмотрим класс конечных G-смесей, когда функция G (Ѳ) = G (а) имеет лишь два скачка, что соответствует смешиванию двух различ ных однородных классов. Легко проверить (рис. 2.1), что для любого Я (0 < Я < 1)
/ (UI а, о) ----- Я/ (UI а—сг(1—Я), |
оЯ) + (1—X)f(U\a + ol, |
сг(1—Я)). |
Это означает, что смешивающая |
функция Gx (а) делает |
два скачка |
величины Я и (1 — Я) и если Ях Ф Я2, то Gx, (а) ф Gx2(а). Аналогично можно произвести разбиение для любого числа классов. Другими сло вами, однородная группа представителей, которые могут появиться равновероятно в любой точке неопределенной области, может тракто ваться как смесь (даже конечная) однородных групп представителей, однородных в том же смысле. Но если об области, где могут появ ляться представители, кое-что известно, например, в нашем случае а = 1/2, то равномерное распределение уже нельзя разбить на смесь двух равномерных распределений с а = 1/2.
П р и м е р 3. Рассмотрим семейство двумерных равномерных распределений на секторах круга единичного радиуса с центром в точке
(О, 0). Сектор |
задается |
начальным направлением ср и углом при вер |
||
шине ß > 0, |
т. е. F = |
{/ (U I Ѳ), где U £ R 2, (ф, ß) = |
Ѳ' £ R 2). Та |
|
ким образом, |
для любых ф, ßx, ß2 (ßx + |
ß2 2л). |
|
|
Pl + P2 |
ß i H H h r ^ l T |
+ ß i ’ М = |
ß i + ß a |
|
|
Pl + ß2 |
|
|
что означает, что семейство смесей F неразличимо. Следовательно, рав номерное распределение на круге с плотностью f (U \0, 2я) £ F можно представить в виде
— /( t/| ф, я) + — f{U I ф+ я, я).
Это означает, что возможно любое разделение точек на два класса прямой, проходящей через центр (см. рис. 2.2).
60
PjlX)
3 ------------------
2 -
Класс I
* Г З
^ Рц(Х) |
0,33 |
0,5 |
|
|
|
|
1 |
|
2 |
' |
|
Щ ' 3 |
1 |
|
|
1 |
\ |
Л(х) |
0,33 |
0,5 |
|
|
Смесь класса5
1
0,5
{рш(Х)
Класс Ш
0,5
■аш(Х)
1,0
1
1
Класс Д
1 .
1,0
І и Л (Ш и Ш) |
1 |
1 |
|
|
1,0* |
1CNj—’* И ? t |
|
|
1 - |
|
Ю |
|
1 |
1 |
|
|
1 |
||
% = ! |
I |
||
Класс Ш |
|||
|
1 |
_____ |
|
|
0,5 |
1,0 |
Рис. 2.1. Пример неразличимых смесей: произвольное разбиение то чек, равномерно распределенных на отрезке прямой, на два класса
61
р,ю |
|
|
/ |
|
и N31. |
7 7 ^ / 7 7 / 7 '/ '7 /’ 7 7 / & |
------------ -------- |
Класс 1 |
------------------------ ^ --------------------------------------------- - |
Класс И
Рис. 2.2. Пример неразличимых смесей: произвольное разбиение точек, равно мерно распределенных на секторах круга, на два класса
6 2