Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 107
Скачиваний: 0
наблюдений А и для произвольного I = 1, |
2, |
k |
заданы некоторые |
|
специальные функции ф (Хг, А) |
и ф (Хг, |
|
Е), |
характеризующие |
меру типичности точки Хг как |
представителя |
группы точек А |
(меру однородности наблюдений Хг и группы наблюдений А) и меру типичности точки Х і как представителя класса S lt построенного с ис пользованием эталонного множества Ег из Е.
Будем для определенности считать, что чем меньше значения функ ций ф и ф, тем типичнее соответствующая точка в указанном выше смысле. Тогда общая схема эталонных алгоритмов может быть пред ставлена следующим образом.
При заранее заданном числе классов k каким-то образом (случай ным, с помощью обучающих выборок, из экспертно-профессиональ ных соображений или с помощью методов предварительной обработки исходных данных) выбираются числа тх, т2, ..., mk и начальная сис тема эталонных множеств Е<°> = (Е)0’, Ег0*, .... £*”}. Класс 5)0) форми
руется из наблюдений, |
наиболее типичных с точки зрения представи |
||
тельства эталона Е\й\ |
т. е. |
|
|
Sj0) = \X t : ф {Хи E\Q)) < |
ф (Хг, £ /0>), / = 1 ,2 ...... k, } ф і ) . |
||
Если оказывается, что ф (Хг, |
Е\0)) = ф(Хь £ /0)), то |
м о ж н о условиться |
|
относить наблюдение X; к тому из классов S)0) и |
который обладает |
меньшим порядковым номером. Затем строится новая система эталон ных множеств Е = {Е(і1>, Е 21), ...jEfc1’}, в которой эталон Ег(1) форми руется из mt точек, дающих тгнаименьших значений функции ф (X, S)0), Е(0>). После этого по тому же правилу строят новое разбиение S a> = {Si1*, Зг1’, ..., S*1’}, но уже относительно эталонов Еш и т. д. Итерации продолжают до тех пор, пока не получат устойчивых клас сов, т. е. до такого номера ѵ, при котором S<v>= S<v+*).
Если число классов, на которое требуется разбить исходную сово купность наблюдений, заранее не известно, то в описанную схему не обходимо ввести некоторые дополнения. В частности, на начальном этапе устанавливаются: числа &(°>, ти т2, ..., mÄ<0>, система эталонных множеств Е(0) = {Е(і0), Eg01, ..., £І<о>}, а также величина ф0—минималь но возможная типичность точки, представляющей свой класс, и ф0 —
минимально возможная |
нетипичность |
двух разных |
классов1. Как |
||||
и прежде, вначале подсчитываются ф(Хг, £)0)) |
для всех наблюдений |
||||||
(г = |
1, 2, .... л) и для всех эталонов (/==1,2, ..., /г<0)). Последовательно |
||||||
для каждого і определяются |
эталоны |
£ ;“/), для которых данное і-е |
|||||
наблюдение является наиболее типичным, т. е. |
|
|
|
||||
|
ф(Хг, £ {% )= |
min |
ф(Хг, £ /0)). |
|
|
||
|
|
|
1< I< ft(°) |
|
|
|
|
1 |
В наиболее общих процедурах «пороги» |
<р0 и ф0, |
так же как и общее число |
||||
«<ѵ) |
элементов (nSv^ < и), |
составляющих |
классы |
, |
..., |
задаются |
переменными, т. е. изменяющимися по определенному правилу при переходе от
одного этапа алгоритма к другому (см., например, процедуру, описанную в § 4 главы I).
105
Если |
ф(Хх, Е/0^)) ^ |
сро, |
то |
наблюдение |
Х г |
включается |
|
в |
состав |
|||||||||||
класса S'% ; если же ф(Хх, Е(/о)) > |
Фо. |
т0 |
|
наблюдение |
Х г прини |
|||||||||||||||
мается |
одновременно |
за |
новый |
эталон |
|
|
о)+ 1 |
и |
за |
новый |
||||||||||
класс |
5^(0) . |
Затем |
та |
же |
процедура |
сравнения |
производится |
|||||||||||||
с ф (Х2, Е\% ) |
и |
т. |
д. до ф(Хп, £'%)). Пусть |
в результате |
у нас |
|||||||||||||||
образовалась на этом этапе алгоритма &(0) (0) |
классов |
и столько же |
||||||||||||||||||
эталонов Е=^{£І0), |
.... Е*°о)(0)}. очевидно |
/г(0) (0 )> k{0). После этого |
||||||||||||||||||
полученные классы |
S<0), |
S<2°>, |
|
S^(o){0) |
проверяются |
на |
значимое |
|||||||||||||
попарное различие с помощью порога ф0, а именно, если |
|
|
|
|||||||||||||||||
|
|
фГ < |
- Ж 0), |
s\0))= ^ Г - |
2 |
|
|
|
E(0)) + |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
* |
Lna4 |
xiX.eаs< |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
ф(Х,; S q, |
.;<°Л |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
__ |
E(0)) |
<Фо> |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
'q> |
|
|
|
|
|
|
||||||
|
|
|
|
|
Щ XjfiSt |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
то классы S q0) |
и S\0) объединяются |
в |
один |
|
класс S{<7> |
с |
номером |
|||||||||||||
z (q, |
I), |
равным |
min |
(q, |
/), |
и |
с |
эталоном |
Е ^ , п, |
состоящим |
||||||||||
из max (mq, т{) |
наблюдений, |
дающих |
соответствующее число наи |
|||||||||||||||||
меньших |
значений |
функции |
ф (X, |
Sz { 4 f Е(0)). Последовательное |
||||||||||||||||
вычисление величин ф (S(q0), Sj0>) |
и |
их сравнение с ф0 |
производится |
|||||||||||||||||
до тех пор, пока не окажется, |
что |
|
|
|
|
|
|
|
|
|
|
min ф ^ ^ ф о -
<7. I
Это означает окончание первой итерации алгоритма и образование
новой системы эталонов Е<'> |
= {El1*, |
E^J)} и |
соответствующих |
|||
значимо различимых классов S (0) = |
{Si0), S 20), .... |
д. |
Затем процеду |
|||
ра повторяется применительно к эталонам Е<‘) и т. |
до |
получения |
||||
устойчивого разбиения S (v) |
всех |
исходных элементов |
на |
некоторое |
||
число классов k(v+lK |
|
|
|
|
|
|
Описание подобной схемы, но лишь для случая априори заданного числа классов k и постоянного числа классифицируемых (на каждом шаге алгоритма) элементов я <ѵ>= я было дано в [39].
Для этого частного случая в данной работе приводятся результаты исследования сходимости эталонных алгоритмов, подчиняющихся опи санной выше общей логической схеме.
Чтобы сформулировать главный результат этого исследования, введем здесь некоторые новые определения и понятия.
Будем называть последовательность наборов эталонных множеств
Е<л>= (Е^), |
,.м Е<,п>} сходящейся |
к |
Е (lim Е(п) = |
Е), |
если, начиная |
||||
с некоторого |
достаточно |
большого |
|
П^-ОО |
Е<л>= |
Е, при всех |
|||
номера я0 |
|||||||||
я ^ я0. |
называть набор |
эталонных |
множеств |
|
Е = |
{Ех, .... Eh} |
|||
Будем |
1, |
||||||||
локально |
оптимальным, если для |
всех |
X t (і = |
2, |
..., я) любого |
106
эталонного |
элемента I из множества |
Ej |
(т. |
е. I ^Ej) и любого / |
= 1, |
|||||
2, .... k. |
|
|
|
|
|
|
|
|
|
|
|
|
|
S], |
Е )> ф (/, |
Sj, |
Е). |
|
|
||
Заметим, |
кстати, что в алгоритме работы [33] (см. пример |
1) набор |
||||||||
эталонных точек Е = {е1г |
е2, |
..., |
eh} |
будет |
локально оптимальным, |
|||||
если эталонные точки еъ е2, .., |
eh совпадают |
со средними групп зада |
||||||||
ваемого ими разбиения, т. е. являются несмещенными. |
..., |
Eh} |
||||||||
Определим |
далее для |
любых |
двух |
наборов Е = {Еъ |
||||||
и Е = {Elt |
..., |
Eh} величину |
|
|
|
|
|
|
|
|
|
|
А(Е, Ё )= |
2 |
2 |
ф (*, |
Sj, Ё). |
|
|
||
|
|
|
і= 1Xе Е. |
|
|
|
|
Из вышесказанного следует, что качество процедуры классифика ции определяется удачным (или неудачным) выбором функций ср и ф. Естественно попытаться сформулировать какие-то необходимые ус ловия, которым должны удовлетворять эти функции, т. е. сузить
класс функций, среди |
которых следует вести поиски |
нужных нам |
Ф и ф. |
|
|
Одно из таких условий сформулируем следующим образом: |
||
из А (Е, Е) ^ А (Е, Е) |
должно всегда следовать, что |
|
|
А(Е, Е )< А (Е , É). |
(3.26) |
Другими словами, если некая суммарная характеристика степени типичности эталонных точек Ej (из эталона Е) как представителей
классов S j (Е), построенных по другому эталону Е лучше, чем та же характеристика для эталонных точек E j (по которым и строятся клас
сы S;(E)), то переход к классам S j (Е), построенных по первому этало ну Е может только улучшить эту суммарную характеристику степени типичности эталонных точек Е.
Легко проверить, что условие (3.26) окажется выполненным, если
определять |
|
|
|
|
Ф ( X , E j |
) = |
2 |
p ( X , X t), |
|
|
х; ея. |
|
|
|
ф(Х, S j , |
Е) = ф ( X , S j ) . |
|
||
И наконец, будем полагать, |
что |
|
|
|
ф(Хг, 5 ^ ф № |
, 5 , ) |
при І ф і . |
(3.27) |
Оказывается, что если функции ф и ф в эталонном алгоритме выбра ны таким образом, что выполняются условия (3.26) и (3.27), то после-
107
довательность наборов эталонных множеств Е<л>сходится и ее предел является локально-оптимальным1.*
При конструировании функций ф (X, А) и ф (X, S,, Е) можно использовать заданную метрику (расстояние между точками) р (X, Y) или меру близости г (X, Y), а также подходящим образом выбранный вариант обобщенного расстояния (3.9).
Используются, в частности, следующие способы задания ф и ф:
Ф(Х, Л )= 2 Р(Х, Хг),
хгел
ф (X, А) =р(Х, Х(А)),
где X (А) — одна из разновидностей среднего значения всех наблю
дений Хь принадлежащих группе А. Например, X (А) может быть обычным арифметическим средним, т. е. «центром тяжести» группы Л.
|
|
Ф(Х, S„ Е) |
ф(Х, S;)-(p(X, El) |
|
|
|
|
|
к |
2 ’ |
|
||
|
|
|
2 |
Ф (X, Ej) |
|
|
|
|
|
./=1 |
|
|
|
|
|
Ф(Х, S;, Е) = |
ф (X, S,). |
|
|
|
в) |
Примеры |
параллельных |
кластер-процедур, |
укладывающихся |
||
в описанную общую схему. |
|
|
|
|
||
П рГгГме р 1. |
Если каждое из эталонных множеств Е\оу состоит |
|||||
лишь из одной точки е\0), т. е. |
тг = |
т2 = ... = |
mk = |
1, а исследуе |
||
мое р-мерное факторное пространство является евклидовым, то при |
||||||
выборе функции ф и ф по формулам |
|
|
|
|||
|
|
ф (Х ,£ ;) = Р в(^ еО , |
|
|
||
|
|
Ф (X, S i , Е) = |
S P Se ( X , X |
{) , |
|
|
|
|
|
Xi^ Sl |
|
|
полученный по описанной выше схеме (для случая заранее заданного числа классов k) алгоритм совпадает с алгоритмом, описанным в [47], и является модификацией известного алгоритма из [33] для сйтуации, в которой априори не известен вид плотности распределения исследуе мого признака X.
П р и м е р 2. В [49] предлагается алгоритм разделения исследуе мой совокупности наблюдений на два класса, причем для удобства пред полагается, что наблюдения исследуемой совокупности центрирова ны, т. е.
' |
_ |
1 |
п |
Х - 0 . |
|
X = |
— |
2 |
|
|
|
п |
i t 1 |
* |
1 Этот результат приведен в [39] без доказательства. Там же замечено, что
условие (3.26) является слишком сильным, так как во многих ситуациях сходится, даже если оно не выполнено. Что касается условия (3.27), то оно носит технический характер и обычно обходится с помощью специальной договорен ности относительно правила отнесения наблюдения X* к одному из классов в слу чае совпадения двух или большего числа минимальных значений <р (X*, Sf) при фиксированном і.
108
Очевидно, это не ограничивает общность рассматриваемой схемы. В алгоритме используются два эталонных множества, каждое из кото
рых |
состоит |
из |
произвольно |
выбранной |
единственной точки, |
т. |
е. |
|||||||||||||
£(°) |
_ |g(1°)) |
е р) . |
На нулевом шаге алгоритма отнесение наблюдения |
|||||||||||||||||
Хг (i — 1, 2, |
..., п) к одному из двух классов S li0) и S 20) зависит от знака |
|||||||||||||||||||
скалярного произведения (Хг, а„), где а0 — |
|
— е20))- Так что класс |
||||||||||||||||||
5І0) будет состоять из всех тех Хг, для которых (Хг, а 0) > |
0, |
а класс |
||||||||||||||||||
5^0) — из всех тех Хг, для которых (Хг, а 0) < |
0. Далее производится |
|||||||||||||||||||
пересчет эталонов по формулам |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
е\Х) = 2 |
р і 1 ) х „ еі 1 ) = |
- |
|
|
2 |
ß l 1 ) x 1, |
|
|
|||||||||
|
|
|
|
xie s l |
|
|
|
|
|
|
xt es'2 |
|
|
|
|
|
|
|||
|
|
|
|
|
V с с ( ° ) |
|
|
|
|
|
|
|
( 0) |
|
|
|
|
|
|
|
где |
= |
(Xj, а0) |
и т. д. |
На |
(ѵ+ |
1)-м |
шаге |
алгоритма |
эталоны |
|||||||||||
определяются по формулам |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
(ѵ + і)= |
2 |
ßjv) X. |
Лѵ+і> |
= |
|
|
2 |
ß i v , x i( |
|
|
|
|||||||
|
|
е\ |
|
|
|
|
|
|
eh |
|
|
|
|
|
|
|||||
|
|
|
|
V |
с |
|
|
|
|
|
|
|
V |
c |
c(V) |
|
|
|
|
|
|
|
|
|
Xi 6 Si |
|
|
|
|
|
|
|
Xi |
GS2 |
|
|
|
|
|
||
где |
ßjv) = |
(Xj, av). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Заметим, |
что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
«ѵ-и = |
с(Г+І)- 4 |
ѵ+1)= |
i |
2 (Xj, a v) X j = |
2 (2 x p{ |
air ) ) |
X„ |
|
||||||||||||
T. e. |
|
|
|
|
= |
1 |
|
|
|
|
t = l |
\ r = l |
|
|
|
|
|
|||
|
|
|
a v + 1 = A x A x’ a v — nW av, |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
где |
A x — (p X n) — матрица |
наблюденных |
компонент |
xjr) (i = |
1, |
|||||||||||||||
2, ..., n\ r = |
1,2, ...,p), a |
W — выборочная ковариационная матрица |
||||||||||||||||||
исследуемого признака X. Легко видеть, что если в вышеописанной об |
||||||||||||||||||||
щей схеме (при k = |
2) определить <p (X, Е{) = |
(X, ег), / = |
1, 2, а в ка |
|||||||||||||||||
честве функции ф (X, Sj, |
Е) взять любую функцию, |
принимающую |
||||||||||||||||||
(при фиксированном I) минимальное значение в точках Х<;>= |
|
Б |
х |
|||||||||||||||||
Х(Хг, е±— е2) Xj, то мы придем |
к только что описанному алгоритму |
|||||||||||||||||||
разделения исходной совокупности на два класса1. |
объединенных |
|||||||||||||||||||
П р и м е р 3. |
Рассмотрим теперь серию алгоритмов, |
названием «Форель» [12], [16]. Общую для этих алгоритмов идею проил люстрируем на примере алгоритма «Форель-1».
Пусть совокупность {Хх, Х2, .... |
Х п} нужно разбить каким-то об |
разом на некоторое число классов |
(заранее не известное). Пусть |
— 1 л |
_ |
X = —Б Xj и R0 — радиус минимальной гиперсферы с центром в X,
Гі і—1
содержащей все точки исследуемой совокупности. Зададим произволь
ный радиус R < |
R0 и рассмотрим процедуру выделения классов для |
||
заданного R. Из любой точки Хг = |
Хх, принятой за центр, радиусом |
||
1 В |
качестве |
ф (X, Si, Е) можно |
взять, например, ф (X, Si, Е) = |
= Ре ( |
2 (Xi, ei- e 2) Xi, X ) . |
|
109