Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 100

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

зок склоняет нас к тому, чтобы интерпретировать первый фактор у (1> как фактор общей одаренности, а второй фактор г/<2>как фактор гума­ нитарной одаренности.

В прямой постановке задачи классификации (т. е. при классифи­ кации обследованных учащихся) исследователь должен был бы, в пер­

вую очередь, определить, как эти два общие фактора г/(1>и г/<2)

выража­

ются через исходные признаки хП), х<2), ...,

х<6>; затем подсчитать зна­

чения (г/ѵІ), уі2)) (ѵ =

1, 2, .... 220) этих двух факторов для каждого из

обследованных учеников и,

наконец, нанести 220 точек (у ѵ{u, у ѵ{2)) на

плоскость

г/О) 0 у(2\

Расположение

«точек-учеников»

на плоскости

позволило бы исследователю полу­

 

 

 

 

 

чить

ряд

вспомогательных

сведений,

 

 

 

 

полезных при формулировке оконча­

 

 

 

у®

 

 

 

 

тельных выводов (наличие четко вы­

 

 

 

/

 

раженных

«сгущений

точек» •— клас­

0,5 -

/

 

сов,

их

число, их

интерпретация

 

 

и т. п.)1. Кстати метод Томсона (4.32)

 

/ т(з)

 

дает в качестве оценки общих факто­

 

/

*

*х(!)

 

ров выражения:

 

 

 

/

 

•х(г)

 

г/< 1) =

0,245x0 +

0,208х<2>+

 

/

 

1

Ю)

 

 

/

 

+

0,158х<3>+ 0,278x0+ 0,271х<5>+

 

К------

0.5

 

 

\

 

•т(б)

 

 

+

0,157х<6>,

yW = 0,352^Р) +

 

\

 

 

 

 

 

.х(5)

+

0,201х<2) +

0,309х<3>— 0,351х(4>—

 

\

\

•хі*)

-0,5

-

 

 

 

 

—0,303х<5>—0,126x0.

\

 

 

 

При обратной (двойственной) по­

 

 

 

^

у 0)

становке задачи, т. е. при классифи­

 

 

 

 

 

кации исследуемых

признаков хО),

Рис.

4.7. Изображение

исходных

х<2),

..., х<6>,

оказывается

полезной

следующая геометрическая интерпре­

признаков х<‘>,

... , х<6> в плоско­

сти двух общих факторов д(1>, у<2>

тация общих факторов и исходных

 

 

 

 

 

признаков. Рассмотрим рис. 4.7, на

 

 

 

 

а коорди­

котором осями координат являются общие факторы г/(1>и у<-2\

наты точек (у[\\ у™) = (qtl, qi2) определяются нагрузками /-го ис­ ходного признака на общие факторы (/ = 1, 2, ..., 6). Соответственно точку {ди, <7і2) удобно интерпретировать как изображение і-го исход­ ного признака х<(). Расположение точек на рис. 4.7 свидетельствует о естественном распадении совокупности исходных признаков на две группы: группу гуманитарных признаков (хС), х<2>, х<3)) и группу математических признаков (х<4>, х<5>, х<в>).

Кстати, подобная геометрическая интерпретация помогает вы­ брать вращение системы общих факторов, наиболее подходящее с точ­ ки зрения возможности их содержательной интерпретации. Дело в

1 Аналогичную задачу классификации ткачих при исследовании их произ­ водительности труда см. в п. 4 предыдущего параграфа.

183


том, что как мы уже отмечали, параметры

модели факторного

ана­

лиза, в том числе и сами общие факторы у (1),

уір,),

опре­

деляются

не однозначно, а лишь

с точностью

до некоторого

орто­

гонального преобразования, т. е.

с точностью до вращения

осей у*1),

у(2\ ...,

в пространстве. При этом выбор окончательного реше­

ния, т. е.

закрепление системы у(1),

у(2\...,

у (р,)

в определенном по­

ложении,

находится в распоряжении

исследователя. Другими слова­

ми, исследователь должен решить вопрос:

как,

располагая некото­

рым частным решением у ^ \ г/<2>, ..., у<Р'\

полученным,

например,

с помощью центроидного метода,

выбрать такое

ортогональное

пре­

образование, такой поворот осей г/<1>, г/<2>, ..., у (р,), при котором по­

лучаемые при этом новые общие факторы г/*1), г/<2), ..., у(р">допус-' кают наиболее естественную и убедительную содержательную интер­ претацию. Рассматривая расположение исходных признаков в плос­ кости г/(1>0 г/<2> или в пространстве, натянутом на первые три об­ щих фактора, естественно повернуть координатную систему таким образом, чтобы координатные оси прошли через наиболее четко вы­ раженные сгущения точек-признаков (см. поворот, намеченный пунк­

тирными осями г/<Р и г/(2>на рис. 4.7). При этом иногда бывает полезно отказаться от ортогональности общих факторов, переходя к косо­ угольной системе координат.

§ 3. ЭВРИСТИЧЕСКИЕ МЕТОДЫ СНИЖЕНИЯ РАЗМЕРНОСТИ

Описанные выше методы сокращения размерности факторного пространства (метод главных компонент и модели факторного анализа) допускали интерпретацию в терминах той или иной строгой вероятно­ стной модели и, следовательно, подразумевали возможность исследо­ вания свойств рассматриваемых процедур в рамках теории математи­ ческой статистики (см. п. 3., § 1,2 настоящей главы). В данном пара­ графе речь пойдет о методах, подчиненных некоторым частным целе­ вым установкам (наименьшее искажение геометрической структуры исходных «выборочных точек», наименьшее искажение их эталонного разбиения на классы и т. д.), но не формулируемых в терминах вероят­ ностно-статистической теории ]. Процедура выбора той или иной целе­ вой установки, подходящей именно для данной конкретной задачи, практически не формализована, носит эвристический характер, т. е., как правило, обусловливается лишь опытом и интуицией исследо­ вателя. Поэтому мы и будем называть такие методы эвристическими.

Надо признаться, что при отсутствии априорной или выборочной предварительной информации о природе исследуемого вектора наблю­ дений и о генеральных совокупностях, из которых эти наблюдения извлекаются, точно в таком же невыгодном положении находятся методы, факторного анализа и главных компонент. Однако для них

1 Отсутствие строгой вероятностно-статистической модели, лежащей в ос­ нове тех или иных методов, не исключает возможности использования отдель­ ных вероятностно-статистических понятий и соответствующей терминологии, как это имеет место, например, в методе экстремальной группировки факторов, в методе корреляционных плеяд и некоторых других.

184


все-таки существует принципиальная возможность теоретического обоснования (при наличии соответствующей дополнительной инфор­ мации), в то время как эвристические методы не претендуют и на это.

Хочется подчеркнуть, что факт описания здесь методов сниже­ ния размерности, не использующих предварительной информации, например, обучающих или квазиобучающих выборок, следует рас­ ценивать лишь как следствие признания неизбежности ситуаций, в которых мы такой информации не имеем, но не как стремление рек­ ламировать эти методы в качестве наиболее эффективных. В действи­ тельности же обоснованное и эффективное решение задач снижения размерности без слепой надежды на удачу, можно, по нашему мнению, получить лишь на пути глубокого профессионального анализа, до­ полненного статистическими методами, использующими предвари­ тельную выборочную (обучающую) информацию.

1. Методы, не использующие обучающих выборок

а) Нелинейное отображение выборочных точек в пространство мень­ шей размерности, наименее искажающее их геометрическую конфигу­ рацию. Пусть, как обычно, Х ъ Х 2, ..., Хп — результаты р-мерных

наблюдений, «снятые» на п исследуемых объектах. И пусть

=

= рЕ (Xi, X j) = 1 / 2 1 (4 V) — */V>)2 — евклидово расстояние

между

ѵ=1

 

точками Х і и Xj в исходном р-мерном пространстве.

 

Метод, предложенный в работе 131], состоит в нелинейном однознач­ ном отображении п данных точек (векторов) из р-мерного исходного факторного пространства Rp в пространство меньшей размерности. Особенно важны отображения в двухили трехмерное пространство (р' = 2,3), так как полученная там конфигурация из п точек поддает­ ся непосредственному графическому изображению. Ставится цель ми­ нимально (в некотором смысле) исказить исходную конфигурацию из п точек. Опишем этот метод и укажем некоторые возможности его модификации.

Пусть в результате некоторого однозначного отображения (проек­ ции) П имеющиеся у нас исходные многомерные наблюдения

( 1 )

преобразованы (спроектированы) в соответствующие п наблюдений

185


р а сп о л о ж ен н ы е в п р остр ан ств е R p ' м еньш ей

р азм ер н ости , т . е .

=

= П (X,).

Х„ к конфигурации Ylt

При переходе от конфигурации Хь Х2,

У2, ■ Уп, попарные расстояния d*j между исходными точками X, и Xj преобразуются в расстояния йц = р£ (К,, Yj)- В качестве меры

искажения конфигурации исходных точек введем величину А, кото­ рую естественно рассматривать как функцию от переменных г/^ѵ> (ѵ =

= 1, 2,

p', i =

1, 2,

n).\

 

 

 

A W P

У1 >• • • >У п )

V

К / - * ; ] 2

 

 

 

 

i < /

4

г < У

 

Предлагается следующая эвристическая итерационная процедура подбора переменных г/-ѵ> с целью минимизации функции

A(z/i‘\ У ?\ .... Уір,),

.... Уп'})- пусть

1

^

 

Ы*ц — dij(m)]2

Ат

і <\

 

d‘i

 

 

 

 

 

 

 

 

 

 

 

после т-й итерации, где с =

п

 

 

 

ошибка отображения

^

d,y и cfü-(m) =

 

 

 

 

 

 

 

і < /

 

 

2

[г/(-ѵ)(т) —г//ѵ) (m)]2.

Следующая +

1)-я

итерация за­

ѵ =

1

 

 

 

 

 

 

 

 

 

дается:

 

 

 

 

 

 

 

 

 

 

 

г/'ѵ) (ш + 1) =

(v) ,

 

 

 

 

 

 

 

у/Г' (т) —абіѴ(m),

 

 

 

 

где

 

 

d&m

I

d2 Ащ

 

 

 

 

 

 

б , ѵ ( w )

 

 

 

 

 

 

Ф/[ѵ) (от) j

d [t/jv) (m)]2

 

 

 

 

 

 

 

 

 

 

 

 

 

а а определено эмпирически (автор [31] использовал а

«

0,3 или 0,4).

На первом шаге итерационной процедуры набор

Ylt У2, .... Уп

фик­

сируется

случайным образом или находится с помощью

метода

глав­

ных компонент (см. § 1 настоящей главы).

На ряде примеров удалось показать, что данная процедура приво­ дит к отображению П, которое достаточно хорошо сохраняет некото­ рые геометрические свойства исходной конфигурации точек.

Так, в качестве исходных данных брались 9 точек, расположен­ ных на прямой в R9 на равных расстояниях друг от друга; после при­ менения к ним описанной выше процедуры, задающей преобразо­ вание П, на плоскости были получены точки, лежащие на одной прямой.

При отображении конфигурации из 8 точек, лежащих на окружно­ сти в R9 на равных расстояниях друг от друга, и центра этого круга, на плоскости R2 были получены точки, лежащие практически на ок-

186