Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 100
Скачиваний: 0
зок склоняет нас к тому, чтобы интерпретировать первый фактор у (1> как фактор общей одаренности, а второй фактор г/<2>как фактор гума нитарной одаренности.
В прямой постановке задачи классификации (т. е. при классифи кации обследованных учащихся) исследователь должен был бы, в пер
вую очередь, определить, как эти два общие фактора г/(1>и г/<2) |
выража |
|||||||||||
ются через исходные признаки хП), х<2), ..., |
х<6>; затем подсчитать зна |
|||||||||||
чения (г/ѵІ), уі2)) (ѵ = |
1, 2, .... 220) этих двух факторов для каждого из |
|||||||||||
обследованных учеников и, |
наконец, нанести 220 точек (у ѵ{u, у ѵ{2)) на |
|||||||||||
плоскость |
г/О) 0 у(2\ |
Расположение |
«точек-учеников» |
на плоскости |
||||||||
позволило бы исследователю полу |
|
|
|
|
|
|||||||
чить |
ряд |
вспомогательных |
сведений, |
|
№ |
|
|
|
||||
полезных при формулировке оконча |
|
|
|
у® |
||||||||
|
|
|
|
|||||||||
тельных выводов (наличие четко вы |
|
|
|
/ |
|
|||||||
раженных |
«сгущений |
точек» •— клас |
0,5 - |
/ |
|
|||||||
сов, |
их |
число, их |
интерпретация |
|
|
|||||||
и т. п.)1. Кстати метод Томсона (4.32) |
|
/ т(з) |
|
|||||||||
дает в качестве оценки общих факто |
|
/ |
* |
*х(!) |
|
|||||||
ров выражения: |
|
|
|
/ |
|
•х(г) |
||||||
|
г/< 1) = |
0,245x0 + |
0,208х<2>+ |
|
/ |
|
1 |
Ю) |
||||
|
|
/ |
|
|||||||||
+ |
0,158х<3>+ 0,278x0+ 0,271х<5>+ |
|
К------ |
0.5 |
|
|||||||
|
\ |
|
•т(б) |
|
||||||||
|
+ |
0,157х<6>, |
yW = 0,352^Р) + |
|
\ |
|
|
|||||
|
|
|
.х(5) |
|||||||||
+ |
0,201х<2) + |
0,309х<3>— 0,351х(4>— |
|
\ |
\ |
•хі*) |
||||||
-0,5 |
- |
|
|
|||||||||
|
|
—0,303х<5>—0,126x0. |
\ |
|
|
|||||||
|
При обратной (двойственной) по |
|
|
|
^ |
у 0) |
||||||
становке задачи, т. е. при классифи |
|
|
|
|
|
|||||||
кации исследуемых |
признаков хО), |
Рис. |
4.7. Изображение |
исходных |
||||||||
х<2), |
..., х<6>, |
оказывается |
полезной |
|||||||||
следующая геометрическая интерпре |
признаков х<‘>, |
... , х<6> в плоско |
||||||||||
сти двух общих факторов д(1>, у<2> |
||||||||||||
тация общих факторов и исходных |
||||||||||||
|
|
|
|
|
||||||||
признаков. Рассмотрим рис. 4.7, на |
|
|
|
|
а коорди |
|||||||
котором осями координат являются общие факторы г/(1>и у<-2\ |
наты точек (у[\\ у™) = (qtl, qi2) определяются нагрузками /-го ис ходного признака на общие факторы (/ = 1, 2, ..., 6). Соответственно точку {ди, <7і2) удобно интерпретировать как изображение і-го исход ного признака х<(). Расположение точек на рис. 4.7 свидетельствует о естественном распадении совокупности исходных признаков на две группы: группу гуманитарных признаков (хС), х<2>, х<3)) и группу математических признаков (х<4>, х<5>, х<в>).
Кстати, подобная геометрическая интерпретация помогает вы брать вращение системы общих факторов, наиболее подходящее с точ ки зрения возможности их содержательной интерпретации. Дело в
1 Аналогичную задачу классификации ткачих при исследовании их произ водительности труда см. в п. 4 предыдущего параграфа.
183
том, что как мы уже отмечали, параметры |
модели факторного |
ана |
|||||
лиза, в том числе и сами общие факторы у (1), |
уір,), |
опре |
|||||
деляются |
не однозначно, а лишь |
с точностью |
до некоторого |
орто |
|||
гонального преобразования, т. е. |
с точностью до вращения |
осей у*1), |
|||||
у(2\ ..., |
в пространстве. При этом выбор окончательного реше |
||||||
ния, т. е. |
закрепление системы у(1), |
у(2\..., |
у (р,) |
в определенном по |
|||
ложении, |
находится в распоряжении |
исследователя. Другими слова |
|||||
ми, исследователь должен решить вопрос: |
как, |
располагая некото |
|||||
рым частным решением у ^ \ г/<2>, ..., у<Р'\ |
полученным, |
например, |
|||||
с помощью центроидного метода, |
выбрать такое |
ортогональное |
пре |
образование, такой поворот осей г/<1>, г/<2>, ..., у (р,), при котором по
лучаемые при этом новые общие факторы г/*1), г/<2), ..., у(р">допус-' кают наиболее естественную и убедительную содержательную интер претацию. Рассматривая расположение исходных признаков в плос кости г/(1>0 г/<2> или в пространстве, натянутом на первые три об щих фактора, естественно повернуть координатную систему таким образом, чтобы координатные оси прошли через наиболее четко вы раженные сгущения точек-признаков (см. поворот, намеченный пунк
тирными осями г/<Р и г/(2>на рис. 4.7). При этом иногда бывает полезно отказаться от ортогональности общих факторов, переходя к косо угольной системе координат.
§ 3. ЭВРИСТИЧЕСКИЕ МЕТОДЫ СНИЖЕНИЯ РАЗМЕРНОСТИ
Описанные выше методы сокращения размерности факторного пространства (метод главных компонент и модели факторного анализа) допускали интерпретацию в терминах той или иной строгой вероятно стной модели и, следовательно, подразумевали возможность исследо вания свойств рассматриваемых процедур в рамках теории математи ческой статистики (см. п. 3., § 1,2 настоящей главы). В данном пара графе речь пойдет о методах, подчиненных некоторым частным целе вым установкам (наименьшее искажение геометрической структуры исходных «выборочных точек», наименьшее искажение их эталонного разбиения на классы и т. д.), но не формулируемых в терминах вероят ностно-статистической теории ]. Процедура выбора той или иной целе вой установки, подходящей именно для данной конкретной задачи, практически не формализована, носит эвристический характер, т. е., как правило, обусловливается лишь опытом и интуицией исследо вателя. Поэтому мы и будем называть такие методы эвристическими.
Надо признаться, что при отсутствии априорной или выборочной предварительной информации о природе исследуемого вектора наблю дений и о генеральных совокупностях, из которых эти наблюдения извлекаются, точно в таком же невыгодном положении находятся методы, факторного анализа и главных компонент. Однако для них
1 Отсутствие строгой вероятностно-статистической модели, лежащей в ос нове тех или иных методов, не исключает возможности использования отдель ных вероятностно-статистических понятий и соответствующей терминологии, как это имеет место, например, в методе экстремальной группировки факторов, в методе корреляционных плеяд и некоторых других.
184
все-таки существует принципиальная возможность теоретического обоснования (при наличии соответствующей дополнительной инфор мации), в то время как эвристические методы не претендуют и на это.
Хочется подчеркнуть, что факт описания здесь методов сниже ния размерности, не использующих предварительной информации, например, обучающих или квазиобучающих выборок, следует рас ценивать лишь как следствие признания неизбежности ситуаций, в которых мы такой информации не имеем, но не как стремление рек ламировать эти методы в качестве наиболее эффективных. В действи тельности же обоснованное и эффективное решение задач снижения размерности без слепой надежды на удачу, можно, по нашему мнению, получить лишь на пути глубокого профессионального анализа, до полненного статистическими методами, использующими предвари тельную выборочную (обучающую) информацию.
1. Методы, не использующие обучающих выборок
а) Нелинейное отображение выборочных точек в пространство мень шей размерности, наименее искажающее их геометрическую конфигу рацию. Пусть, как обычно, Х ъ Х 2, ..., Хп — результаты р-мерных
наблюдений, «снятые» на п исследуемых объектах. И пусть |
= |
= рЕ (Xi, X j) = 1 / 2 1 (4 V) — */V>)2 — евклидово расстояние |
между |
ѵ=1 |
|
точками Х і и Xj в исходном р-мерном пространстве. |
|
Метод, предложенный в работе 131], состоит в нелинейном однознач ном отображении п данных точек (векторов) из р-мерного исходного факторного пространства Rp в пространство меньшей размерности. Особенно важны отображения в двухили трехмерное пространство (р' = 2,3), так как полученная там конфигурация из п точек поддает ся непосредственному графическому изображению. Ставится цель ми нимально (в некотором смысле) исказить исходную конфигурацию из п точек. Опишем этот метод и укажем некоторые возможности его модификации.
Пусть в результате некоторого однозначного отображения (проек ции) П имеющиеся у нас исходные многомерные наблюдения
( 1 )
преобразованы (спроектированы) в соответствующие п наблюдений
185
р а сп о л о ж ен н ы е в п р остр ан ств е R p ' м еньш ей |
р азм ер н ости , т . е . |
= |
= П (X,). |
Х„ к конфигурации Ylt |
|
При переходе от конфигурации Хь Х2, |
У2, ■ Уп, попарные расстояния d*j между исходными точками X, и Xj преобразуются в расстояния йц = р£ (К,, Yj)- В качестве меры
искажения конфигурации исходных точек введем величину А, кото рую естественно рассматривать как функцию от переменных г/^ѵ> (ѵ =
= 1, 2, |
p', i = |
1, 2, |
n).\ |
|
|
|
A W P |
У1 >• • • >У п ) |
V |
К / - * ; ] 2 |
|
|
|
|
|
— |
i < / |
4 |
г < У |
|
Предлагается следующая эвристическая итерационная процедура подбора переменных г/-ѵ> с целью минимизации функции
A(z/i‘\ У ?\ .... Уір,), |
.... Уп'})- пусть |
1 |
^ |
|
Ы*ц — dij(m)]2 |
|||||
Ат |
і <\ |
|
d‘i |
|
||||||
|
|
|
|
|
|
|
|
|||
|
|
после т-й итерации, где с = |
п |
|
|
|
||||
ошибка отображения |
^ |
d,y и cfü-(m) = |
||||||||
|
|
|
|
|
|
|
і < / |
|
|
|
2 |
[г/(-ѵ)(т) —г//ѵ) (m)]2. |
Следующая (т + |
1)-я |
итерация за |
||||||
ѵ = |
1 |
|
|
|
|
|
|
|
|
|
дается: |
|
|
|
|
|
|
|
|
|
|
|
г/'ѵ) (ш + 1) = |
(v) , |
|
|
|
|
|
|
||
|
у/Г' (т) —абіѴ(m), |
|
|
|
|
|||||
где |
|
|
d&m |
I |
d2 Ащ |
|
|
|
|
|
|
б , ѵ ( w ) |
|
|
|
|
|
||||
|
Ф/[ѵ) (от) j |
d [t/jv) (m)]2 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|||
а а определено эмпирически (автор [31] использовал а |
« |
0,3 или 0,4). |
||||||||
На первом шаге итерационной процедуры набор |
Ylt У2, .... Уп |
фик |
||||||||
сируется |
случайным образом или находится с помощью |
метода |
глав |
ных компонент (см. § 1 настоящей главы).
На ряде примеров удалось показать, что данная процедура приво дит к отображению П, которое достаточно хорошо сохраняет некото рые геометрические свойства исходной конфигурации точек.
Так, в качестве исходных данных брались 9 точек, расположен ных на прямой в R9 на равных расстояниях друг от друга; после при менения к ним описанной выше процедуры, задающей преобразо вание П, на плоскости были получены точки, лежащие на одной прямой.
При отображении конфигурации из 8 точек, лежащих на окружно сти в R9 на равных расстояниях друг от друга, и центра этого круга, на плоскости R2 были получены точки, лежащие практически на ок-
186