Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 101

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Непосредственная ориентация (при подборе знаков у компонент векто­ ра Ьі) на максимизацию выражений

хотя и несколько сложнее реализуема, чем некоторые эвристические приемы, опирающиеся на анализ знаков элементов остаточных матриц Чгі_1 [9, стр. 41—46], но быстрее и надежнее приводит к выделению именно таких центроидов, которые при заданном р' будут обусловли­ вать возможно большую часть общей дисперсии исходных признаков, т. е. минимизировать дисперсию остаточных компонент ut.

Заметим, что если не все исходные ковариации положительны, может быть целесообразным использование и в качестве Ь[0) вектора, состоящего как из -fl так и из —1. Отметим также, что недостатком центроидного метода является зависимость центроидных нагрузок от шкалы, в которой измерены исходные признаки. Поэтому исходные признаки обычно нормируют с помощью среднеквадратических от­

клонений с )/2, так что выборочная ковариационная матрица Е заменя­

ется во всех рассуждениях выборочной корреляционной матрицей R- Анализируя описанную выше процедуру центроидного метода, не­ трудно понять, что построенные таким способом общие факторы могут интерпретироваться как первые р' «условных» главных компонент

матрицы 2 — V, найденные при дополнительном условии,что компо­ ненты соответствующих собственных векторов могут принимать лишь два значения: плюс или минус единица.

г) Оценка значений общих факторов. Эта задача является одной и основных задач исследования. Действительно, мало установить лишь сам факт существования небольшого числа скрыто действующих об­ щих факторов г/<1>, ..., у (р)', объясняющих природу взаимной коррели­ рованное™ исходных признаков в основную часть их дисперсии. Же­ лательно непосредственно «выловить» эти общие факторы, описать их в терминах исходных признаков и постараться дать им удобную со­ держательную интерпретацию.

Мы приведем здесь идеи и результаты двух распространенных мето­ дов решения этой задачи, предложенных в разное время Бартлеттом (1938 г.) и Томсоном (1951 г.). В обоих случаях мы предполагаем за­

дачу статистического оценивания неизвестных нагрузок Q' = (qi}) и

остаточных дисперсий V — (ѵц) уже решенной.

Первый метод (метод Бартлетта) рассматривает отдельно для каж­ дого фиксированного номера наблюдения ѵ (ѵ = 1, 2, ..., п) модель

(4.20) как регрессию признака хѵ по аргументам <7.1, <7.2, •••, q.P'\ три этом верхний индекс і = 1,2, ..., р у признака (и соответствующий первый нижний индекс у нагрузок) играет в данном случае роль номе­ ра наблюдений в этой регрессионной схеме, так что

р'

*ѵг>= 2 уіп qu + Ui (i = !> •••> p)- /= 1

178


Таким образом величины у[1), у ^ \ ...,у (р ) интерпретируются как

неизвестные коэффициенты регрессии хѵпо q.lt q.2, •••, q.p'• В соответ­ ствии с известной техникой метода наименьших квадратов (с учетом «неравноточности» измерений, т. е. того факта, что вообще говоря Dx(,4) ф Dx <г'*> при ігФ і2), определяющей неизвестные коэффициенты

регрессии Yv = (уУ1, .... уіР')У из условия

I

min >4

1

 

 

 

2

 

( 4

° - І yln І и j1 -

он \

 

/ =:[

 

р

 

 

Р'

І/У»

у - ( > - V

і = 1

оц

\

/ = 1

 

 

 

 

получаем [2]

Kv = (Ö' V“ 1Q)_I Q' V_ I Xv ( v = l ......

я).

(4.30)

Очевидно, если исследуемый вектор наблюдений X нормален, то эти оценки являются одновременно и оценками максимального прав­ доподобия. Нестрогость данного метода — в замене истинных (неизвест­ ных нам) величин qa и vti и х приближенными (оценочными) значе­

ниями qij и Ѵц.

Второй метод (метод Томсона) рассматривает модель (4.20) как

бы «вывернутой

наизнанку»,

а именно как

регрессию зависимых

переменных г/W,

..., ур’ по аргументам У 1), ..., х ^ .

Тогда коэффициен­

ты Cij в соотношениях

 

 

 

 

У(і) = У\

си х(і"> (і =■ 1, ...,

p')

 

/ = 1

или в матричной записи

Y = СХ,

где С — матрица коэффициентов Сц размера p' X р, находятся в со­ ответствии с методом наименьших квадратов из условия

п

л '

!

л

 

\ 0

п

Л' /

 

л

2

2

уУ -

/ = 1

Лі)

/

= mm

22

у ?

V са х(/) . (4.31)

ѵ= 1 г = І

\

 

cij

ѵ=1г-1 \

/=1

Поскольку решение экстремальной задачи (4.31) выписывается, как известно [2], в терминах ковариаций х(і) и y ü \ то отсутствие на­ блюдений по зависимым переменным г/<г) можно компенсировать зна­ нием этих ковариаций, так как легко подсчитать, что

179


Отсюда, используя известные формулы метода наименьших квад­ ратов, получаем (с заменой матрицы Q, V и Г их выборочными анало­ гами)

Уѵ = ( / + r ) - ' Q у - ' Х ѵ (ѵ = 1, 2, ..., п),

(4.32)

где матрица Г (размера р X р) определяется соотношением

r t = Q’ V ~ l Q,

Сравнение выражений (4.30) и (4.32) позволяет получить явное ■соотношение между решением по методу Бартлетта У(Б) и решением, предложенным Томсоном У<Т).

У(Б) ='(/ + г - 1)У(Т).

Если элементы матрицы Q'E_1Q достаточно велики, то эти два метода будут давать близкие решения.

д) Статистическая проверка гипотез. Проверка гипотез, связанных с природой и параметрами используемой модели факторного анализа, составляет один из необходимых моментов исследования. К сожале­ нию, теория статистических критериев применительно к моделям фак­ торного анализа разработана весьма слабо. Пока удалось построить лишь так называемые критерии адекватности модели, т. е. критерии, предназначенные для проверки гипотез типа гипотезы Н0, заклю­ чающейся в том, что исследуемый вектор наблюдений X допускает представление с помощью модели факторного анализа (4.20) с данным (заранее выбранным) числом общих факторов р '. При этом критиче­ ская статистика у (Хь ..., X J, т. е. функция от результатов наблю­ дения, по значению которой принимается решение об отклонении или непротиворечивости высказанной гипотезы Я0, зависит от вида допол­ нительных (идентифицирующих) условий модели. Так, если рассмат­ ривается модель с дополнительными идентифицирующими условиями вида 1), т. е. дополнительно постулируется диагональность матрицы

Г = Q 'y_1Q, то гипотеза Н0 отвергается (с вероятностью ошибиться, приблизительно равной а) в случае

Ті(*і, ...,Х п) = я(іп|І> I + In I / +

r | - l n | 2 | ) > x ä ( v x ) ,

где число степеней свободы

 

 

 

и = ~-1(р р У ~ ( р + р ')]\

 

 

«го положительность обеспечивается условием (4.25), а

(ѵг), как и

ранее величина 100 а %-ной точки %2-распределения с

ѵх степенями

свободы (находится из таблиц).

 

 

 

На языке ковариационных матриц гипотеза Н0 означает в данном

случае, что элементы матрицы 2 — (QQ' +

V) должны лишь

статисти­

чески незначимо отличаться от нуля, или,

что эквивалентно,

матрица

2 — V должна иметь ранг, равный р'. А это, в свою очередь, означает

что последние р р' характеристических корней £р»+1,

...,

і р урав-

180


нения I 2 •— V "KV) =

0 должны лишь незначимо отличаться от

нуля. Кстати, статистика ух (Хь

Хп) может быть записана в тер­

минах этих характеристических корней, а именно

Уі(Хѵ

Х п) = п

2

 

 

і = Р '+ 1

Если же в качестве

идентифицирующих условий дополнительно

к (4.20), или, что то же, к (4.21), постулируется наличие какого-то за­ ранее заданного числа т нулевых нагрузок qtJ из общего числа р ■р' на определенных («специфических») позициях, то гипотеза # 0 отвер­ гается (с вероятностью ошибиться, приблизительно равной а) в случае

у2(Х1; ..., Х„) = л(1п| Ѵ |+

ln IQ

V ~ l ± V - 1Q | -

ІП ( Г I In I 2

I) >

Ха (Ѵ-г)»

где число степеней свободы

 

 

',2 = у Р ( Р ~ 1 ) - ( Р ' Р ' ~ т ) -

Иногда удобнее вычислять критическую статистику у2 (Х1; ..., Хп) в терминах характеристических корней zlt z2, ..., zp (занумерован­ ных в порядке убывания их величин) выборочной корреляционной матрицы R исследуемого вектора наблюдений X:

Ѵа(Х1, ....

Х п) = і^п-

\ 2 p + U

2p^ X

f

2

h

 

 

X (Р — JD') ІП *

i = p' + l

-

• 2

in s,

 

P —P'

 

i—P' + 1

 

 

 

Статистики ух (Xx, ..., Xn) и y2 (Xi,

.... Xn) получены в результате

реализации известной схемы критерия отношения правдоподобия.

Пользуясь этой схемой можно построить аналогичные критерии адекватности и для некоторых специальных вариантов центроидного метода [9, с. 50]. Однако из-за слишком узких рамок такой модели эти критерии, с нашей точки зрения, не представляют достаточного инте­ реса.

До сих пор не удалось построить многомерной решающей процеду­

ры типа р' (2),т. е. оценки для неизвестного числа общих факторов р'. В настоящее время приходится ограничиваться последовательной эк­ сплуатацией критериев адекватности Н0 : р' = р'а (р'0 — заранее

задано) при альтернативе Нг: р' >

р'п.

Если гипотеза Н'0 отвергается,

то переходят к проверке гипотезы

Я '

: р' = р'0 + 1 при альтернати­

ве Н [: р’> р 0-\-\ и т. д. Однако по уровням значимости а каждой от­ дельной стадии такой процедуры трудно сколько-нибудь точно судить о свойствах чвсей последовательной процедуры в целом.

181


Пользуясь асимптотической нормальностью оценок Q и V, можно было бы попытаться строить критерии для проверки гипотез, каса­ ющихся значений-факторных нагрузок, например, гипотез о том, что некоторые признаки не зависят от заранее определенных факторов,

т. е. что на определенных местах матрицы Q стоят элементы, статиче­ ски незначимо отличающиеся от нуля. Однако построение этих кри­ териев затруднено из-за вычислительно-нереализуемого вида кова­

риационных матриц оценок Q и V [16]. Правда, это затруднение можно обойти, используя в качестве приближенного решения критерий не­ значимого отклонения от нуля множественного коэффициента корре­

ляции между заданным

исследуемым признаком х

и заранее опре­

деленным набором факторов у {іі\ г/('2>,

...,

у (ія)

(q

p').

Для этого,

естественно, придется

предварительно

оценить значения

этих факто­

ров

..., г/(Ѵ ,

а

затем

воспользоваться

известной техникой

[2,

с. 126].

 

 

 

 

 

 

 

 

 

4. Факторный анализ в задачах классификации

 

 

Выше уже была отмечена близость моделей главных компонент и

факторного анализа.

Поэтому

замечания,

сформулированные в и. 4

предыдущего параграфа и относящиеся к общим идеям использования главных компонент в задачах классификации и к так называемому дуализму в постановке задачи, в полной мере относятся и к модели фак­ торного анализа.

Будет полезно пояснить это на конкретном примере с использова­ нием специфики и терминологии именно факторного анализа.

В табл. 4.3 приведены коэффициенты корреляции между отметками по шести школьным предметам, подсчитанные по выборке из 220 уча­ щихся [9].

 

 

 

 

 

 

Т а б л и ц а

4.3

 

 

 

Н о м е р п р и з н а к а

 

 

Н а г р у з к а ф а к т о ­

С о д е р ж а т е л ь н ы й

 

 

 

 

р о в н а п р и з н а к и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с м ы с л п р и з н а к а

 

 

 

 

 

 

 

Чі*

 

 

2

3

4

5

6

 

Отметка по:

1

0,439

0,410

0,288

0,329

0,248

0,606

0,337

гэльскому языку х {1)

английскому языку 0,439

1

0,351

0,354

0,320

0,329

0,611

0,197

истории х (3>

0,410

0,351

1

0,164

0,190

0,181

0,458

0,384

арифметике х(і)

0,288

0,354

0,164

1

0,595

0,570

0,683

—0,365

алгебре х(б>

0,329

0,320

0,190

0,595

1

0,464

0,686

—0,335

геометрии x (ß)

0,248

0,329

0,181

0,470

0,464

1

0,575

—0,212

В последних двух столбцах таблицы даны факторные нагрузки qtl, <7і2 на исследуемые признаки в бифакторной модели (p' = 2), подсчи­ танные по приведенной здесь корреляционной матрице с помощью центроидного метода. Простой анализ величин и знаков этих нагру-

182