Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 104

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Как упоминалось, в основной модели (4.20) при p' > 1 оказывается слишком много неизвестных параметров для их однозначного определе­ ния. Поэтому вначале исследователь должен выбрать какую-то систему дополнительных априорных соотношений, связывающих неизвестные параметры модели, которые делают решение задачи однозначным и позволяют получить относительно простое частное решение системы (4.21). Затем он может отказаться от этих дополнительных соотноше­ ний, подбирая с помощью подходящего ортогонального преобразования

(вращения осёй) тот вариант оценок нагрузок qtj и остаточных диспер­

сий Ѵц, который ему кажется предпочтительнее в основном с точки зре­ ния возможности содержательной интерпретации получаемых при этом общих факторов и их нагрузок.

а) Различные варианты дополнительных априорных соотношений между q i j и v i i t постулируемых исследователем с целью однозначной идентификации анализируемой модели:

1) решение (Q, К) системы (4.21) ищется лишь в классе таких матриц Q и V, для которых матрица

Q'VQ

имеет диагональный вид, причем диагональные элементы этой мат­ рицы различны и упорядочены в порядке убывания1;

2) из всех решений системы (4.21) выбирается лишь то, для которого матрица

Q'Q

диагональна, причем все диагональные элементы различны и упоря­ дочены (в порядке убывания);

3)решение системы (4.21) ищется лишь среди таких матриц Q, ко

торые для заранее заданной матрицы (размера р X р') В = {Ьц), і = = 1 , ..., р, j = 1 , ..., p' ранга p' удовлетворяют требованию

В частности, выбор

р'

М \ о.."’ . /°

1 В некоторых случаях к этому условию добавляется требование специаль ного вида матрицы остаточных дисперсий, а именно V = а2І.

173

приводит к ограничению на Q типа

1

9п

о

. . .

0

 

Q n

922

. .

0

 

qp- 1 9 p '2

••■ qp’ p'

1

qpi

<7;>2

■ ■ Я р р '

что означает: первый исходный признак лЗ1* должен выражаться толь­ ко через один первый общий фактор второй признак х<2>— через два общих фактора у(1) и у(2> и т. д.

Можно, кстати, показать, что при соответствующем выборе вспомо­ гательной матрицы В определение искомых параметров модели приво­ дит к решению ранее сформулированной экстремальной задачи (4.24).

Содержательную интерпретацию условий 3) следует искать в ситуа­ циях, когда исследователь располагает некоторой априорной инфор­ мацией, из которой можно, во-первых, извлечь реальный гипотети­ ческий смысл общих факторов и, во-вторых, постулировать наличие определенного числа нулевых элементов в матрице нагрузок Q (с более или менее точным указанием их «адреса»), что означает априорное отри­

цание зависимости исходных признаков

от некоторых из общих

факторов г/б> (/ = 1, 2,

..., р'). Эта же идея реализуется и в других,

менее формализованных

вариантах дополнительных условий («про­

стые структуры», «нулевые элементы в специфических позициях» [161), на которых мы здесь не будем останавливаться.

б) Описание общего итерационного подхода к выявлению структуры модели факторного анализа. Конкретная реализация этого подхода за­ висит от выбора варианта идентифицирующих условий типа 1)—3). Как правило, исследователю известна лишь ковариационная матрица

2(или ее выборочное значение 2, пока мы их различать не будем). Логическая схема итераций следующая:

во-первых,

задаемся некоторым нулевым приближением Ѵ<°) мат­

рицы V;

используя (4.21),

получаем

нулевое

приближение

во-вторых,

¥(°> =

2 — К<°> матрицы ¥ = QQ' = 2

V;

 

 

в-третьих,

по ¥ с помощью

некоторого

специального приема

(см. ниже) последовательно определяем

нулевые приближения

q[°\

qi0),

для столбцов ft, ft, .... qp. матрицы Q.

и т. д.

Затем определяем следующее

(первое)

приближение

Что

касается специального

приема

определения

столбцов

ft

— 1, 2, ..., p') матрицы Q при известной матрице ¥ = QQ', то он опи­ рается на тот факт, что матрица ¥ может быть представлена в виде

¥ = ft ft + ft Ці + ... -Уду qp>-

Используя специфику выбранных идентифицирующих условий опре­

деляют

вначале

столбец ft.

Затем переходят к

матрице ¥ х = ¥ —

ft<71 =

q^ 2 + ...

+ ft-ft/ и

определяют столбец

ft и т. д.

174


Так, например, в случае «обобщенного условия треугольное™» 3) этот прием дает:

D

d2, ..., dp-).

Здесь di і-й столбец матрицы D;

YB == QQ' 5 = QD’ = ^ d[ + ... + qp. d p’.,

B ’Y B ^ B ’QQ’B ^D D ' = dxd[ + ... + dP'd'p>.

Последние два матричных уравнения можно расписать в виде:

^ Ь і qxdii +

... +

qt da (i — 1,2,

... , p'),

¥b, = dyirfn +

... +

dwd,/ ( /< / ,

/ = 1, ...,/?')•

Отсюда можно последовательно находить

d l^ b lY b ,- , Y x - , Y - qiqlq2= ^ ,

(4.26)

<7i

В случае условий идентификации типа 1) легко проверить, что столб­ цы qlt ..., qP' являются первыми р' обобщенными собственными вектора­ ми (в метрике V) матрицы Тг, т. е. являются решением уравнения

 

 

y q i — h V q i = 0 (і =

1, ..., p'),

 

(4.27)

где Xi — t-й по величине характеристический корень уравнения

 

 

 

|¥ —ХУ| = 0.

 

 

(4.27')

Поэтому общая итерационная схема определения структуры модели

реализуется

здесь в такой последовательности:

1/(0> ->

= 2 —

V(0)

q (о)

_ решение

уравнений

(4.27)

WW =

Q<°> Q<°>' ->

i/(i)

= 2

i^d) Q ( n — решение уравнений (4.27) и т. д.

Аналогичная реализация общей итерационной схемы определения структуры модели имеет место и в случае условий идентификации типа

(2), с той только разницей, что уравнения (4.27)

и (4.27') следует заме­

нить уравнениямиI

 

I Y —Я/ 1= 0 (г = 1, 2......

(4.28)

в) Статистическое оценивание факторных нагрузок Цц и остаточ ных дисперсий Ѵц. Оценивание производится либо методом максималь­ ного правдоподобия (см. § 1 главы 1), либо так называемым центроид-

ным методом. Первый метод используется обычно при идентифицирую­ щих условиях типа 1) и 2), хотя дает эффективные оценки для Цц и Ѵ ц , но требует постулирования закона распределения исследуемых величин (разработан он лишь в нормальном случае), а также весьма об­ ременительных вычислений. Что касается центроидного метода, кото­ рый используется при идентифицирующих условиях типа 3), то, давая

175


оценки, близкие к оценкам максимального правдоподобия, он, как и всякий непараметрический метод, является более «устойчивым по от­ ношению к отклонениям от нормальности исследуемых признаков и требует меньшего объема вычислений. Однако из-за определенного про­ извола в его процедуре, которая вскоре будет приведена, статистичес­ кая оценка метода, исследование его выборочных свойств (в общем слу­ чае) практически невозможны. Можно представить себе проведение по­ добных исследований лишь в каких-то специальных случаях, один из которых намечен, например, в [16].

Общая схема реализации метода максимального правдоподобия следующая. Составляется логарифмическая функция правдоподобия, как функция неизвестных параметров qtj и ѵн, отвечающая иссле­ дуемой модели, т. е. учитывающая нормальность Х г, ... , Хп, модель (4.20) и соответственно (4.21); дополнительные идентифицирующие усло­ вия 1) или 2). С помощью дифференцирования этой функции правдо­ подобия по каждому из неизвестных параметров и приравнивания полученных частных производных к нулю получается система урав­ нений, в которой известными величинами являются выборочные ко­

вариации аі}, а также числа р и р ', а неизвестными — искомые па­ раметры qtj и ѵн . И, наконец, предлагается вычислительная (как правило, итерационная) процедура решения этой системы. За под­ робностями мы отсылаем читателя к [9], [22] и [16]. Заметим, что реализация описанной выше (для случаев 1) и 2)) обшей итерацион­ ной вычислительной схемы с заменой неизвестной ковариационной

матрицы исходных признаков 2 ее выборочным аналогом 2 приве­ дет нас как раз к оценкам максимального правдоподобия параметров qtj и ѵп (1=1,2 , ... , р; / = 1,2, ... , р). Отметим также, что в [16]

при достаточно общих ограничениях доказана асимптотическая нор­ мальность оценок максимального правдоподобия Q и V, что дает ос­ нову для построения соответствующих интервальных оценок.

Как было отмечено, центроидный метод является одним из способов реализации вычислительной схемы (4.26), приспособленной для вы­ явления структуры модели факторного анализа и оценки неизвест­ ных параметров в случае идентифицирующих условий типа 3). Этот метод поддается весьма простой геометрической интерпретации. Отождествим исследуемые признаки xW, ..., x^) с векторами, выходя­ щими из начала координат некоторого вспомогательного р-мерного пространства, построенными таким образом, чтобы косинусы углов между хб) и хб) равнялись бы их парным корреляциям {ги), а длины векторов X«) — стандартным отклонениям соответствующих перемен­

ных

(а '/2).

Далее изменим на время, если необходимо,

направления,

т. е.

знаки

отдельных векторов так, чтобы как можно

больше корре­

ляций стало положительными. Тогда векторы будут иметь тенденцию к группировке в одном направлении в пучок. После этого первый общий фактор г/<х> определяется как нормированная (т. е. как вектор еди­ ничной длины) сумма всех исходных векторов пучка и, следовательно, он будет проходить каким-то образом через середину (центр)этого пучка; отсюда название «центроид» для общего фактора в этом случае.

176


Переходя затем к остаточным переменным х(П>= х<‘>—qix

под­

считывая ковариационную матрицу

= У qxq[ для этих оста­

точных переменных и проделывая относительно х<П) и 2W всю ту же самую процедуру построения пучка и т. п., выделяем второй общий фактор («второй центроид») г/<2>и т. д.

Формализация этих соображений приводит к следующей итераци­ онной схеме вычислений по определению факторных нагрузок qu и остаточных дисперсий ѵц с учетом описанной ранее вычислительной схемы (4.26). Задаемся некоторым начальным приближением У<°> для дисперсий остатков V. Обычно полагают [9, 42].

ѵ(и = <*„ [1 — max \ги \].

К К Р

(/ ф і)

Подсчитываем Чг(°) = 2 — Ѵ(°>. Выбираем в качестве нулевого прибли­ жения первого столбца Ь1 вспомогательной матрицы В столбец, состоящий из одних единиц

1

Ь[0)

1

Далее в соответствии с (4.26) определяем нулевое приближение <?^°> первого столбца матрицы нагрузок

!р(°) Ь(0)

 

 

г*

 

Затем вычисляется.матрица

ЧГ<0>="ЧГ<0) — q ^ q[°y

и определяется

нулевое приближение q ^

второго столбца матрицы нагрузок

92( 0

 

ір(°) 6(0)

(4.29)

)

1_

(б<°)' ¥<°> 6<°>)2

где вектор Ь[0) состоит только из + 1 или — 1, а знаки подбираются из условия максимизации знаменателя правой части (4.29) и т. д. Полу­

чив, таким образом, нулевое приближение Q(°> = (<7<°>, ..., q ^ ) для матрицы нагрузок Q, вычисляем ]/<’>= 2 — Q(°)Q(0)' и переходим к сле­ дующей итерации. При этом матрица В не обязана совпадать с Д°>. Кстати, как нетрудно усмотреть из вышесказанного, і-й столбец мат­ рицы В задает веса, с которыми суммируются векторы одного пучка для образования t-ro общего фактора («центроида»). Поскольку смысл центроидной процедуры — в простом суммировании векторов пучка;

она иногда так и называется — «процедура простого суммирования», то исследователю остается определить лишь нужное направление каж­ дого из векторов пучка, т. е. знаки единиц, образующих столбцы

177