Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 104
Скачиваний: 0
Как упоминалось, в основной модели (4.20) при p' > 1 оказывается слишком много неизвестных параметров для их однозначного определе ния. Поэтому вначале исследователь должен выбрать какую-то систему дополнительных априорных соотношений, связывающих неизвестные параметры модели, которые делают решение задачи однозначным и позволяют получить относительно простое частное решение системы (4.21). Затем он может отказаться от этих дополнительных соотноше ний, подбирая с помощью подходящего ортогонального преобразования
(вращения осёй) тот вариант оценок нагрузок qtj и остаточных диспер
сий Ѵц, который ему кажется предпочтительнее в основном с точки зре ния возможности содержательной интерпретации получаемых при этом общих факторов и их нагрузок.
а) Различные варианты дополнительных априорных соотношений между q i j и v i i t постулируемых исследователем с целью однозначной идентификации анализируемой модели:
1) решение (Q, К) системы (4.21) ищется лишь в классе таких матриц Q и V, для которых матрица
Q'VQ
имеет диагональный вид, причем диагональные элементы этой мат рицы различны и упорядочены в порядке убывания1;
2) из всех решений системы (4.21) выбирается лишь то, для которого матрица
Q'Q
диагональна, причем все диагональные элементы различны и упоря дочены (в порядке убывания);
3)решение системы (4.21) ищется лишь среди таких матриц Q, ко
торые для заранее заданной матрицы (размера р X р') В = {Ьц), —і = = 1 , ..., р, j = 1 , ..., p' ранга p' удовлетворяют требованию
В частности, выбор
р'
М \ ’о.."’ . /°
1 В некоторых случаях к этому условию добавляется требование специаль ного вида матрицы остаточных дисперсий, а именно V = а2І.
173
приводит к ограничению на Q типа
1 |
9п |
о |
. . . |
0 |
|
Q n |
922 |
■ . . |
0 |
|
qp- 1 9 p '2 |
••■ qp’ p' |
||
1 |
qpi |
<7;>2 |
•■ ■ Я р р ' |
что означает: первый исходный признак лЗ1* должен выражаться толь ко через один первый общий фактор второй признак х<2>— через два общих фактора у(1) и у(2> и т. д.
Можно, кстати, показать, что при соответствующем выборе вспомо гательной матрицы В определение искомых параметров модели приво дит к решению ранее сформулированной экстремальной задачи (4.24).
Содержательную интерпретацию условий 3) следует искать в ситуа циях, когда исследователь располагает некоторой априорной инфор мацией, из которой можно, во-первых, извлечь реальный гипотети ческий смысл общих факторов и, во-вторых, постулировать наличие определенного числа нулевых элементов в матрице нагрузок Q (с более или менее точным указанием их «адреса»), что означает априорное отри
цание зависимости исходных признаков |
от некоторых из общих |
|
факторов г/б> (/ = 1, 2, |
..., р'). Эта же идея реализуется и в других, |
|
менее формализованных |
вариантах дополнительных условий («про |
стые структуры», «нулевые элементы в специфических позициях» [161), на которых мы здесь не будем останавливаться.
б) Описание общего итерационного подхода к выявлению структуры модели факторного анализа. Конкретная реализация этого подхода за висит от выбора варианта идентифицирующих условий типа 1)—3). Как правило, исследователю известна лишь ковариационная матрица
2(или ее выборочное значение 2, пока мы их различать не будем). Логическая схема итераций следующая:
во-первых, |
задаемся некоторым нулевым приближением Ѵ<°) мат |
||||||
рицы V; |
используя (4.21), |
получаем |
нулевое |
приближение |
|||
во-вторых, |
|||||||
¥(°> = |
2 — К<°> матрицы ¥ = QQ' = 2 |
— V; |
|
|
|||
в-третьих, |
по ¥ с помощью |
некоторого |
специального приема |
||||
(см. ниже) последовательно определяем |
нулевые приближения |
q[°\ |
|||||
qi0), |
для столбцов ft, ft, .... qp. матрицы Q. |
и т. д. |
|||||
Затем определяем следующее |
(первое) |
приближение |
|||||
Что |
касается специального |
приема |
определения |
столбцов |
ft |
(і — 1, 2, ..., p') матрицы Q при известной матрице ¥ = QQ', то он опи рается на тот факт, что матрица ¥ может быть представлена в виде
¥ = ft ft + ft Ці + ... -Уду qp>-
Используя специфику выбранных идентифицирующих условий опре
деляют |
вначале |
столбец ft. |
Затем переходят к |
матрице ¥ х = ¥ — |
ft<71 = |
q^ 2 + ... |
+ ft-ft/ и |
определяют столбец |
ft и т. д. |
174
Так, например, в случае «обобщенного условия треугольное™» 3) этот прием дает:
D |
d2, ..., dp-). |
Здесь di — і-й столбец матрицы D;
YB == QQ' 5 = QD’ = ^ d[ + ... + qp. d p’.,
B ’Y B ^ B ’QQ’B ^D D ' = dxd[ + ... + dP'd'p>.
Последние два матричных уравнения можно расписать в виде:
^ Ь і —qxdii + |
... + |
qt da (i — 1,2, |
... , p'), |
¥b, = dyirfn + |
... + |
dwd,/ ( /< / , |
/ = 1, ...,/?')• |
Отсюда можно последовательно находить
d l^ b lY b ,- , Y x - , Y - qiqlq2= ^ ,
(4.26)
<7i
В случае условий идентификации типа 1) легко проверить, что столб цы qlt ..., qP' являются первыми р' обобщенными собственными вектора ми (в метрике V) матрицы Тг, т. е. являются решением уравнения
|
|
y q i — h V q i = 0 (і = |
1, ..., p'), |
|
(4.27) |
|
где Xi — t-й по величине характеристический корень уравнения |
||||||
|
|
|
|¥ —ХУ| = 0. |
|
|
(4.27') |
Поэтому общая итерационная схема определения структуры модели |
||||||
реализуется |
здесь в такой последовательности: |
1/(0> -> |
= 2 — |
|||
V(0) |
q (о) |
_ решение |
уравнений |
(4.27) |
WW = |
Q<°> Q<°>' -> |
i/(i) |
= 2 |
— i^d) Q ( n — решение уравнений (4.27) и т. д. |
Аналогичная реализация общей итерационной схемы определения структуры модели имеет место и в случае условий идентификации типа
(2), с той только разницей, что уравнения (4.27) |
и (4.27') следует заме |
нить уравнениямиI |
|
I Y —Я/ 1= 0 (г = 1, 2...... |
(4.28) |
в) Статистическое оценивание факторных нагрузок Цц и остаточ ных дисперсий Ѵц. Оценивание производится либо методом максималь ного правдоподобия (см. § 1 главы 1), либо так называемым центроид-
ным методом. Первый метод используется обычно при идентифицирую щих условиях типа 1) и 2), хотя дает эффективные оценки для Цц и Ѵ ц , но требует постулирования закона распределения исследуемых величин (разработан он лишь в нормальном случае), а также весьма об ременительных вычислений. Что касается центроидного метода, кото рый используется при идентифицирующих условиях типа 3), то, давая
175
оценки, близкие к оценкам максимального правдоподобия, он, как и всякий непараметрический метод, является более «устойчивым по от ношению к отклонениям от нормальности исследуемых признаков и требует меньшего объема вычислений. Однако из-за определенного про извола в его процедуре, которая вскоре будет приведена, статистичес кая оценка метода, исследование его выборочных свойств (в общем слу чае) практически невозможны. Можно представить себе проведение по добных исследований лишь в каких-то специальных случаях, один из которых намечен, например, в [16].
Общая схема реализации метода максимального правдоподобия следующая. Составляется логарифмическая функция правдоподобия, как функция неизвестных параметров qtj и ѵн, отвечающая иссле дуемой модели, т. е. учитывающая нормальность Х г, ... , Хп, модель (4.20) и соответственно (4.21); дополнительные идентифицирующие усло вия 1) или 2). С помощью дифференцирования этой функции правдо подобия по каждому из неизвестных параметров и приравнивания полученных частных производных к нулю получается система урав нений, в которой известными величинами являются выборочные ко
вариации аі}, а также числа р и р ', а неизвестными — искомые па раметры qtj и ѵн . И, наконец, предлагается вычислительная (как правило, итерационная) процедура решения этой системы. За под робностями мы отсылаем читателя к [9], [22] и [16]. Заметим, что реализация описанной выше (для случаев 1) и 2)) обшей итерацион ной вычислительной схемы с заменой неизвестной ковариационной
матрицы исходных признаков 2 ее выборочным аналогом 2 приве дет нас как раз к оценкам максимального правдоподобия параметров qtj и ѵп (1=1,2 , ... , р; / = 1,2, ... , р). Отметим также, что в [16]
при достаточно общих ограничениях доказана асимптотическая нор мальность оценок максимального правдоподобия Q и V, что дает ос нову для построения соответствующих интервальных оценок.
Как было отмечено, центроидный метод является одним из способов реализации вычислительной схемы (4.26), приспособленной для вы явления структуры модели факторного анализа и оценки неизвест ных параметров в случае идентифицирующих условий типа 3). Этот метод поддается весьма простой геометрической интерпретации. Отождествим исследуемые признаки xW, ..., x^) с векторами, выходя щими из начала координат некоторого вспомогательного р-мерного пространства, построенными таким образом, чтобы косинусы углов между хб) и хб) равнялись бы их парным корреляциям {ги), а длины векторов X«) — стандартным отклонениям соответствующих перемен
ных |
(а '/2). |
Далее изменим на время, если необходимо, |
направления, |
т. е. |
знаки |
отдельных векторов так, чтобы как можно |
больше корре |
ляций стало положительными. Тогда векторы будут иметь тенденцию к группировке в одном направлении в пучок. После этого первый общий фактор г/<х> определяется как нормированная (т. е. как вектор еди ничной длины) сумма всех исходных векторов пучка и, следовательно, он будет проходить каким-то образом через середину (центр)этого пучка; отсюда название «центроид» для общего фактора в этом случае.
176
Переходя затем к остаточным переменным х(П>= х<‘>—qix |
под |
|
считывая ковариационную матрицу |
= У — qxq[ для этих оста |
точных переменных и проделывая относительно х<П) и 2W всю ту же самую процедуру построения пучка и т. п., выделяем второй общий фактор («второй центроид») г/<2>и т. д.
Формализация этих соображений приводит к следующей итераци онной схеме вычислений по определению факторных нагрузок qu и остаточных дисперсий ѵц с учетом описанной ранее вычислительной схемы (4.26). Задаемся некоторым начальным приближением У<°> для дисперсий остатков V. Обычно полагают [9, 42].
ѵ(и = <*„ [1 — max \ги \].
К К Р
(/ ф і)
Подсчитываем Чг(°) = 2 — Ѵ(°>. Выбираем в качестве нулевого прибли жения первого столбца Ь1 вспомогательной матрицы В столбец, состоящий из одних единиц
1
Ь[0)
1
Далее в соответствии с (4.26) определяем нулевое приближение <?^°> первого столбца матрицы нагрузок
!р(°) Ь(0)
|
|
г* |
|
Затем вычисляется.матрица |
ЧГ<0>="ЧГ<0) — q ^ q[°y |
и определяется |
|
нулевое приближение q ^ |
второго столбца матрицы нагрузок |
||
92( 0 |
|
ір(°) 6(0) |
(4.29) |
) |
1_ |
(б<°)' ¥<°> 6<°>)2
где вектор Ь[0) состоит только из + 1 или — 1, а знаки подбираются из условия максимизации знаменателя правой части (4.29) и т. д. Полу
чив, таким образом, нулевое приближение Q(°> = (<7<°>, ..., q ^ ) для матрицы нагрузок Q, вычисляем ]/<’>= 2 — Q(°)Q(0)' и переходим к сле дующей итерации. При этом матрица В не обязана совпадать с Д°>. Кстати, как нетрудно усмотреть из вышесказанного, і-й столбец мат рицы В задает веса, с которыми суммируются векторы одного пучка для образования t-ro общего фактора («центроида»). Поскольку смысл центроидной процедуры — в простом суммировании векторов пучка;
она иногда так и называется — «процедура простого суммирования», то исследователю остается определить лишь нужное направление каж дого из векторов пучка, т. е. знаки единиц, образующих столбцы
177