Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 101
Скачиваний: 0
Непосредственная ориентация (при подборе знаков у компонент векто ра Ьі) на максимизацию выражений
хотя и несколько сложнее реализуема, чем некоторые эвристические приемы, опирающиеся на анализ знаков элементов остаточных матриц Чгі_1 [9, стр. 41—46], но быстрее и надежнее приводит к выделению именно таких центроидов, которые при заданном р' будут обусловли вать возможно большую часть общей дисперсии исходных признаков, т. е. минимизировать дисперсию остаточных компонент ut.
Заметим, что если не все исходные ковариации положительны, может быть целесообразным использование и в качестве Ь[0) вектора, состоящего как из -fl так и из —1. Отметим также, что недостатком центроидного метода является зависимость центроидных нагрузок qц от шкалы, в которой измерены исходные признаки. Поэтому исходные признаки обычно нормируют с помощью среднеквадратических от
клонений с )/2, так что выборочная ковариационная матрица Е заменя
ется во всех рассуждениях выборочной корреляционной матрицей R- Анализируя описанную выше процедуру центроидного метода, не трудно понять, что построенные таким способом общие факторы могут интерпретироваться как первые р' «условных» главных компонент
матрицы 2 — V, найденные при дополнительном условии,что компо ненты соответствующих собственных векторов могут принимать лишь два значения: плюс или минус единица.
г) Оценка значений общих факторов. Эта задача является одной и основных задач исследования. Действительно, мало установить лишь сам факт существования небольшого числа скрыто действующих об щих факторов г/<1>, ..., у (р)', объясняющих природу взаимной коррели рованное™ исходных признаков в основную часть их дисперсии. Же лательно непосредственно «выловить» эти общие факторы, описать их в терминах исходных признаков и постараться дать им удобную со держательную интерпретацию.
Мы приведем здесь идеи и результаты двух распространенных мето дов решения этой задачи, предложенных в разное время Бартлеттом (1938 г.) и Томсоном (1951 г.). В обоих случаях мы предполагаем за
дачу статистического оценивания неизвестных нагрузок Q' = (qi}) и
остаточных дисперсий V — (ѵц) уже решенной.
Первый метод (метод Бартлетта) рассматривает отдельно для каж дого фиксированного номера наблюдения ѵ (ѵ = 1, 2, ..., п) модель
(4.20) как регрессию признака хѵ по аргументам <7.1, <7.2, •••, q.P'\ три этом верхний индекс і = 1,2, ..., р у признака (и соответствующий первый нижний индекс у нагрузок) играет в данном случае роль номе ра наблюдений в этой регрессионной схеме, так что
р'
*ѵг>= 2 уіп qu + Ui (i = !> •••> p)- /= 1
178
Таким образом величины у[1), у ^ \ ...,у (р ) интерпретируются как
неизвестные коэффициенты регрессии хѵпо q.lt q.2, •••, q.p'• В соответ ствии с известной техникой метода наименьших квадратов (с учетом «неравноточности» измерений, т. е. того факта, что вообще говоря Dx(,4) ф Dx <г'*> при ігФ і2), определяющей неизвестные коэффициенты
регрессии Yv = (уУ1, .... уіР')У из условия
I
min >4
1 |
|
|
|
2 |
|
( 4 |
° - І yln І и j1 - |
||
он \ |
|
/ =:[ |
|
|
р |
|
|
Р' |
І/У» |
у - ( > - ■ V |
||||
і = 1 |
оц |
\ |
/ = 1 |
|
|
|
|
получаем [2]
Kv = (Ö' V“ 1Q)_I Q' V_ I Xv ( v = l ...... |
я). |
(4.30) |
Очевидно, если исследуемый вектор наблюдений X нормален, то эти оценки являются одновременно и оценками максимального прав доподобия. Нестрогость данного метода — в замене истинных (неизвест ных нам) величин qa и vti и х приближенными (оценочными) значе
ниями qij и Ѵц.
Второй метод (метод Томсона) рассматривает модель (4.20) как
бы «вывернутой |
наизнанку», |
а именно как |
регрессию зависимых |
|
переменных г/W, |
..., ур’ по аргументам У 1), ..., х ^ . |
Тогда коэффициен |
||
ты Cij в соотношениях |
|
|
|
|
|
У(і) = У\ |
си х(і"> (і =■ 1, ..., |
p') |
|
/ = 1
или в матричной записи
Y = СХ,
где С — матрица коэффициентов Сц размера p' X р, находятся в со ответствии с методом наименьших квадратов из условия
п |
л ' |
! |
л |
|
\ 0 |
п |
Л' / |
|
л |
2 |
2 |
уУ - |
/ = 1 |
Лі) |
/ |
= mm |
22 |
у ? |
V са х(/) . (4.31) |
ѵ= 1 г = І |
\ |
|
cij |
ѵ=1г-1 \ |
/=1 |
Поскольку решение экстремальной задачи (4.31) выписывается, как известно [2], в терминах ковариаций х(і) и y ü \ то отсутствие на блюдений по зависимым переменным г/<г) можно компенсировать зна нием этих ковариаций, так как легко подсчитать, что
179
Отсюда, используя известные формулы метода наименьших квад ратов, получаем (с заменой матрицы Q, V и Г их выборочными анало гами)
Уѵ = ( / + r ) - ' Q у - ' Х ѵ (ѵ = 1, 2, ..., п), |
(4.32) |
где матрица Г (размера р X р) определяется соотношением
r t = Q’ V ~ l Q,
Сравнение выражений (4.30) и (4.32) позволяет получить явное ■соотношение между решением по методу Бартлетта У(Б) и решением, предложенным Томсоном У<Т).
У(Б) ='(/ + г - 1)У(Т).
Если элементы матрицы Q'E_1Q достаточно велики, то эти два метода будут давать близкие решения.
д) Статистическая проверка гипотез. Проверка гипотез, связанных с природой и параметрами используемой модели факторного анализа, составляет один из необходимых моментов исследования. К сожале нию, теория статистических критериев применительно к моделям фак торного анализа разработана весьма слабо. Пока удалось построить лишь так называемые критерии адекватности модели, т. е. критерии, предназначенные для проверки гипотез типа гипотезы Н0, заклю чающейся в том, что исследуемый вектор наблюдений X допускает представление с помощью модели факторного анализа (4.20) с данным (заранее выбранным) числом общих факторов р '. При этом критиче ская статистика у (Хь ..., X J, т. е. функция от результатов наблю дения, по значению которой принимается решение об отклонении или непротиворечивости высказанной гипотезы Я0, зависит от вида допол нительных (идентифицирующих) условий модели. Так, если рассмат ривается модель с дополнительными идентифицирующими условиями вида 1), т. е. дополнительно постулируется диагональность матрицы
Г = Q 'y_1Q, то гипотеза Н0 отвергается (с вероятностью ошибиться, приблизительно равной а) в случае
Ті(*і, ...,Х п) = я(іп|І> I + In I / + |
r | - l n | 2 | ) > x ä ( v x ) , |
||
где число степеней свободы |
|
|
|
и = ~-1(р — р У ~ ( р + р ')]\ |
|
|
|
«го положительность обеспечивается условием (4.25), а |
(ѵг), как и |
||
ранее величина 100 а %-ной точки %2-распределения с |
ѵх степенями |
||
свободы (находится из таблиц). |
|
|
|
На языке ковариационных матриц гипотеза Н0 означает в данном |
|||
случае, что элементы матрицы 2 — (QQ' + |
V) должны лишь |
статисти |
|
чески незначимо отличаться от нуля, или, |
что эквивалентно, |
матрица |
|
2 — V должна иметь ранг, равный р'. А это, в свою очередь, означает |
|||
что последние р —р' характеристических корней £р»+1, |
..., |
і р урав- |
180
нения I 2 •— V — "KV) = |
0 должны лишь незначимо отличаться от |
|
нуля. Кстати, статистика ух (Хь |
Хп) может быть записана в тер |
|
минах этих характеристических корней, а именно |
||
Уі(Хѵ |
Х п) = п |
2 |
|
|
і = Р '+ 1 |
Если же в качестве |
идентифицирующих условий дополнительно |
к (4.20), или, что то же, к (4.21), постулируется наличие какого-то за ранее заданного числа т нулевых нагрузок qtJ из общего числа р ■р' на определенных («специфических») позициях, то гипотеза # 0 отвер гается (с вероятностью ошибиться, приблизительно равной а) в случае
у2(Х1; ..., Х„) = л(1п| Ѵ |+ |
ln IQ |
V ~ l ± V - 1Q | - |
ІП ( Г I In I 2 |
I) > |
Ха (Ѵ-г)» |
где число степеней свободы |
|
|
',2 = у Р ( Р ~ 1 ) - ( Р ' Р ' ~ т ) -
Иногда удобнее вычислять критическую статистику у2 (Х1; ..., Хп) в терминах характеристических корней zlt z2, ..., zp (занумерован ных в порядке убывания их величин) выборочной корреляционной матрицы R исследуемого вектора наблюдений X:
Ѵа(Х1, .... |
Х п) = і^п- |
\ 2 p + U |
2p^ X |
|
f |
2 |
h |
|
|
X (Р — JD') ІП * |
i = p' + l |
- |
• 2 |
in s, |
|
P —P' |
|
i—P' + 1 |
|
|
|
|
||
Статистики ух (Xx, ..., Xn) и y2 (Xi, |
.... Xn) получены в результате |
|||
реализации известной схемы критерия отношения правдоподобия. |
Пользуясь этой схемой можно построить аналогичные критерии адекватности и для некоторых специальных вариантов центроидного метода [9, с. 50]. Однако из-за слишком узких рамок такой модели эти критерии, с нашей точки зрения, не представляют достаточного инте реса.
До сих пор не удалось построить многомерной решающей процеду
ры типа р' (2),т. е. оценки для неизвестного числа общих факторов р'. В настоящее время приходится ограничиваться последовательной эк сплуатацией критериев адекватности Н0 : р' = р'а (р'0 — заранее
задано) при альтернативе Нг: р' > |
р'п. |
Если гипотеза Н'0 отвергается, |
то переходят к проверке гипотезы |
Я ' |
: р' = р'0 + 1 при альтернати |
ве Н [: р’> р 0-\-\ и т. д. Однако по уровням значимости а каждой от дельной стадии такой процедуры трудно сколько-нибудь точно судить о свойствах чвсей последовательной процедуры в целом.
181
Пользуясь асимптотической нормальностью оценок Q и V, можно было бы попытаться строить критерии для проверки гипотез, каса ющихся значений-факторных нагрузок, например, гипотез о том, что некоторые признаки не зависят от заранее определенных факторов,
т. е. что на определенных местах матрицы Q стоят элементы, статиче ски незначимо отличающиеся от нуля. Однако построение этих кри териев затруднено из-за вычислительно-нереализуемого вида кова
риационных матриц оценок Q и V [16]. Правда, это затруднение можно обойти, используя в качестве приближенного решения критерий не значимого отклонения от нуля множественного коэффициента корре
ляции между заданным |
исследуемым признаком х |
и заранее опре |
|||||||
деленным набором факторов у {іі\ г/('2>, |
..., |
у (ія) |
(q |
p'). |
Для этого, |
||||
естественно, придется |
предварительно |
оценить значения |
этих факто |
||||||
ров |
..., г/(Ѵ , |
а |
затем |
воспользоваться |
известной техникой |
||||
[2, |
с. 126]. |
|
|
|
|
|
|
|
|
|
4. Факторный анализ в задачах классификации |
|
|||||||
|
Выше уже была отмечена близость моделей главных компонент и |
||||||||
факторного анализа. |
Поэтому |
замечания, |
сформулированные в и. 4 |
предыдущего параграфа и относящиеся к общим идеям использования главных компонент в задачах классификации и к так называемому дуализму в постановке задачи, в полной мере относятся и к модели фак торного анализа.
Будет полезно пояснить это на конкретном примере с использова нием специфики и терминологии именно факторного анализа.
В табл. 4.3 приведены коэффициенты корреляции между отметками по шести школьным предметам, подсчитанные по выборке из 220 уча щихся [9].
|
|
|
|
|
|
Т а б л и ц а |
4.3 |
|
|
|
|
Н о м е р п р и з н а к а |
|
|
Н а г р у з к а ф а к т о |
||
С о д е р ж а т е л ь н ы й |
|
|
|
|
р о в н а п р и з н а к и |
|||
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
с м ы с л п р и з н а к а |
|
|
|
|
|
|
|
Чі* |
|
|
2 |
3 |
4 |
5 |
6 |
|
|
Отметка по: |
1 |
0,439 |
0,410 |
0,288 |
0,329 |
0,248 |
0,606 |
0,337 |
гэльскому языку х {1) |
||||||||
английскому языку 0,439 |
1 |
0,351 |
0,354 |
0,320 |
0,329 |
0,611 |
0,197 |
|
истории х (3> |
0,410 |
0,351 |
1 |
0,164 |
0,190 |
0,181 |
0,458 |
0,384 |
арифметике х(і) |
0,288 |
0,354 |
0,164 |
1 |
0,595 |
0,570 |
0,683 |
—0,365 |
алгебре х(б> |
0,329 |
0,320 |
0,190 |
0,595 |
1 |
0,464 |
0,686 |
—0,335 |
геометрии x (ß) |
0,248 |
0,329 |
0,181 |
0,470 |
0,464 |
1 |
0,575 |
—0,212 |
В последних двух столбцах таблицы даны факторные нагрузки qtl, <7і2 на исследуемые признаки в бифакторной модели (p' = 2), подсчи танные по приведенной здесь корреляционной матрице с помощью центроидного метода. Простой анализ величин и знаков этих нагру-
182