Файл: Кориков А.М. Математические методы планирования эксперимента учеб. пособие.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 149
Скачиваний: 0
|
|
|
- 2 2 3 - |
|
|
|
|
г - |
|
г |
|
|
|
|
|
где |
а |
• = I ; дисперсии которых |
обладают особым |
свой- |
|||
i |
|
v ' |
|
|
.г |
г |
л |
сгвок: расположены в убывающем порядке, |
т . е . Ь |
\ |
> |
||||
?- S " ( 2 г } $ , . . |
Корреляционная |
(или ковариационная) |
|||||
матрица оказывается расщепленной на |
К |
ортогональных ком |
|||||
понент. |
|
|
|
|
|
|
|
Геометрически нахондение главных компонент сводится
к переходу к новой ортогональной системе координат: пер вач координатная ось ищется так, чтобы соответствующая ей
линейная форма извлекала возможно большую дисперсию, да
лее ищется ортогональная ей ось, которая делает тоже са -
;.;ое с |
оставшейся дисперсией и т.д. |
|
|
||
3 |
соотношении (9 . 1) |
2.^ обозначает г |
-ю главную кон |
||
спекту, а |
бь - ь - вес % -ой компоненты в |
ь -ой |
переменной. |
||
Оказывается, что |
являются компонентами |
характе- |
|||
с::е?-'чсских |
(собственных) векторов ковариационной матри |
цы, а дисперсии главных компонент равны характеристичес
кий (собственным)' числам этой матрицы S |
= |
|||
Ст-от г!:1ч1орес,:н" результат устанавливается следующей тео |
||||
ремой. |
|
|
|
|
Т е о р е м а , |
Пусть дан !? -мерный случайный вектор |
|||
х |
которого J l l { x } = 0 и Л Ц х х т } = L . |
Тогда сущес |
||
твует |
ортогональное |
линейное преобразование |
|
|
|
х = |
А |
х |
|
vai-xe, |
то ковариационная матрица для вектора |
г будет сле - |
||
дуэдей |
: |
|
|
|
I
|
|
|
|
- Z |
1 |
0 |
- |
|
|
|
|
|
^1 |
л . , |
о . . . о |
П |
|||
|
|
|
О |
|
\ r |
. . Q |
, |
||
|
|
|
0 |
|
|
0 |
\ |
J |
|
где |
Л.^ » |
••• ^ Х ^ |
0 |
|
- |
корни |
уравнения |
||
|
|
г d e - t , ( L - х Е ) = 0 } |
|
( 9 . 2 ) « |
|||||
а-й |
столбец |
матрицы А, |
а |
^ |
|
удовлетворяет уравнению |
|||
X |
-ая компонента вектора г , |
|
|
|
|
|
|||
|
|
ж. 4 |
W |
T |
1 |
, |
|
|
|
|
|
г |
|
- |
|
|
' |
|
|
имеет нанболыгую дисперсию среда всех нормированных линей
ных комбинаций, |
некоррелированных с |
|
. . |
||||
Здесь JUL по-прежнему обозначает математическое |
|
ожида- |
|||||
ние; 0 - вектор с |
нулевыми компонентами; de"t (...) |
- оп |
|||||
ределитель матрицы; |
Е - это единичная матрица. |
|
|
||||
^ Доказательство |
этой |
важной теоремы приведено |
в |
книге |
|||
Андерсона £з^. Вектор ? |
является вектором главных |
|
компо |
||||
нент. Заметим, |
что |
как |
только |
произведено |
преобразование |
||
к г л , г г , . . . , |
£ ^ |
становится |
очевидным, |
что г п - |
|
это |
нормированная линейная комбинация'с наибольшей дисперсией,
так |
как |
если i * = |
У " с . а. , где Т~ с , |
* 1 |
( г * |
также |
является |
нормированной линейной комбинацией |
х |
) , то |
|
||
|
' S N * * ) ж Z |
O A , - X 4 £ С* ( X . - X ) . |
( 9 . 3 ) |
|||
так |
УАУ |
|
|
|
|
|
- 23t-
Очевидно, |
что выражение (9,3) достигает |
максимума |
приС ь = |
||
= 0, I - |
2 , 3 , . . . , |
к. . Аналогично, ггпредставляет |
собой |
||
нормированную линейную комбинацию, некоррелированную о Z , |
|||||
и имеющую наибольшую дисперсию (из того, |
что г * » 7 с г . |
||||
некоррелирована с |
г |
. , следует, с. = 0 ) ; |
Таким же |
образом |
|
проверяются свойства |
максимума для |
г,^. |
|
Нетрудно убедиться в справедливости следующего утверж
дения: суша дисперсий главных компонент равна оумме-дис-
персий |
исходных |
переменных* |
|
|
|
||
Доказательство этого утверждения следует из цепдчки |
|||||||
равенств |
|
|
|
|
|
|
|
И |
JIU; |
~ |
5„ ( Л 1 Л Т |
) = 5Р |
(L АТА) |
= |
|
1*1 |
|
|
|
|
|
|
|
где 5 р ( . . . ) |
означает |
след |
матрицы. |
|
|
||
Итак, сформулированная |
т е о р е м а |
с в о д и т |
|||||
н а х о ж д е н и е |
г л а в н ы х |
к о м п о н е н т |
|||||
к в ы ч и с л е н и ю |
х а р а к т е р и с т и ч е с |
||||||
к и х |
к о р н е й |
и |
х а р а к т е р и с т и ч е с |
||||
к и х - в е к т о р о в |
|
к о в а р и а ц и о н н о й |
|||||
м.а т р и ц ы . |
Мы не будем останавливаться |
здесь на мето |
|||||
дах решения |
этой |
задачи, а интересующихся отправляем к ли - |
-гы-
тературе по вычислительной математике (см.например, книгу
Б.&Демидовича |
и И.А.Марона [ п } ) . |
Методы анализа с помощью главных компонент лучше в с е - |
|
го подходят к |
случаям, когда все компоненты вектора х и з |
меряются в одних и тех же единицах. Если они измеряются в различных единицах, то нужно всегда помнить, что главные компоненты не инвариантны относительно масштаба изменения тех шкал, по которым отсчитываются переменные. Некоторые исследователи предлагают избавляться от неинвариантности переходом к стандартизированным переменным
Квадратичная ошибка служит параметром масштабности функции распределения и на первый взгляд представляется вполне е с тественным стандартизировать переменные, деля их на эту в е личину. Однако этот прием нельзя обосновать строго, так как произвольно уравниваются величины, несущие разную информа цию.
Приведем пример применения метода главных компонент в задаче ктссификации летающих тлей ,[2б] . Нужно было разбить этот вид насекомых на подгруппы по варьируемоети их морфо логических признаков. Было измерено 19 различных признаков, которые оказались весьма сильно коррелированными между с о бой; так, коэффициенты парных корреляций по многим призна кам достигали 0,90 - 0 , 9 9 . Компонентный анализ показал.что можно ограничиться двумя первгми глазными компонентами, на
-гы-
которые падает 85,5? от обшей дисперсии. Первая компонен та задается различием в размерах насекомых, вторая в зна чительной степени связана с числом яйцекладок. Графически результаты представлены на рис . 9 . 1 . Здесь ясно видно, что
+Компонента 1
14
г! +
-е -4 -г |
2 4 б Компонента Z |
|
•и- |
Рис.9.1 обследованных насекомых можно разбить на четыре хорошо различимые группы.
Метод главных компонент пригоден и как прием для ортогонализации матрицы независимых переменных в регрессионном анализе. Одна из самых больших неприятностей многомерного регрессионного анализа, выполненного по схеме пассивного эксперимента, заключается в том, что не все независимые переменные можно включать в рассмотрение (часть независи мых переменных опускается хотя бы потому, что они трудно поддаются надежному измерению). Это неизбежно приводит к смещению в оценках коэффициентов регрессии - оно может ока заться столь сильным, что регрессионный анализ потеряет всякий смысл. Коэффициенты регрессии, вычисленные по глав-