Файл: Кориков А.М. Математические методы планирования эксперимента учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 149

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

- 2 2 3 -

 

 

 

 

г -

 

г

 

 

 

 

 

где

а

• = I ; дисперсии которых

обладают особым

свой-

i

 

v '

 

 

г

л

сгвок: расположены в убывающем порядке,

т . е . Ь

\

>

?- S " ( 2 г } $ , . .

Корреляционная

(или ковариационная)

матрица оказывается расщепленной на

К

ортогональных ком­

понент.

 

 

 

 

 

 

 

Геометрически нахондение главных компонент сводится

к переходу к новой ортогональной системе координат: пер­ вач координатная ось ищется так, чтобы соответствующая ей

линейная форма извлекала возможно большую дисперсию, да­

лее ищется ортогональная ей ось, которая делает тоже са -

;.;ое с

оставшейся дисперсией и т.д.

 

 

3

соотношении (9 . 1)

2.^ обозначает г

-ю главную кон­

спекту, а

бь - ь - вес % -ой компоненты в

ь -ой

переменной.

Оказывается, что

являются компонентами

характе-

с::е?-'чсских

(собственных) векторов ковариационной матри­

цы, а дисперсии главных компонент равны характеристичес­

кий (собственным)' числам этой матрицы S

=

Ст-от г!:1ч1орес,:н" результат устанавливается следующей тео­

ремой.

 

 

 

 

Т е о р е м а ,

Пусть дан !? -мерный случайный вектор

х

которого J l l { x } = 0 и Л Ц х х т } = L .

Тогда сущес­

твует

ортогональное

линейное преобразование

 

 

х =

А

х

 

vai-xe,

то ковариационная матрица для вектора

г будет сле -

дуэдей

:

 

 

 

I



 

 

 

 

- Z

1

0

-

 

 

 

 

 

^1

л . ,

о . . . о

П

 

 

 

О

 

\ r

. . Q

,

 

 

 

0

 

 

0

\

J

где

Л.^ »

••• ^ Х ^

0

 

-

корни

уравнения

 

 

г d e - t , ( L - х Е ) = 0 }

 

( 9 . 2 ) «

а

столбец

матрицы А,

а

^

 

удовлетворяет уравнению

X

-ая компонента вектора г ,

 

 

 

 

 

 

 

ж. 4

W

T

1

,

 

 

 

 

г

 

-

 

 

'

 

 

имеет нанболыгую дисперсию среда всех нормированных линей­

ных комбинаций,

некоррелированных с

 

. .

Здесь JUL по-прежнему обозначает математическое

 

ожида-

ние; 0 - вектор с

нулевыми компонентами; de"t (...)

- оп­

ределитель матрицы;

Е - это единичная матрица.

 

 

^ Доказательство

этой

важной теоремы приведено

в

книге

Андерсона £з^. Вектор ?

является вектором главных

 

компо­

нент. Заметим,

что

как

только

произведено

преобразование

к г л , г г , . . . ,

£ ^

становится

очевидным,

что г п -

 

это

нормированная линейная комбинация'с наибольшей дисперсией,

так

как

если i * =

У " с . а. , где Т~ с ,

* 1

( г *

также

является

нормированной линейной комбинацией

х

) , то

 

 

' S N * * ) ж Z

O A , - X 4 £ С* ( X . - X ) .

( 9 . 3 )

так

УАУ

 

 

 

 

 


- 23t-

Очевидно,

что выражение (9,3) достигает

максимума

приС ь =

= 0, I -

2 , 3 , . . . ,

к. . Аналогично, ггпредставляет

собой

нормированную линейную комбинацию, некоррелированную о Z ,

и имеющую наибольшую дисперсию (из того,

что г * » 7 с г .

некоррелирована с

г

. , следует, с. = 0 ) ;

Таким же

образом

проверяются свойства

максимума для

г,^.

 

Нетрудно убедиться в справедливости следующего утверж­

дения: суша дисперсий главных компонент равна оумме-дис-

персий

исходных

переменных*

 

 

 

Доказательство этого утверждения следует из цепдчки

равенств

 

 

 

 

 

 

И

JIU;

~

5„ ( Л 1 Л Т

) = 5Р

(L АТА)

=

1*1

 

 

 

 

 

 

 

где 5 р ( . . . )

означает

след

матрицы.

 

 

Итак, сформулированная

т е о р е м а

с в о д и т

н а х о ж д е н и е

г л а в н ы х

к о м п о н е н т

к в ы ч и с л е н и ю

х а р а к т е р и с т и ч е с ­

к и х

к о р н е й

и

х а р а к т е р и с т и ч е с ­

к и х - в е к т о р о в

 

к о в а р и а ц и о н н о й

м.а т р и ц ы .

Мы не будем останавливаться

здесь на мето­

дах решения

этой

задачи, а интересующихся отправляем к ли -


-гы-

тературе по вычислительной математике (см.например, книгу

Б.&Демидовича

и И.А.Марона [ п } ) .

Методы анализа с помощью главных компонент лучше в с е -

го подходят к

случаям, когда все компоненты вектора х и з ­

меряются в одних и тех же единицах. Если они измеряются в различных единицах, то нужно всегда помнить, что главные компоненты не инвариантны относительно масштаба изменения тех шкал, по которым отсчитываются переменные. Некоторые исследователи предлагают избавляться от неинвариантности переходом к стандартизированным переменным

Квадратичная ошибка служит параметром масштабности функции распределения и на первый взгляд представляется вполне е с ­ тественным стандартизировать переменные, деля их на эту в е ­ личину. Однако этот прием нельзя обосновать строго, так как произвольно уравниваются величины, несущие разную информа­ цию.

Приведем пример применения метода главных компонент в задаче ктссификации летающих тлей ,[2б] . Нужно было разбить этот вид насекомых на подгруппы по варьируемоети их морфо­ логических признаков. Было измерено 19 различных признаков, которые оказались весьма сильно коррелированными между с о ­ бой; так, коэффициенты парных корреляций по многим призна­ кам достигали 0,90 - 0 , 9 9 . Компонентный анализ показал.что можно ограничиться двумя первгми глазными компонентами, на

-гы-

которые падает 85,5? от обшей дисперсии. Первая компонен­ та задается различием в размерах насекомых, вторая в зна­ чительной степени связана с числом яйцекладок. Графически результаты представлены на рис . 9 . 1 . Здесь ясно видно, что

+Компонента 1

14

г! +

-е -4

2 4 б Компонента Z

 

•и-

Рис.9.1 обследованных насекомых можно разбить на четыре хорошо различимые группы.

Метод главных компонент пригоден и как прием для ортогонализации матрицы независимых переменных в регрессионном анализе. Одна из самых больших неприятностей многомерного регрессионного анализа, выполненного по схеме пассивного эксперимента, заключается в том, что не все независимые переменные можно включать в рассмотрение (часть независи­ мых переменных опускается хотя бы потому, что они трудно поддаются надежному измерению). Это неизбежно приводит к смещению в оценках коэффициентов регрессии - оно может ока­ заться столь сильным, что регрессионный анализ потеряет всякий смысл. Коэффициенты регрессии, вычисленные по глав-