Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 88
Скачиваний: 0
Специфика рассматриваемой здесь схемы, ее отличие от классиче ских регрессионных моделей в том, что упомянутое выше выходное качество у, как правило, не поддается непосредственному количествен ному измерению, для него не существует (в данный момент) объективно обусловленной шкалы. Как правило, информация, которую человек в подобных ситуациях может извлечь относительно выходного ка чества у, это соотношение порядка, а именно: для заданных п объектов тем или иным способом проранжировать их характеристики, выходного качества, например, в порядке убывания, т. е. получить подстановку вида
1,2, |
..., |
п, |
|
bl, I2, ..., ln- |
|
||
Эта подстановка означает, что |
|
|
|
Уи > Уіг> |
■■■> Уіп_ > У1п> |
(5.1) |
|
т. е., что іг й из рассмотренных |
объектов лучше |
(точнее — не |
хуже) всех остальных объектов, с точки зрения анализируемого вы ходного качества, за ним идет объект с порядковым номером і2 и т. д.
Если выходное качество у все-таки имеет количественную природу (т. е. налицо существование определенной шкалы в измерении у), то знак >- в (5.1) может быть заменен обычным знаком а сформули рованное выше допущение об определяющей роли входных параметров х (І), ..., х(р) может быть формализовано с помощью модели
г/=/(х(>), ..., х<р>) + 6.
Здесь f {х ^\ ..., х<р))— некоторая функция от входных параметров, а б — остаточная случайная компонента, учитывающая, в частности, влияние множества факторов, не вошедших в состав входных парамет ров, и не зависящая от х О .......х(р>. Будем в дальнейшем обозначать
с помощью Y (X ) = Y (х(І), ..., х(р)) значение у при величинах вход |
|
ных параметров, равных X ' = |
..., -х(р>), усредненное по всем мы |
слимым значениям случайных и неучтенных факторов б. |
|
О п р е д е л е н и е . Целевой |
функцией исследуемого выходного |
качества у называется любое преобразование вида |
|
ф(*(1), |
х<р>) = ф (Х), |
сохраняющее заданное соотношение порядка для усредненных зна
чений выходного качества У (х<‘>, ..., |
х<р>), т . е. обладающее тем свой |
ством, что из |
|
1 О ' I |
П’ |
где |
|
|
■> Х\(Р) |
208
с необходимостью следует выполнение неравенств
ф |
№ |
, |
) >ч>(Хіп> ), |
Ф |
№ |
и наоборот, из последней серии неравенств с необходимостью вытекает выполнение соответствующих неравенств для Kife. Очевидно, данное
здесь определение целевой функции неоднозначно. Действительно, если cp (X) есть целевая функция и (/ (ф) — любая взаимно-однознач ная монотонно возрастающая функция, то всякая функция вида
ф (X) = |
U [ф (X)] |
|
также будет целевой функцией. |
Это означает, что наше допущение |
|
о наличии определенной шкалы |
в |
измерении играет во многих случа |
ях чисто вспомогательную роль |
и не нацеливает нас на поиск, свя |
занный с ее выявлением. Ведь в соответствии с данным определением, само значение целевой функции не отражает никакой реальной, физи чески содержательной количественной закономерности. Реальные зако номерности отражаются только соотношениями «больше» или «меньше» между значениями этой функции для различных наборов величин вход ных параметров X = (лД), ..., х<р)). Тем самым эти соотношения отражают предпочтение с точки зрения анализируемого выходного качества одних значений X перед другими. Поэтому в задачах, в ко торых возможно регулирование значений X (в некоторой допустимой области), наиболее рациональным управлением естественно признать то, которое максимизирует, при заданных ограничениях на X, зна чения целевой функции.
Заметим, кстати, что данное здесь общее определение целевой функции допускает ее содержательную социально-экономическую ин терпретацию в качестве различных глобальных и частичных целевых функций потребления, используемых и интенсивно обсуждаемых в ря де наиболее интересных, с нашей точки зрения, работ современных эко номистов [1] — [4], [6], [7], [9], [10].
2. Исходные статистические данные по входным параметрам
Предварительный выбор входных параметров производится экс пертным путем после четкого определения конечных целей исследо вания и, в частности, — понятия интересующего нас .выходного ка чества. Как правило, предварительный набор входных параметров бывает чрезмерно обширным (слишком велико общее число входных параметров р), что порождает значительные вычислительные и интер претационные трудности. Поэтому до проведения соответствующего статистического обследования объектов требуется произвести тщатель ный экспертно-профессиональный анализ по отбору небольшого числа наиболее информативных (с точки зрения их влияния на исследуемое выходное качество) входных параметров.
Результаты произведенного затем статистического обследования объектов могут быть сведены в табл. 5.2.
8 З а к , 3 58 |
2 0 9 |
|
|
Т а б л и ц а |
5.2 |
или представлены в виде мат |
||||
Номер |
|
Номер объекта |
|
рицы |
|
|
|
|
входного |
|
|
|
х \ " |
х Р |
. |
х 0) |
|
параметра |
|
|
|
|||||
|
М ) |
ѵО) |
*0) |
х \2) |
ХІ2>... . лх пі2) |
|||
1 |
G |
|
|
|
||||
Х1 |
х2 |
хп |
|
|
|
|||
2 |
*<2> |
х (2) |
ѵ ( 2 ) |
|
|
|
ЛР) |
|
л>2 |
хп |
х[р) х Г |
. |
|||||
|
|
|
|
• • л п |
||||
|
|
у<Р> |
х{р) |
В качестве одного из пред |
||||
Р |
х\р) |
варительных |
этапов обработ |
|||||
л2 |
хп |
|||||||
|
|
|
|
ки исходных |
данных G иног |
да полезно произвести так называемую процедуру уравновешивания
элементов исходной матрицы G, нормировку матрицы |
G по стро |
кам и столбцам одновременно. Для проведения такой |
процедуры |
можно использовать, например, алгоритм, предложенный в [5J. Подоб ная нормировка приводит исходную матрицу к виду, как правило, более удобному с точки зрения различных вычислительных процедур, а также с точки зрения всякого рода сопоставлений и геометрической интерпретации результатов исследования (в случаях р 3). Будем считать в дальнейшем, что матрица исходных данных G уже прошла процедуру уравновешивания элементов. Очень важным предваритель ным этапом исследования является максимально возможное снижение размерности факторного пространства, т. е. определение небольшого числа наиболее информативных входных параметров. Если выше упомянутый экспертно-профессиональный анализ оказался недоста точным для решения этой задачи (общее число р входных параметров осталось чрезмерно большим, например, соизмеримым или даже пре восходящим число обследуемых объектов п), то целесообразно при бегнуть к помощи различных формальных методов, описанных, в част ности, в предыдущей главе.
3. Выбор общего вида аппроксимации для целевой функции. Использование экспертных данных для оценивания неизвестных параметров аппроксимирующей функции
Процесс параметризации задачи заключается в выборе общего вида целевой функции. Этот выбор, как правило, не удается подкрепить исчерпывающим теоретическим обоснованием, а потому с этого момента мы имеем дело не с целевой функцией cp (X), а с некоторой ее аппрок
симацией ф (X). Это не должно смущать исследователя. Напротив, оперирование с аппроксимацией избавляет нас от необходимости по стулирования существования самой целевой функции (что в ряде ситуаций является весьма спорным моментом): в то время как сама целевая функция как объективно существующая универсальная ска лярная характеристика выходного качества может и не существовать, ее аппроксимация имеет определенный условный смысл и может плодо
210
творно использоваться как некая вспомогательная характеристика в ограниченном интервале времени и при некоторых заранее оговорен ных условиях.
Имея в виду достаточную однородность обследуемых объектов по всем неучтенным переменным, т. е. по переменным, не вошедшим в со став х ^ \ ..., х<р\ и ограниченность интервала времени, в течение ко торого мы собираемся использовать искомую аппроксимацию целе вой функции, а также реализуя идею разложения любой функции в ряд Тейлора, мы ограничимся в нашем дальнейшем изложении
аппроксимациями линейного и квадратичного вида, т. е. |
|
Фх(*)= 2 |
М (г)1 |
ц>2{Х)== 2 bt x W + |
2 bfjxWxVK |
І =1 |
і,І=1 |
Для определения неизвестных коэффициентов bi и Ьі,-предлагается использовать результаты экспертного опроса, которые могут быть пред
ставлены в разных вариантах. |
|
результат |
экспертного |
опроса. |
|||||||
а) Ранжирование объектов как |
|||||||||||
Пусть т экспертами произведено ранжирование п объектов. |
Резуль |
||||||||||
|
|
|
Т а б л и ц а |
5.3 |
таты |
ранжирований |
могут |
||||
|
|
|
быть |
сведены в |
|
следующую |
|||||
Номер |
Номер обследуемого объекта |
табл. |
5.3. |
Здесь |
|
і) — поряд |
|||||
эксперта |
1 |
2 |
1 |
» |
ковый |
номер, который при |
|||||
|
писан Ä-M экспертом /-му |
||||||||||
|
|
|
|
|
|||||||
1 |
|
.•о> |
|
|
объекту |
в |
процессе |
упоря |
|||
V |
|
А » |
дочивания |
всех |
объектов по |
||||||
|
12 |
|
п |
||||||||
2 |
j(2) |
/<2) |
|
/<2) |
степени убывания |
характери |
|||||
|
11 |
12 |
|
ТХ |
стики их выходного качест |
||||||
|
|
|
|
|
ва. При этом каждый |
из эк |
|||||
т |
;{т) |
./("!) |
|
;(tn) |
спертов |
должен |
производить |
||||
|
упорядочивание |
объектов не |
|||||||||
11 |
і 12 |
|
1п |
||||||||
В тех случаях, когда эксперт |
|
зависимо от всех остальных. |
|||||||||
не в состоянии различить несколь |
|||||||||||
ко объектов по |
их |
выходному качеству, |
он |
должен |
приписать |
каждому из этих объектов порядковый номер, равный среднему ариф метическому из тех порядковых номеров, которые им «причитаются». Например, присудив первые два места объектам А и В, эксперт не смог различить следующую за ними группу из четырех объектов.) Посколь ку этим четырем объектам полагалось бы присвоить номера 3, 4, 5 и 6, то каждый из этих объектов получит порядковый номер, равный
>1 к _ |
3 + |
4 + 5 + |
6 |
|
|
- |
• . |
1 |
При |
содержательной конкретизации постановки задачи коэффициенты |
|
Ьі и bij часто удается наполнить реальным физическим смыслом [2], [6]. |
|||
8* |
|
|
211 |
При обработке экспертных данных необходимо произвести провер ку компетентности выбранного круга экспертов и, в частности, произ вести проверку гипотезы Н0, заключающейся в том, что все возможные варианты ранжирований равновероятны. Эта гипотеза означает, что каждый эксперт с равной вероятностью выбирает любое из возможных ранжирований, и результаты ранжирований не отражают никакого объективного упорядочивания.
Проверка гипотезы Н0 производится следующим образом. Рассмот рим k-ю строку табл. 5.3, т. е. вариант ранжирования k-м экспертом п объектов. Пусть при этом ранжировании объекты разбиваются на N упорядоченных классов, в каждый класс входят объекты с одинако
вым порядковым номером. Обозначим через Р[к), ..., Р\к) классы, содер
жащие более чем один элемент, а через t\k\ ..., t\k*— число элементов
в каждом из этих классов соответственно. Определим для k-ro ранжи рования величину
™ = Р 2 (Мм)’ —4 " ) . |
(5.2) |
(•= I |
|
Подсчитаем далее статистику, численное значение которой характе ризует степень согласованности мнений всех экспертов, так называе мый коэффициент конкордации (согласованности) Кендалла:
X2-S
т2 (п3—п)
где
п |
I т |
\ 2 |
s= 2 |
2 i f ~ - M |
Mr, m(n + 1) |
/= 1U =i |
|
Заметим, кстати, что максимальное значение коэффициента конкорда
ции W равно 1 и достигается |
при абсолютном совпадении ранжировок |
|||||||
всех экспертов, а минимальное значение W равно нулю и достигается в |
||||||||
случае справедливости гипотезы Н0, т. |
е. |
при отсутствии |
какой |
бы |
||||
то ни было согласованности в мнениях |
участвовавших |
в обследо |
||||||
вании экспертов. |
|
|
|
|
|
|
|
|
Как показано в [8], если выполнена гипотеза Н0, то распределение |
||||||||
величины -гг I°g j _ де, |
приближенно |
равно* 2 |
распределению |
Фи |
||||
шера со степенями свободы |
|
|
|
|
|
|
|
|
|
_ |
2 (/га— 1) |
_2_ |
|
|
|
|
|
|
~ т3р2 ( W ) ~ т ’ |
|
|
|
|
|||
где |
ѵ2 = (/п— 1) ѵ1; |
|
|
|
|
|
||
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
2 |
H'2*t^27 |
|
|
|
|
|
|
<7= 1 |
M-2i |
|
— (n2— 1) — — TM. |
|
||||
tri2 (n— 1) |
|
|
|
|||||
|
|
|
12 v |
' |
2 |
|
|
212