Файл: Айвазян, С. А. Классификация многомерных наблюдений.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 88

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Специфика рассматриваемой здесь схемы, ее отличие от классиче­ ских регрессионных моделей в том, что упомянутое выше выходное качество у, как правило, не поддается непосредственному количествен­ ному измерению, для него не существует (в данный момент) объективно обусловленной шкалы. Как правило, информация, которую человек в подобных ситуациях может извлечь относительно выходного ка­ чества у, это соотношение порядка, а именно: для заданных п объектов тем или иным способом проранжировать их характеристики, выходного качества, например, в порядке убывания, т. е. получить подстановку вида

1,2,

...,

п,

 

bl, I2, ..., ln-

 

Эта подстановка означает, что

 

 

 

Уи > Уіг>

■■■> Уіп_ > У1п>

(5.1)

т. е., что іг й из рассмотренных

объектов лучше

(точнее — не

хуже) всех остальных объектов, с точки зрения анализируемого вы­ ходного качества, за ним идет объект с порядковым номером і2 и т. д.

Если выходное качество у все-таки имеет количественную природу (т. е. налицо существование определенной шкалы в измерении у), то знак >- в (5.1) может быть заменен обычным знаком а сформули­ рованное выше допущение об определяющей роли входных параметров х (І), ..., х(р) может быть формализовано с помощью модели

г/=/(х(>), ..., х<р>) + 6.

Здесь f {х ^\ ..., х<р))— некоторая функция от входных параметров, а б — остаточная случайная компонента, учитывающая, в частности, влияние множества факторов, не вошедших в состав входных парамет­ ров, и не зависящая от х О .......х(р>. Будем в дальнейшем обозначать

с помощью Y (X ) = Y (х(І), ..., х(р)) значение у при величинах вход­

ных параметров, равных X ' =

..., -х(р>), усредненное по всем мы­

слимым значениям случайных и неучтенных факторов б.

О п р е д е л е н и е . Целевой

функцией исследуемого выходного

качества у называется любое преобразование вида

ф(*(1),

х<р>) = ф (Х),

сохраняющее заданное соотношение порядка для усредненных зна­

чений выходного качества У (х<‘>, ...,

х<р>), т . е. обладающее тем свой­

ством, что из

 

1 О ' I

П

где

 

 

■> Х\(Р)

208


с необходимостью следует выполнение неравенств

ф

,

) >ч>(Хіп> ),

Ф

и наоборот, из последней серии неравенств с необходимостью вытекает выполнение соответствующих неравенств для Kife. Очевидно, данное

здесь определение целевой функции неоднозначно. Действительно, если cp (X) есть целевая функция и (/ (ф) — любая взаимно-однознач­ ная монотонно возрастающая функция, то всякая функция вида

ф (X) =

U [ф (X)]

также будет целевой функцией.

Это означает, что наше допущение

о наличии определенной шкалы

в

измерении играет во многих случа­

ях чисто вспомогательную роль

и не нацеливает нас на поиск, свя­

занный с ее выявлением. Ведь в соответствии с данным определением, само значение целевой функции не отражает никакой реальной, физи­ чески содержательной количественной закономерности. Реальные зако­ номерности отражаются только соотношениями «больше» или «меньше» между значениями этой функции для различных наборов величин вход­ ных параметров X = (лД), ..., х<р)). Тем самым эти соотношения отражают предпочтение с точки зрения анализируемого выходного качества одних значений X перед другими. Поэтому в задачах, в ко­ торых возможно регулирование значений X (в некоторой допустимой области), наиболее рациональным управлением естественно признать то, которое максимизирует, при заданных ограничениях на X, зна­ чения целевой функции.

Заметим, кстати, что данное здесь общее определение целевой функции допускает ее содержательную социально-экономическую ин­ терпретацию в качестве различных глобальных и частичных целевых функций потребления, используемых и интенсивно обсуждаемых в ря­ де наиболее интересных, с нашей точки зрения, работ современных эко­ номистов [1] — [4], [6], [7], [9], [10].

2. Исходные статистические данные по входным параметрам

Предварительный выбор входных параметров производится экс­ пертным путем после четкого определения конечных целей исследо­ вания и, в частности, — понятия интересующего нас .выходного ка­ чества. Как правило, предварительный набор входных параметров бывает чрезмерно обширным (слишком велико общее число входных параметров р), что порождает значительные вычислительные и интер­ претационные трудности. Поэтому до проведения соответствующего статистического обследования объектов требуется произвести тщатель­ ный экспертно-профессиональный анализ по отбору небольшого числа наиболее информативных (с точки зрения их влияния на исследуемое выходное качество) входных параметров.

Результаты произведенного затем статистического обследования объектов могут быть сведены в табл. 5.2.

8 З а к , 3 58

2 0 9


 

 

Т а б л и ц а

5.2

или представлены в виде мат­

Номер

 

Номер объекта

 

рицы

 

 

 

входного

 

 

 

х \ "

х Р

.

х 0)

параметра

 

 

 

 

М )

ѵО)

*0)

х \2)

ХІ2>... . лх пі2)

1

G

 

 

 

Х1

х2

хп

 

 

 

2

*<2>

х (2)

ѵ ( 2 )

 

 

 

ЛР)

л>2

хп

х[р) х Г

.

 

 

 

 

л п

 

 

у<Р>

х{р)

В качестве одного из пред­

Р

х\р)

варительных

этапов обработ­

л2

хп

 

 

 

 

ки исходных

данных G иног­

да полезно произвести так называемую процедуру уравновешивания

элементов исходной матрицы G, нормировку матрицы

G по стро­

кам и столбцам одновременно. Для проведения такой

процедуры

можно использовать, например, алгоритм, предложенный в [5J. Подоб­ ная нормировка приводит исходную матрицу к виду, как правило, более удобному с точки зрения различных вычислительных процедур, а также с точки зрения всякого рода сопоставлений и геометрической интерпретации результатов исследования (в случаях р 3). Будем считать в дальнейшем, что матрица исходных данных G уже прошла процедуру уравновешивания элементов. Очень важным предваритель­ ным этапом исследования является максимально возможное снижение размерности факторного пространства, т. е. определение небольшого числа наиболее информативных входных параметров. Если выше­ упомянутый экспертно-профессиональный анализ оказался недоста­ точным для решения этой задачи (общее число р входных параметров осталось чрезмерно большим, например, соизмеримым или даже пре­ восходящим число обследуемых объектов п), то целесообразно при­ бегнуть к помощи различных формальных методов, описанных, в част­ ности, в предыдущей главе.

3. Выбор общего вида аппроксимации для целевой функции. Использование экспертных данных для оценивания неизвестных параметров аппроксимирующей функции

Процесс параметризации задачи заключается в выборе общего вида целевой функции. Этот выбор, как правило, не удается подкрепить исчерпывающим теоретическим обоснованием, а потому с этого момента мы имеем дело не с целевой функцией cp (X), а с некоторой ее аппрок­

симацией ф (X). Это не должно смущать исследователя. Напротив, оперирование с аппроксимацией избавляет нас от необходимости по­ стулирования существования самой целевой функции (что в ряде ситуаций является весьма спорным моментом): в то время как сама целевая функция как объективно существующая универсальная ска­ лярная характеристика выходного качества может и не существовать, ее аппроксимация имеет определенный условный смысл и может плодо­

210


творно использоваться как некая вспомогательная характеристика в ограниченном интервале времени и при некоторых заранее оговорен­ ных условиях.

Имея в виду достаточную однородность обследуемых объектов по всем неучтенным переменным, т. е. по переменным, не вошедшим в со­ став х ^ \ ..., х<р\ и ограниченность интервала времени, в течение ко­ торого мы собираемся использовать искомую аппроксимацию целе­ вой функции, а также реализуя идею разложения любой функции в ряд Тейлора, мы ограничимся в нашем дальнейшем изложении

аппроксимациями линейного и квадратичного вида, т. е.

Фх(*)= 2

М (г)1

ц>2{Х)== 2 bt x W +

2 bfjxWxVK

І =1

і,І=1

Для определения неизвестных коэффициентов bi и Ьі,-предлагается использовать результаты экспертного опроса, которые могут быть пред­

ставлены в разных вариантах.

 

результат

экспертного

опроса.

а) Ранжирование объектов как

Пусть т экспертами произведено ранжирование п объектов.

Резуль­

 

 

 

Т а б л и ц а

5.3

таты

ранжирований

могут

 

 

 

быть

сведены в

 

следующую

Номер

Номер обследуемого объекта

табл.

5.3.

Здесь

 

і) — поряд­

эксперта

1

2

1

»

ковый

номер, который при­

 

писан Ä-M экспертом /-му

 

 

 

 

 

1

 

.•о>

 

 

объекту

в

процессе

упоря­

V

 

А »

дочивания

всех

объектов по

 

12

 

п

2

j(2)

/<2)

 

/<2)

степени убывания

характери­

 

11

12

 

ТХ

стики их выходного качест­

 

 

 

 

 

ва. При этом каждый

из эк­

т

;{т)

./("!)

 

;(tn)

спертов

должен

производить

 

упорядочивание

объектов не­

11

і 12

 

1п

В тех случаях, когда эксперт

 

зависимо от всех остальных.

не в состоянии различить несколь­

ко объектов по

их

выходному качеству,

он

должен

приписать

каждому из этих объектов порядковый номер, равный среднему ариф­ метическому из тех порядковых номеров, которые им «причитаются». Например, присудив первые два места объектам А и В, эксперт не смог различить следующую за ними группу из четырех объектов.) Посколь­ ку этим четырем объектам полагалось бы присвоить номера 3, 4, 5 и 6, то каждый из этих объектов получит порядковый номер, равный

>1 к _

3 +

4 + 5 +

6

 

 

-

• .

1

При

содержательной конкретизации постановки задачи коэффициенты

Ьі и bij часто удается наполнить реальным физическим смыслом [2], [6].

8*

 

 

211


При обработке экспертных данных необходимо произвести провер­ ку компетентности выбранного круга экспертов и, в частности, произ­ вести проверку гипотезы Н0, заключающейся в том, что все возможные варианты ранжирований равновероятны. Эта гипотеза означает, что каждый эксперт с равной вероятностью выбирает любое из возможных ранжирований, и результаты ранжирований не отражают никакого объективного упорядочивания.

Проверка гипотезы Н0 производится следующим образом. Рассмот­ рим k-ю строку табл. 5.3, т. е. вариант ранжирования k-м экспертом п объектов. Пусть при этом ранжировании объекты разбиваются на N упорядоченных классов, в каждый класс входят объекты с одинако­

вым порядковым номером. Обозначим через Р[к), ..., Р\к) классы, содер­

жащие более чем один элемент, а через t\k\ ..., t\k*— число элементов

в каждом из этих классов соответственно. Определим для k-ro ранжи­ рования величину

™ = Р 2 (Мм)’ —4 " ) .

(5.2)

(•= I

 

Подсчитаем далее статистику, численное значение которой характе­ ризует степень согласованности мнений всех экспертов, так называе­ мый коэффициент конкордации (согласованности) Кендалла:

X2-S

т2 (п3—п)

где

п

I т

\ 2

s= 2

2 i f ~ - M

Mr, m(n + 1)

/= 1U =i

 

Заметим, кстати, что максимальное значение коэффициента конкорда­

ции W равно 1 и достигается

при абсолютном совпадении ранжировок

всех экспертов, а минимальное значение W равно нулю и достигается в

случае справедливости гипотезы Н0, т.

е.

при отсутствии

какой

бы

то ни было согласованности в мнениях

участвовавших

в обследо­

вании экспертов.

 

 

 

 

 

 

 

 

Как показано в [8], если выполнена гипотеза Н0, то распределение

величины -гг I°g j _ де,

приближенно

равно* 2

распределению

Фи­

шера со степенями свободы

 

 

 

 

 

 

 

 

_

2 (/га— 1)

_2_

 

 

 

 

 

 

~ т3р2 ( W ) ~ т

 

 

 

 

где

ѵ2 = (/п— 1) ѵ1;

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

2

H'2*t^27

 

 

 

 

 

 

<7= 1

M-2i

 

(n2— 1) — — TM.

 

tri2 (n— 1)

 

 

 

 

 

 

12 v

'

2

 

 

212