Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 84
Скачиваний: 1
где |
значение Х*} признака для /!-го |
класса |
заключено |
|||
в пределах |
(X*j) |
|
|
|
|
|
|
Как правило, ошибки измерения подчиняются нор |
|||||
мальному закону. Пусть |
|
|
|
|||
|
f № |
) = : - ѵ = |
exp - (AXj - m tf!2з2 (2.13) |
|||
|
|
о |
г 2п |
|
|
J |
где |
т j — математическое |
ожидание |
ошибки |
измерения: |
||
Xj |
признака, а а,- — ее |
среднеквадратическое |
значение. |
|||
|
Теперь перед |
нами |
стоит задача: найти |
совместный |
закон распределения суммы двух независимых случай ных величин или, иначе, композицию законов распреде лений, т. е.
|
|
|
|
|
|
|
(2.14) |
где знак |
>(< — символ композиции |
[3]. Напомним, |
что если |
||||
Z ^ X + |
У, то |
|
|
|
|
|
|
|
|
|
|
|
00 |
|
|
ff(Z)= f ( В Д |
(У) = j f, (X) ft (Z - X ) dX = |
||||||
|
|
|
|
oo |
—oo |
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
$ l A Z - Y ) f s{Y)dY. |
(2.15) |
||
Пусть |
|
|
|
|
|
|
|
Ь |
(X ): |
|
\ _ |
- |
(X- n)W t |
ш = = |
|
V2тс |
|
|
b— a |
|
|||
тогда |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
g(Z): |
|
|
|
|
[Z—Г—m]»/2oJ |
|
|
|
b |
a |
\ я V'2n |
'гіУ: |
|
|
|
|
|
|
|
|||
|
|
1 |
Г |
1 |
|
dY. |
(2.16) |
|
b a |
J я У2n |
|||||
|
|
|
Подынтегральная функция есть нормальный закон рас пределения с центром рассеивания (Z—т ) и среднеквадратическим отклонением о, а интеграл есть вероят ность попадания случайной величины, подчиненной это-
28
Му закону, iiâ участок от а до Ь. СледойательНО,
■(Z -
а У 2‘ |
і |
|
(2.17) |
где Ф(/) — функция Лапласа. |
|
В нашем случае Z — X j, b = bij, а = ац, т = О, |
так как |
систематическая ошибка в измерении признаков Xj от
сутствует и n='<Tj. Поэтому
/< № ) = |
1 |
Гф 7 |
-ѵ* |
(2.18) |
^ і ' ^г;) L V а, Р 3 |
<чѴ*~ |
Рассмотрим вопрос о возможных методах построения функций Р(Уг), і=1, ..., т, т. е. априорных вероятно стей появления объектов і-х классов. В том случае, ког
да априорная вероятность не зависит от времени, значе ния Р (Qi) могут быть определены на основании частот
событий:
Р* (Qi) =Ni(N,
где N — общее количество доступных изучению объектов
во |
всех |
классах, а Ni — количество объектов в і-м |
||
классе. |
|
|
в частности |
|
В |
некоторых системах распознавания, |
|||
в системах |
медицинской |
диагностики, P(Qi) |
может за |
|
висеть от времени. Это |
может быть связано, например, |
с распространением эпидемии какого-либо заболевания, составляющего или входящего в какой-либо класс си стемы. В этом случае следует изучить поведение функ ций P(Qj) во времени до текущего момента, а затем на основе тщательного изучения явления произвести их
экстраполяцию на |
определенный |
промежуток |
времени. |
В том случае, когда непосредственно изучить априор |
|||
ную информацию |
невозможно, |
приходится |
прибегать |
к эвристическому конструированию законов распределе ния значений признаков по классам fi(Xj), і= 1, ..., т; j = 1, ..., N, и функций P(Qi).
Задача определения функций fi(Xj) может быть ре
шена следующим образом. Положим, что группа квали фицированных специалистов согласилась дать эксперт ные оценки возможных значений признаков объектов всех классов. Пусть применительно к і-му классу оценки возможных значений признаков Xj, по мнению экспер тов, Ah, k — \, .... S, составляют Cjg, g= 1, ..., tij. Для
29
Наглядности сведем суждений эксйерТов в таблицу вида
|
|
|
Т а б л и ц а 2.1 |
Наименование ре- |
|
Признаки |
X j |
|
|
х р |
|
шений альтернатив |
X, |
Х 1 |
|
|
|
|
|
|
с ! |
с \ |
C f |
С 1 |
|
4 |
|
|
|
|
|
|
С'Пі |
( J |
Г-Ѵ |
|
п і |
nN |
|
|
|
В таблице верхний индекс у решений С1 относится
к номеру признака, а нижний — определяет его возмож ное значение. Наличие нескольких решений по каждому признаку есть следствие того, что эксперты могут ука зывать не на одну, а на несколько альтернатив. Поло жим, что при определении значения признака Хі объек тов і'-го класса эксперты подразделились на р групп.
При этом 1-я группа, состоящая из а экспертов, ука
зала, |
что значение признака равно С1, 2-я (Ь экспертов)— |
|||
С1 |
Р-я группа (k |
экспертов) — С1(г, |
ц, <7= 1 ,..., |
|
ііі). Обозначим „веса“ |
мнений |
экспертов |
каждой группы |
|
через |
ßj1’, Y = 1, ..., |
а; ß '2), <р= |
1, ... , b; |
ф = 1,... , k. |
„веса“ мнений групп равны:
|
|
а |
|
|
|
|
|
|
ь |
|
|
i x |
* ) |
= |
1 |
ß |
( |
— |
;= 2 4 |
=>■ . |
у |
- В |
( 12 ). |
|
|
|
D I )< |
|
у |
||||||
|
а и 1 |
|
1 |
’ |
|
Ь |
9 |
2 |
d |
||
|
7 |
|
= 1 |
|
1 |
|
|
|
= |
(2.19) |
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Я<р>= |
т |
в [ р ) . |
|
|
|||
|
|
|
|
|
|
|
Ф |
і |
|
|
|
|
|
|
|
|
|
Ф |
- |
і |
|
|
|
Будем полагать, что статистическая вероятность каждого из названных группами экспертов значений признака
30
пропорциональна «весам» их авторитетов. Тогда
Р*(С') =D <1>/D; |
P*(Cjj = D (2>/D;...; Р* (C') = DWfD, |
где Z?= £ ) ( » + |
. . . +Z)(p). |
Наличие значений признаков Xj в i-x классах и соот
ветствующих им статистических вероятностей позволяет построить статистические ряды, а затем произвести вы равнивание (сглаживание) и, следовательно, определить искомые функции распределения fi(Xj) [3].
Метод определения функций P(Q;) аналогичен при веденному. Таким образом, эвристический подход к фор мированию априорных сведений основывается на обра ботке результатов опроса группы экспертов с учетом их авторитета. При этом предполагается, что научно-техни ческий уровень экспертов достаточно высок, а их ре шения обусловлены только физическими или обществен ными законами и техническими возможностями.
2.2.АЛГОРИТМЫ РАСПОЗНАВАНИЯ, ОСНОВАННЫЕ НА ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИИ
Мы рассмотрели вопросы, связанные с анализом априорной информации и построением функций плотно сти вероятности значений признаков объектов по клас сам. Наличие этих функций, наряду с функциями апри орных вероятностей появления объектов соответствую щих классов, позволяет приступить к конструированию собственно алгоритмов распознавания.
Анализ характера задачи распознавания в условиях неполной информации, т. е. при наличии вероятностной связи между признаками объектов и классами, показал, что для построения алгоритмов распознавания с успе хом может быть использована теория статистических решений или, иначе, статистическая теория проверки ги потез, созданная Нейманом и Пирсоном.
Рассмотрим, в чем состоит суть теории проверки ги потез па простом примере. Положим: перед нами постав лена задача распознавать объекты, когда число классов равно двум, а объекты описываются одним признаком
X [5].
Пусть класс I описывается функцией условной ности вероятности fi(X), а класс П — функцией
взаимное расположение которых представлено на рис. 2.1. (И
X
Пусть, кроме того, заданы априорные вероятности появ ления объектов I и II и классов Р(І) и Р(ІІ) = 1—Р (І). В результате эксперимента определено значение призна ка распознаваемого объекта, равное X. Спрашивается,
к какому классу отнести объект?
Обозначим через Х0 некоторое, пока неопределенное
число и условимся о следующем правиле принятия ре
шений: |
|
если Х > Х 0, |
то объект будем относить ко II классу; |
если Х^ Х о , |
— к I классу. |
Если объект относится к классу I, а его считают объектом клас са II, то совершена ошибка, которая называется ошибкой первого рода. По терминологии теории статистических решений, ошибочно выбрана гипотеза Нг, в то время как справедлива гипотеза Ни
Вероятность ошибки первого рода, т. е. вероятность отнести объект к классу II, когда он относится к классу I,
оо
Q1= \ h ( X ) d X . |
(2.20) |
Х0
Наоборот, если справедлива гипотеза Нг. а отдано предпочтение гипотезе # і, то совершена ошибка второго рода, вероятность кото рой равна
х„
Q .= ] h ( X ) d X , |
(2.21) |
С?2 есть вероятность выбрать гипотезу Ни когда справедлива гипо теза Нг.
В некоторых приложениях теории статистических ре шений вероятность ошибки первого рода подчас называ ют вероятностью ложной тревоги, в то время как вероят ность ошибки второго рода — вероятностью пропуска
цели.
■ , ■ *і
32