Файл: Кадыров, Х. К. Синтез математических моделей биологических и медицинских систем.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 82

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Sn— набор вершин /г-мерного единичного куба). Обозначим через Du D2, ..., Dk некоторые непересекающиеся подмножества про­ странства Sn, элементы которых поставлены в соответствие болез­ ням Dlt D2, ... и з класса болезней {D }.

Иными словами, пусть для соответствующих классов болезней

заданы следующие векторы симптомов:

 

 

 

 

 

для класса

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сП) _

cd) rtfП

6/2

 

■• »

t ( l ) l

/

( /=

Urtlj),

6

2

)

*->/

(б/i >e ( i )

ë/n

( .

 

для класса Z) 2

 

 

 

 

 

 

t(2 )'

 

 

 

 

 

5/2) =

(

)

 

(

)

 

а =

1, пч)

 

 

 

S f >(Е

 

5 /2

 

 

 

 

(6.3)

И т. д.,

 

2

,

6 2 .

• • I

5in ,

для класса

Dt

S jl) , t ( 0

 

tit) .

 

 

 

( /=

1 , ГП[).

(6.4)

S)l) =

>

 

,

 

S/Я}

 

 

i/i

 

 

 

 

 

 

 

Задача распознавания

6/2заболевания

пациента, характеризую­

щегося вектором симптомов

 

 

 

 

 

 

 

 

 

 

 

S =

 

 

.......... Ь,},

 

(6.5)

состоит в применении решающего правила для отнесения данного больного (6.5) к тому или иному классу болезней из множеств

{D).

В качестве решающего правила мы выбрали метод голосования, разработанный ранее Ю. И. Журавлевым [23]. Идея этого метода состоит в следующем. Пусть заданы объекты I классов (6.2)—(6.4). Каждый объект характеризуется набором значений п симптомов.

Далее, к одному из I классов болезней необходимо отнести бо­ лезнь, представленную вектором симптомов (6.5). Для этого при­ меняется следующий алгоритм.

Из всех наборов столбцов длины k выбирается первый по по­ рядку, составленный из столбцов с номерами 1, 2, 3, ..., k. Из предъ­ явленных векторов симптомов (6.5) и строки векторов симптомов (6.2)—(6.4) выделяются только первые k столбцов. Полученные пос­ ле такой операции строки обозначим следующим образом:

S(i r =

(D '

Е0 )'

ійѵ

tCD'i

 

(/ =

1 , тг),

S)

6 л

. 6 /2 .

5/г

}

 

S f Y S f Y t ( 2 У

( 2)'

 

У

 

(/ =

К т2),

/2

6

 

 

 

6/1

бу:

• • • > t(2//

 

 

=

S P '

{ÖP', öa0' .......... е?/»'»

 

(

/ -

«

;

вектор

 

 

 

 

 

b)

 

 

 

 

 

 

S' = 5'

& .. • ,

 

 

 

 

характеризует больного, которому нужно поставить диагноз.

Обозначим через

....* число строк

 

(/

=

1 ,

/пх), совпадаю­

щих с S', через

... k число строк из S f ]

{] =

1,

/п2),

также совпа­

дающих со строкой S', и т. д. Таким образом обозначим через

число строк из

 

(/ =

1, trit),

совпадающих со строкой S'.

144


Построив величины

р ( 1 )

 

 

р ( 2 )

 

 

p ( 0

1 1 .'« ........

У

 

1 i i . h ...........

У

. LtuU

для всех наборов у t2 .......

ik длины k и просуммировав их, получим

р ( 1 >

у

 

р ( 1 )

 

1

(А)

<<іЛ.........

V

1 ‘ 1>*1

.........У

р ( 2 ) _

 

 

р < 2 )

 

 

 

 

<ПЛ2.........

У

1 U .U .........

у *

р ( 0

 

 

 

р ( 0

 

1

(А) = <12.........

у

 

*

Суммирование ведется по всем наборам длины k. Итак, получен­

ные величины Г(і], Г(|), ..., ГЦ* определяют число голосов, отданных представленным вектором симптомов (6.5) за соответствующий класс заболеваний.

В работе [23] доказаны теоремы, упрощающие процесс вычисле­ ния количества поданных голосов.

Если векторы симптомов представлены в булевом пространст­ ве, то

I

• р О ) ___

Y

r

et

 

bit

)>

 

 

А(к)

і= 1

 

р(£ь

 

 

 

I

 

 

 

■ Л2У

),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sit

 

 

(6.7)

 

 

 

 

 

 

 

 

 

гр> =

2

с Д

(Ь,

$>'),

 

 

 

(=i

 

 

 

 

 

 

 

 

где р (Ь, gjP), р (&, ё/(Г), • • -

, Р (ii,

tji')

— хемминговые

расстоя­

ния между векторами симптомов (^, g/P'),

 

(^, g/P'), . .. ,

(^,

).

В случае произвольных значений

симптомов эти голоса вычис­

ляются по формулам

 

 

 

 

 

 

 

 

 

р ( 2 ) 1 (А)

II

=

 

 

'

2

^п-- P ( E p i / r )

[2

1],

/="4—pH

 

 

т2

 

(б).І2/Г) _

V

- P

 

[2П-

1].

/="4—i+l

Г ІЙ -

ml

- P

) ___

2

[2"-

1],

 

/="4—1+1

 

i

причем р (£/, ffi) определяется

следующим образом.

10 4- 628

145


Пусть

 

 

 

 

 

 

 

 

 

 

 

— Q4.1

^ 2 — к2,

£з — Kg,

.. . , ^ni am,

 

 

 

= ß / b

$ > ' =

ß / 2 ,

& Y

=

ß /3 ,

• • • ,

= ß/m ,

(6.9)

 

K ' — ß/i| >

8

 

(г =

1 , m;

j = l , m j ) .

 

Тогда p

(£/, È,-/1) совпадает

с числом

выполненных

неравенств.

Итак,

получаем

алгоритмы,

позволяющие вычислить по

пред­

ставленному вектору симптомов количество голосов, поданных за различные классы болезней, взятых из множества [D], т. е. Dj а {D}

(J

= 1 , т ) . Однако

количество векторов

симптомов, содержащееся

в

полумножестве

классов

болезней

Dj (j — 1 , т),

неодинаково.

Поэтому введем нормировку в виде

 

 

 

 

 

 

г ( 1 )

г(2)

 

г (О

 

 

 

 

1 (fe)

1 W

 

1 tfe)

 

 

 

 

 

 

 

гпі

 

 

где mi (i = 1 , /) — количество векторов

симптомов,

содержащихся

в

і-м классе болезней.

р(2)

 

р (О

 

 

 

 

р(1)

 

 

 

 

Далее, величины —— , —— ,

, —— назовем удельным чи-

 

m,

т „

 

гп[

 

J

слом голосов, поданных строкой 5 соответственно за k-й класс.

 

Если

р ( і )

р (2 )

 

 

 

 

 

шах

 

 

 

 

 

l (k)

Х (А)

ГГЦ 1

ГПі

 

 

 

 

то представленный вектор симптомов 5 относится к і-му классу болезней, т. е. 5 £ Dt. При равенстве удельного числа голосов, поданных за некоторые классы болезней, вектор 5 будет отнесен не к одному, а к нескольким классам болезней. В этом случае тре­ буется дополнительное исследование вектора 5'.

Из изложенного выше алгоритма распознавания болезней легко заметить, что точность этого распознавания во многом зависит,

во-первых, от качества обучающихся подмножеств Dj (J — 1, т) и, во-вторых, от удачного выбора параметров k и е.

2.Логико-вероятностный алгоритм распознавания болезней

Рассмотрим логико-вероятностный алгоритм диагностики. Для

алгоритмизации процесса диагностирования мы выяснили после­ довательные этапы постановки диагноза (рис. 4).

Сбор информации о больном производится в соответствии с планом клинического обследования. Обследование начинается со стандартных вопросов («Что болит?») и стандартных исследований (измерение температуры, подсчет частоты пульса). В зависимости

146


от жалоб больного и результатов первичного осмотра стандартный план обследования конкретизируется и индивидуализируется. Затем больной направляется на различные лабораторные и функ­ циональные обследования. Всю накопленную информацию о со­ стоянии больного записывают в историю болезни. Из собранной ин­ формации при помощи анализа производится отбор наиболее су­ щественных данных для оценки информации.

План клиническаго обследования}------ —{ Больной |— «-] Сбор инф ормации о больном |

Рис. 4. Последовательные этапы постановки диагноза.

Результатом оценки информации является диагноз, в составлении которого используются:

а) данные о больном, свободные от избыточности и представ­ ленные в форме, удобной для последующей логической оценки, т. е. соответствующий набор признаков-симптомов;

б) медицинский опыт врача, знания, накопленные им в резуль­ тате учебы и врачебной деятельности; сведения о наиболее часто встречающихся заболеваниях, симптомах, однозначно определяю­ щих данные болезни, вероятности появления того или иного симп­ тома при некоторых болезнях и т. п.;

в) законы медицинской врачебной логики, выработанные в ре­ зультате изучения медицины и личного опыта врача.

После разбора процесса постановки диагноза строим модель, опирающуюся на математическую логику, теорию вероятности и статистику, исходя из того, что человеческий организм рассматри­ вается как объект, задаваемый т различными признаками двух возможных значений, которые составляют полную систему собы­ тий. Тогда рассматриваемый объект может находиться в одном из различных состояний.

Определим количество заболеваний (п), имеющих много общих признаков (симптомов) с рассматриваемым событием.

ю*

147

Для выделения заболевания, соответствующего 2'п различ­ ным состояниям рассматриваемого объекта, производим анализ раз­ личных комбинаций заболевания. Кроме этого, надо определить клиническую картину всех комбинаций заболевания. Сведения, указывающие на взаимосвязь заболевания с состояниями призна­ ков, назовем «медицинскими утверждениями».

Т а б л и ц а

13. К диагностике болезни

 

 

 

 

 

 

Симптомо-комплексы

 

Безусловная

Болезне-

 

 

 

 

 

 

 

 

 

 

вероятность

комплексы

 

с0

Cl

С^ТП_ 1

болезне-

 

 

комплексов

do

 

Р (^o/^n)

Р ( c j d 0)

Р (с2т_І^о)

P ( d 0)

Ф

 

Р (с0/4,)

Р (Сі /Ф)

Р i c 2 m — i l d i )

P(di)

 

 

 

• •

 

 

d 2 n — 1

 

Р {C0/ d 2 n — l)

р ( с Щ ^ - і )

р(с2т _ | / 4 2п _[)

Р [ d 2 " ~ l)

Таким образом, основу объективного диагностирования можно

наметить

в

следующем

порядке:

 

 

 

1 ) определить количество заболеваний (п), имеющих много об­

щих симптомов, и количество рассматриваемых

симптомов (тп);

2 ) соответственно от нуля до 2 П— 1

присвоить

номера болезне-

комплексам

(комбинациям заболеваний);

 

 

3)аналогично от нуля до 2 т — 1 присвоить номера симптомокомгілексам (состояниям признаков);

4)при помощи п. 2 и 3 написать все медицинские утверждения;

5)

заполнить табл. 13

(условные и

безусловные

вероятности).

В

табл. 12 р (Cj/dt)

вероятность

того, что из

т больных с

болезне-комплексом dc t — количество

больных, одновременно име­

ющих симптомо-комплекс с,-:

 

 

 

 

р(щ Я ) = ^ -

(6 . 1 0 )

Здесь р (di) — вероятность того, что больной относится к комплексоболезни dc, т. е. если N — количество всех больных, из них т от­ носятся к du то

Р (di) = ~ff •

(6.11)

1 Таким образом, проблему автоматизации диагностического про­ цесса можно свести к моделированию «черного ящика». При этом ос­ новной задачей является создание таких алгоритмов, которые об­ ладали бы необходимой эффективностью.

148


Нами разработан алгоритм для дифференциации заболева­ ния, который был реализован на ЭЦВМ (рис. 5). В алгоритме ис­ пользовалась теория математической логики и теория вероятнос­ ти. Чтобы написать алгоритм, введем следующие символические обозначения: Sj — у больного обнаружен симптом № I; D, — боль­ ной страдает болезнью № І.

Рис. 5. Дифференциальная диагностика на ЭЦВМ.

 

Будем рассматривать множество из т симптомов

slf s2, ..., sm

и множество из п болезней

Dlt D.,,

..., Dп. Тогда

медицинские

утверждения молено выразить в виде булевой функции

Е (Д>

. . . ,

sm,

D2, .. . ,

 

Симптомы больного обозначим через G (slt s2, .... sm), а диагноз — через f (Dlt D2.......Dn).

Определять функцию / можно путем построения логического базиса. Логическим базисом рассматриваемых симптомов и болез­ ней называется выявление всех мыслимых комбинаций.

Для т симптомов и п болезней расширенный логический базис,

представляет собой матрицу, у которой будет

2т+п строк и т +

+ п столбцов. Каждая строка представляет

одну из комбинаций

комплексо-болезней. Но не все информации строки (комплексо- симптомо-болезни) возможны, т. е. не все они встречаются в дей­ ствительности. Из медицинских утверждений мы получаем сведения: какие из этих комплексо-симптомов-болезней действительно воз­ можны и какие мыслимы только формально. Исключая все формаль­ ные строки, получаем сокращенный логический базис.

Рассматривая функцию G, мы выделяем строки из сокращенного логического базиса, а из этих строк выделяем информацию о

149

заболевании. Если количество выделенных строк окажется единст­ венным, то диагноз определен точно. Если же количество строк ока­ жется не единственным, то диагноз однозначно не установлен. В этом случае необходимо вычислить вероятность каждого заболевания. Математически значение этой вероятности выражается как р (djcj), где символ справа от черты является условием, а символ слева — случайным событием, условную вероятность которого надо опреде­ лить. Для вычисления условной вероятности применяется известная формула Байеса

р (djc,) = пР№)р (с//Ф) _

(6 . 1 2 )

^ Р Ш Р (сЦйк)

k= 1

Для постановки диагноза в машину вводят величины т и п, переведенные в восьмеричную систему, и медицинские утверждения. Кроме того, для ввода в машину подготавливают таблицу условных

ибезусловных вероятностей.

3.Алгоритм определения меры важности признаков (определение весов подсистем в многомерной системе)

Одной из наиболее важных и сложных задач, возникающих при распознавании заболевания, является выбор и формирование сим- птомо-комплексов для описания конкретных болезней. Трудность ее решения в том, что не существуют какие-либо формальные пра­ вила, позволяющие до обучения указать набор симптомо-комплек- сов, который позволил бы получить достаточно надежную класси­ фикацию. Обычно при выборе симптомо-комплексов для описания того или иного класса заболевания исходят из требования наибо­ лее полного описания этих классов болезней. Часто это приводит к избыточности описания, увеличению объема статистического ма­ териала и иногда требует ненужных затрат для получения данных о болезни. В связи со сказанным возникает задача выделения из общей совокупности симптомо-комплексов, имеющих наиболее важное значение при классификации болезней, и симптомо-комп­ лексов, практически не влияющих на распознавание болезни.

В настоящее время разработаны разные методы определения меры важности симптомов в признаковом пространстве. Одним из наиболее практически целесообразных является метод, базирую­ щийся на числе голосов, поданных вектором симптомов за соответ­ ствующие классы заболеваний [23, 24].

Пусть заданы подмножества (6.2)—(6.4), описывающие соответ­ ственно классы болезней Dlt D2, ..., Dt.

Как известно, число голосов Г ^, ГЩ, ..., Г(*), поданных век­ тором 5 за соответствующий класс болезней Dlt D2, ... , Dt харак­ теризует близость вектора 5 к данному классу. Используем это со­ ображение для введения меры важности симптомов.

150