Файл: Кадыров, Х. К. Синтез математических моделей биологических и медицинских систем.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 82
Скачиваний: 0
Sn— набор вершин /г-мерного единичного куба). Обозначим через Du D2, ..., Dk некоторые непересекающиеся подмножества про странства Sn, элементы которых поставлены в соответствие болез ням Dlt D2, ... и з класса болезней {D }.
Иными словами, пусть для соответствующих классов болезней
заданы следующие векторы симптомов: |
|
|
|
|
|
|||||||||
для класса |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
сП) _ |
cd) rtfП |
6/2 |
|
■• » |
t ( l ) l |
/ |
( /= |
Urtlj), |
6 |
2 |
) |
|||
*->/ |
— |
(б/i >e ( i ) |
ë/n |
( . |
|
|||||||||
для класса Z) 2 |
|
|
|
|
|
|
t(2 )' |
|
|
|
|
|
||
5/2) = |
( |
) |
|
( |
) |
|
а = |
1, пч) |
|
|
|
|||
S f >(Е |
|
5 /2 |
|
|
|
|
(6.3) |
|||||||
И т. д., |
|
.И2 |
, |
6 2 . |
• • I |
5in , |
||||||||
для класса |
Dt |
S jl) , t ( 0 |
|
tit) . |
|
|
|
( /= |
1 , ГП[). |
(6.4) |
||||
S)l) = |
> |
|
, |
|
S/Я} |
|||||||||
|
|
i/i |
|
|
|
|
|
|
|
|||||
Задача распознавания |
6/2заболевания |
пациента, характеризую |
||||||||||||
щегося вектором симптомов |
|
|
|
|
|
|
|
|
|
|||||
|
|
S = |
|
|
.......... Ь,}, |
|
(6.5) |
состоит в применении решающего правила для отнесения данного больного (6.5) к тому или иному классу болезней из множеств
{D).
В качестве решающего правила мы выбрали метод голосования, разработанный ранее Ю. И. Журавлевым [23]. Идея этого метода состоит в следующем. Пусть заданы объекты I классов (6.2)—(6.4). Каждый объект характеризуется набором значений п симптомов.
Далее, к одному из I классов болезней необходимо отнести бо лезнь, представленную вектором симптомов (6.5). Для этого при меняется следующий алгоритм.
Из всех наборов столбцов длины k выбирается первый по по рядку, составленный из столбцов с номерами 1, 2, 3, ..., k. Из предъ явленных векторов симптомов (6.5) и строки векторов симптомов (6.2)—(6.4) выделяются только первые k столбцов. Полученные пос ле такой операции строки обозначим следующим образом:
S(i r = |
(D ' |
Е0 )' |
ійѵ |
tCD'i |
|
(/ = |
1 , тг), |
|||
S) |
6 л |
. 6 /2 . |
5/г |
} |
|
|||||
S f Y S f Y t ( 2 У |
( 2)' |
|
У |
|
(/ = |
К т2), |
||||
/2 |
6 |
|
||||||||
|
|
6/1 |
бу: |
• • • > t(2// |
|
|
||||
= |
S P ' |
{ÖP', öa0' .......... е?/»'» |
|
( |
/ - |
« |
; |
|||
вектор |
|
|
|
|
|
b) |
|
|
|
|
|
|
S' = 5' |
& .. • , |
|
|
|
|
|||
характеризует больного, которому нужно поставить диагноз. |
||||||||||
Обозначим через |
....* число строк |
|
(/ |
= |
1 , |
/пх), совпадаю |
||||
щих с S', через |
... k число строк из S f ] |
{] = |
1, |
/п2), |
также совпа |
|||||
дающих со строкой S', и т. д. Таким образом обозначим через |
||||||||||
число строк из |
|
(/ = |
1, trit), |
совпадающих со строкой S'. |
144
Построив величины
р ( 1 ) |
|
|
р ( 2 ) |
|
|
p ( 0 |
1 1 .'« ........ |
У |
|
1 i i . h ........... |
У |
• |
. LtuU |
для всех наборов у t2 ....... |
ik длины k и просуммировав их, получим |
|||||
р ( 1 > |
— |
у |
|
р ( 1 ) |
|
|
1 |
(А) |
<<іЛ......... |
V |
1 ‘ 1>*1 |
.........У |
|
р ( 2 ) _ |
|
|
р < 2 ) |
|
||
|
|
|
<ПЛ2......... |
У |
1 U .U ......... |
у * |
р ( 0 |
|
|
|
р ( 0 |
|
|
1 |
(А) = <1,Л2......... |
у |
|
* |
Суммирование ведется по всем наборам длины k. Итак, получен
ные величины Г(і], Г(|), ..., ГЦ* определяют число голосов, отданных представленным вектором симптомов (6.5) за соответствующий класс заболеваний.
В работе [23] доказаны теоремы, упрощающие процесс вычисле ния количества поданных голосов.
Если векторы симптомов представлены в булевом пространст ве, то
I
• р О ) ___ |
Y |
r |
et |
|
bit |
)> |
|
|
|
А(к) — |
і= 1 |
|
р(£ь |
|
|
||||
|
I |
|
|
|
■ Л2У |
), |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
sit |
|
|
(6.7) |
|
|
|
|
|
|
|
|
|
|
|
гр> = |
2 |
с Д |
(Ь, |
$>'), |
|
|
|||
|
(=i |
|
|
|
|
|
|
|
|
где р (Ь, gjP), р (&, ё/(Г), • • - |
, Р (ii, |
tji') |
— хемминговые |
расстоя |
|||||
ния между векторами симптомов (^, g/P'), |
|
(^, g/P'), . .. , |
(^, |
). |
|||||
В случае произвольных значений |
симптомов эти голоса вычис |
||||||||
ляются по формулам |
|
|
|
|
|
|
|
|
|
р ( 2 ) 1 (А)
II
=
|
|
' |
2 |
^п-- P ( E p i / r ) |
|
[2 |
1], |
|
/="4—pH |
|
|
т2 |
|
(б).І2/Г) _ |
V |
- P |
|
|
[2П- |
1]. |
/="4—i+l
Г ІЙ - |
ml |
- P |
) ___ |
2 |
[2"- |
1], |
|
|
/="4—1+1 |
|
i |
причем р (£/, ffi) определяется |
следующим образом. |
10 4- 628 |
145 |
Пусть |
|
|
|
|
|
|
|
|
|
|
|
— Q4.1 |
^ 2 — к2, |
£з — Kg, |
.. . , ^ni — am, |
|
|
||||
|
= ß / b |
$ > ' = |
ß / 2 , |
& Y |
= |
ß /3 , |
• • • , |
= ß/m , |
(6.9) |
|
|
K ' — ß/i| > |
8 |
|
(г = |
1 , m; |
j = l , m j ) . |
|
|||
Тогда p |
(£/, È,-/1) совпадает |
с числом |
выполненных |
неравенств. |
||||||
Итак, |
получаем |
алгоритмы, |
позволяющие вычислить по |
пред |
ставленному вектору симптомов количество голосов, поданных за различные классы болезней, взятых из множества [D], т. е. Dj а {D}
(J |
= 1 , т ) . Однако |
количество векторов |
симптомов, содержащееся |
||||
в |
полумножестве |
классов |
болезней |
Dj (j — 1 , т), |
неодинаково. |
||
Поэтому введем нормировку в виде |
|
|
|
|
|||
|
|
г ( 1 ) |
г(2) |
|
г (О |
|
|
|
|
1 (fe) |
1 W |
|
1 tfe) |
|
|
|
|
|
|
|
гпі |
|
|
где mi (i = 1 , /) — количество векторов |
симптомов, |
содержащихся |
|||||
в |
і-м классе болезней. |
р(2) |
|
р (О |
|
|
|
|
|
р(1) |
|
|
|
||
|
Далее, величины —— , —— , |
, —— назовем удельным чи- |
|||||
|
’ |
m, |
т „ |
|
гп[ |
|
J |
слом голосов, поданных строкой 5 соответственно за k-й класс. |
|||||||
|
Если |
р ( і ) |
р (2 ) |
|
|
|
|
|
шах |
|
|
|
|
||
|
l (k) |
Х (А) |
’ |
ГГЦ 1 |
ГПі |
’ |
|
|
|
|
|
то представленный вектор симптомов 5 относится к і-му классу болезней, т. е. 5 £ Dt. При равенстве удельного числа голосов, поданных за некоторые классы болезней, вектор 5 будет отнесен не к одному, а к нескольким классам болезней. В этом случае тре буется дополнительное исследование вектора 5'.
Из изложенного выше алгоритма распознавания болезней легко заметить, что точность этого распознавания во многом зависит,
во-первых, от качества обучающихся подмножеств Dj (J — 1, т) и, во-вторых, от удачного выбора параметров k и е.
2.Логико-вероятностный алгоритм распознавания болезней
Рассмотрим логико-вероятностный алгоритм диагностики. Для
алгоритмизации процесса диагностирования мы выяснили после довательные этапы постановки диагноза (рис. 4).
Сбор информации о больном производится в соответствии с планом клинического обследования. Обследование начинается со стандартных вопросов («Что болит?») и стандартных исследований (измерение температуры, подсчет частоты пульса). В зависимости
146
от жалоб больного и результатов первичного осмотра стандартный план обследования конкретизируется и индивидуализируется. Затем больной направляется на различные лабораторные и функ циональные обследования. Всю накопленную информацию о со стоянии больного записывают в историю болезни. Из собранной ин формации при помощи анализа производится отбор наиболее су щественных данных для оценки информации.
План клиническаго обследования}------ —{ Больной |— «-] Сбор инф ормации о больном |
Рис. 4. Последовательные этапы постановки диагноза.
Результатом оценки информации является диагноз, в составлении которого используются:
а) данные о больном, свободные от избыточности и представ ленные в форме, удобной для последующей логической оценки, т. е. соответствующий набор признаков-симптомов;
б) медицинский опыт врача, знания, накопленные им в резуль тате учебы и врачебной деятельности; сведения о наиболее часто встречающихся заболеваниях, симптомах, однозначно определяю щих данные болезни, вероятности появления того или иного симп тома при некоторых болезнях и т. п.;
в) законы медицинской врачебной логики, выработанные в ре зультате изучения медицины и личного опыта врача.
После разбора процесса постановки диагноза строим модель, опирающуюся на математическую логику, теорию вероятности и статистику, исходя из того, что человеческий организм рассматри вается как объект, задаваемый т различными признаками двух возможных значений, которые составляют полную систему собы тий. Тогда рассматриваемый объект может находиться в одном из 2т различных состояний.
Определим количество заболеваний (п), имеющих много общих признаков (симптомов) с рассматриваемым событием.
ю* |
147 |
Для выделения заболевания, соответствующего 2'п различ ным состояниям рассматриваемого объекта, производим анализ раз личных комбинаций заболевания. Кроме этого, надо определить клиническую картину всех комбинаций заболевания. Сведения, указывающие на взаимосвязь заболевания с состояниями призна ков, назовем «медицинскими утверждениями».
Т а б л и ц а |
13. К диагностике болезни |
|
|
|
||
|
|
|
Симптомо-комплексы |
|
Безусловная |
|
Болезне- |
|
|
|
|
|
|
|
|
|
|
|
вероятность |
|
комплексы |
|
с0 |
Cl |
С^ТП_ 1 |
болезне- |
|
|
|
комплексов |
||||
do |
|
Р (^o/^n) |
Р ( c j d 0) |
Р (с2т_І^о) |
P ( d 0) |
|
Ф |
|
Р (с0/4,) |
Р (Сі /Ф) |
Р i c 2 m — i l d i ) |
P(di) |
|
|
|
|
• • |
• |
|
|
d 2 n — 1 |
|
Р {C0/ d 2 n — l) |
р ( с Щ ^ - і ) |
р(с2т _ | / 4 2п _[) |
Р [ d 2 " ~ l) |
|
Таким образом, основу объективного диагностирования можно |
||||||
наметить |
в |
следующем |
порядке: |
|
|
|
1 ) определить количество заболеваний (п), имеющих много об |
||||||
щих симптомов, и количество рассматриваемых |
симптомов (тп); |
|||||
2 ) соответственно от нуля до 2 П— 1 |
присвоить |
номера болезне- |
||||
комплексам |
(комбинациям заболеваний); |
|
|
3)аналогично от нуля до 2 т — 1 присвоить номера симптомокомгілексам (состояниям признаков);
4)при помощи п. 2 и 3 написать все медицинские утверждения;
5) |
заполнить табл. 13 |
(условные и |
безусловные |
вероятности). |
В |
табл. 12 р (Cj/dt) — |
вероятность |
того, что из |
т больных с |
болезне-комплексом dc t — количество |
больных, одновременно име |
|||
ющих симптомо-комплекс с,-: |
|
|
||
|
|
р(щ Я ) = ^ - |
(6 . 1 0 ) |
Здесь р (di) — вероятность того, что больной относится к комплексоболезни dc, т. е. если N — количество всех больных, из них т от носятся к du то
Р (di) = ~ff • |
(6.11) |
1 Таким образом, проблему автоматизации диагностического про цесса можно свести к моделированию «черного ящика». При этом ос новной задачей является создание таких алгоритмов, которые об ладали бы необходимой эффективностью.
148
Нами разработан алгоритм для дифференциации заболева ния, который был реализован на ЭЦВМ (рис. 5). В алгоритме ис пользовалась теория математической логики и теория вероятнос ти. Чтобы написать алгоритм, введем следующие символические обозначения: Sj — у больного обнаружен симптом № I; D, — боль ной страдает болезнью № І.
Рис. 5. Дифференциальная диагностика на ЭЦВМ. |
|
|||
Будем рассматривать множество из т симптомов |
slf s2, ..., sm |
|||
и множество из п болезней |
Dlt D.,, |
..., Dп. Тогда |
медицинские |
|
утверждения молено выразить в виде булевой функции |
||||
Е (Д> |
. . . , |
sm, |
D2, .. . , |
|
Симптомы больного обозначим через G (slt s2, .... sm), а диагноз — через f (Dlt D2.......Dn).
Определять функцию / можно путем построения логического базиса. Логическим базисом рассматриваемых симптомов и болез ней называется выявление всех мыслимых комбинаций.
Для т симптомов и п болезней расширенный логический базис,
представляет собой матрицу, у которой будет |
2т+п строк и т + |
+ п столбцов. Каждая строка представляет |
одну из комбинаций |
комплексо-болезней. Но не все информации строки (комплексо- симптомо-болезни) возможны, т. е. не все они встречаются в дей ствительности. Из медицинских утверждений мы получаем сведения: какие из этих комплексо-симптомов-болезней действительно воз можны и какие мыслимы только формально. Исключая все формаль ные строки, получаем сокращенный логический базис.
Рассматривая функцию G, мы выделяем строки из сокращенного логического базиса, а из этих строк выделяем информацию о
149
заболевании. Если количество выделенных строк окажется единст венным, то диагноз определен точно. Если же количество строк ока жется не единственным, то диагноз однозначно не установлен. В этом случае необходимо вычислить вероятность каждого заболевания. Математически значение этой вероятности выражается как р (djcj), где символ справа от черты является условием, а символ слева — случайным событием, условную вероятность которого надо опреде лить. Для вычисления условной вероятности применяется известная формула Байеса
р (djc,) = пР№)р (с//Ф) _ |
(6 . 1 2 ) |
^ Р Ш Р (сЦйк)
k= 1
Для постановки диагноза в машину вводят величины т и п, переведенные в восьмеричную систему, и медицинские утверждения. Кроме того, для ввода в машину подготавливают таблицу условных
ибезусловных вероятностей.
3.Алгоритм определения меры важности признаков (определение весов подсистем в многомерной системе)
Одной из наиболее важных и сложных задач, возникающих при распознавании заболевания, является выбор и формирование сим- птомо-комплексов для описания конкретных болезней. Трудность ее решения в том, что не существуют какие-либо формальные пра вила, позволяющие до обучения указать набор симптомо-комплек- сов, который позволил бы получить достаточно надежную класси фикацию. Обычно при выборе симптомо-комплексов для описания того или иного класса заболевания исходят из требования наибо лее полного описания этих классов болезней. Часто это приводит к избыточности описания, увеличению объема статистического ма териала и иногда требует ненужных затрат для получения данных о болезни. В связи со сказанным возникает задача выделения из общей совокупности симптомо-комплексов, имеющих наиболее важное значение при классификации болезней, и симптомо-комп лексов, практически не влияющих на распознавание болезни.
В настоящее время разработаны разные методы определения меры важности симптомов в признаковом пространстве. Одним из наиболее практически целесообразных является метод, базирую щийся на числе голосов, поданных вектором симптомов за соответ ствующие классы заболеваний [23, 24].
Пусть заданы подмножества (6.2)—(6.4), описывающие соответ ственно классы болезней Dlt D2, ..., Dt.
Как известно, число голосов Г ^, ГЩ, ..., Г(*), поданных век тором 5 за соответствующий класс болезней Dlt D2, ... , Dt харак теризует близость вектора 5 к данному классу. Используем это со ображение для введения меры важности симптомов.
150