Файл: Кадыров, Х. К. Синтез математических моделей биологических и медицинских систем.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 78
Скачиваний: 0
Для этой подсистемы определяются значения критериев эффектив ности Ф(1).
Продолжая подобные поиски подсистем, можно получить по следовательные векторы
W l |
= |
K |
l . |
W i t , |
• • • |
, |
Win), |
|
W 2 = |
K |
i , |
w22, |
. . . |
, |
Win), . |
^ 2 0 ) |
|
Wr = |
(WrU |
Wr2 , |
. . . , Wrr) |
|
||||
и соответствующие им'значения критериев ценности |
|
|||||||
Ф(|), |
ф (2), |
ф '3), . . . |
, ф (г). |
|
||||
Далее определяются |
|
|
|
|
|
|
|
|
Фтіп = |
min {Ф(1), |
Ф|2 |, . . . , Ф |Г||, |
|
|||||
Фтах = |
шах {Ф(1), |
Ф(2).......... Ф(г)} |
|
и выделяются векторы Ц7тіп и Wmax, соответствующие ф тіп и Фтах. Если необходимо, например, получить подсистему с наимень шим значением критерия ф, то после такой группы из г подсистем
вектор вероятности
|
|
Р |
= (Р і |
, р |
2 ......... Р п ) |
|
|
из первоначального |
|
|
|
|
|
||
|
„ ( ° ) |
= іМ0) = |
|
п < ° > — |
д ° > |
1 |
|
|
|
|
|||||
|
|
|
Р2 = |
Рп |
п |
||
получается |
следующим |
образом: |
если |
wfhах = 0 , |
то р}1*= р/0) |
||
(/ = іТй), |
а при |
= 1 р)и = |
Р;0>— А, |
если p f |
— А > pmin, |
||
либо ру0 = |
pmin, если p f’ — А |
< |
pmin. |
|
|
Через А обозначен шаг «наказания» признака, а pmin — некото рая заранее установленная его минимальная вероятность. «Поощ
рение» признаков производится следующим образом: |
если |
ш/тах = |
____ |
_ |
Ң |
= 1(/ = 1, п), то устанавливается шаг «поощрения» |
А = |
—, где |
Н представляет суммарное «наказание» признаков. К вероятнос
ти признака, соответствующего да/тах = 1, прибавляется А. С по мощью вектора
Ä = К > , w ? ..........
с точностью критерия эффективности Фтіп формулируется подмно жество признаков в виде вектора
S — S {^, £г, ■• ■> £щ}>
где
I/ = w f =1 |
(/ = 1, т, t'=l, п), |
155
которые являются наиболее весомыми признаками, а вектор 5 образует наилучшую подсистему.
После выбора ряда групп вероятность выбора признаков, часто встречающихся в удачных сочетаниях, становится существенно больше других. Их отрезки занимают почти весь интервал (0, 1), и датчик случайных чисел начинает выбирать одно и то же сочета ние из т симптомов.
Из описанного легко заметить, что процесс выделения эффектив ных подсистем из заданной системы и его эффективность зависят
от удачного выбора параметров |
г, п |
и h. Чем большим выбран |
шаг h при данном г, тем меньше |
число групп потребуется для полу |
|
чения нужной сходимости, но и тем |
меньше вероятность того, что |
полученная подсистема S является самой эффективной. Рассмотрим разные варианты критериев эффективности. Пусть
необходимо распознать / образов и пусть с целью обучения зада
но множество векторов-симптомов, |
состоящих из |
N — тг 4- ... |
|||||||
... + т1векторов (6.14): для первого |
образа |
векторов и т. д. |
|||||||
Каждый |
вектор-симптом |
описывается |
набором |
п |
компонентов |
||||
(симптомов), представляющих реализацию |
|
|
|
||||||
|
■U) |
; ( 0 |
tU) |
|
( / = 1 ,УѴ, |
г = 1 |
|
||
S)0 = S f] {щ . |
|
hjn |
|
, 0 |
|||||
признаков-симптомов £(- (i = |
1 , n). |
|
|
|
|
|
|||
Для каждого образа задана матрица чисел. Элементы матрицы |
|||||||||
Dj (/ = |
1, I) обозначим £$ |
(г = |
1 , /, |
/ |
= 1, т, k |
— |
1, |
п). Необ |
|
ходимо |
определить подсистему |
т признаков-симптомов |
(т < п), |
которая наилучшим образом коррелирует с некоторым признаком т). В работе [251 не рекомендуется конкретный признак rj, а критерием эффективности принят коэффициент множественной корреляции.
Опишем разработанные нами критерии эффективности. В ка честве признака т] целесообразно принять признак, характерный для всех признаков-симптомов, описывающих исследуемую систему.
Таким |
образом |
можно |
считать |
средние |
значения |
всех |
симпто |
||
мов, т. е. |
|
|
|
|
|
|
|
|
|
|
лГ1 |
= 4 - |
S s ft’ |
(/ = u v , |
k = |
Г77). |
(6 .2 1 ) |
||
|
|
п 1=1 |
|
|
|
|
|
|
|
Критерием эффективности подсистем |
можно |
взять |
|
||||||
где |
ф = IЛ (Л ), Лг> • ■• . Лп) — Л (ЛіЛг. • • ■ . Лт ) I- |
(G-2 2 ) |
|||||||
Л (Лі. Л2. • • • . |
Ля) = К + |
h h + b2l 2 + • • • |
+ bnl nl |
|
|||||
|
|
||||||||
или в |
стандартизованном виде |
|
|
|
|
|
|
||
а |
Л/(^і.>^п2 .......... h n) — ßi^6 i + |
+ |
••• |
|
|
|
|||
|
|
|
|
|
|
|
|
|
Л (Лі. Л2 , • • • , Лт) = ао+ «1І1 + <hІ2 + • • • + ат
156
или в стандартизованном виде
(^П.> • • • > t%) — a l \ + aJ% + • • • + amhm-
Можно рекомендовать также и другой критерий эффективности подсистем, базирующийся на коэффициенте множественной корреля
ции |
|
|
|
где |
Ф = |
| Я — fl|, |
(6.23) |
_________________________ |
|||
^ |
= У ßirл». + |
‘ • |
+ ß//лЕ„; |
Я = Ѵ “ іМ . + “ Л і* + • ■• +
Приведем еще один критерий эффективности, разработанный нами на основе метода, изложенного в § 1 данной главы.
Пусть при помощи алгоритма вычисления меры важности (6.17)
или (6.18) для таблиц величин D |
( |
|
uD |
|
t |
(6.14) и |
(6.16) |
|||||||
|
|
|
|
|
n, 2 |
mt |
|
n—1, |
2 |
mi |
|
|
||
|
|
|
|
|
|
i=l |
|
|
|
|
( = 1 |
|
m( — число |
|
изучаемых объектов (n — число признаков-симптомов, |
||||||||||||||
объектов, I — число классов) |
вычисляются информационные веса |
|||||||||||||
Р (1). Р (2), ..., р (л). |
|
|
|
|
|
|
|
|
|
|
|
|
||
Далее определяем |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
_Рк_= min ІР 0)> |
Р (2)> |
• • • |
. Р (я)}. |
|
|
||||||||
|
р (k) = |
max {р (1 ), |
р (2 ), . . . |
, |
р (л)}. |
|
|
|||||||
Находим |
шаг /і, для чего |
составляем |
разность р (k) — р (k), |
|||||||||||
из которой определяем шаг |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
и |
I |
Р Й - Р W I |
|
|
|
|
|
||||
где N = п. |
|
|
|
|
|
/V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В общем случае шаг h можно выбрать неравномерным. |
убывающей |
|||||||||||||
Веса симптомов |
систематизируем |
по |
монотонно |
|||||||||||
последовательности |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р ( 0 < Р ( 0 < |
|
< Р п < |
•• • |
< Р і. |
|
(6-24) |
|||||||
а матрицу D |
; |
— соответственно по (6.24). При помощи шага h |
||||||||||||
|
п, 2 т ; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
і = 1 |
|
|
|
|
|
|
_ |
_ |
|
|
_ |
|
|
всю длину |
разброса |
меры важности |
|р (k) — р (k) | разделим на N |
|||||||||||
интервалов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(Р (к), Р (к) + А). |
(Р (к) + к, |
р (А) + 2А), . . . , (р(А) + |
|
|||||||||||
|
|
+ ( ^ - 1 )А, р(к) + Щ |
|
|
|
|
||||||||
и определим симптомы, веса которых попадают в интервал |
(р (k), |
|||||||||||||
р (k) + h), т. е. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
р { к ) < р |
(*'і) < р |
( it) |
< |
■■ ■ < |
P |
( i k) < |
P |
( к ) + |
А. |
|
157
Затем, удаляя эти симптомы из структуры матрицы (6.14),
формируем новую матрицу D |
; |
|
п—k, |
mi |
|
|
^=I |
|
После этого при помощи алгоритма голосования (6.7) или (6 .8 ) оп |
||
ределим число голосов, поданных каждой строкой матрицы D |
||
|
_ |
и—k, 2 ті |
|
і=і |
|
за свой класс, и вычислим функционал f (Г, Г, |
т,). В зависимости |
|
от требований решаемой задачи |
функционал / |
может быть задан |
и в ином конкретном виде. Если |
численные значения функционала |
|
удовлетворяют условию |
|
|
КГ) < 7 ,
где f — заданная постоянная величина (в частности, можно задавать процент нераспознанных строк), то процесс отсеивания менее важ
ных симптомов продолжается. |
В этом случае определяются симп |
||||
томы, веса которых попадают |
в |
интервал (р (k) + h, р (k) + 2 h), |
|||
т. е. |
|
|
|
|
|
р(к) + Іі< р ( І 1)< Р (І2)< |
<p( j e) <p(k) + 2h. |
||||
Далее, удаляя из матрицы D |
( |
эти симптомы, формиру- |
|||
|
|
|
|
п—к, |
|
ем новую матрицу D |
t |
|
|
; = 1 |
|
|
|
и процесс продолжаем в такой же |
|||
|
п—к—І 2 |
пі |
|
|
|
последовательности, |
i=l |
раньше. |
|
||
как и |
|
Процесс отсеивания менее важных признаков продолжается до выполнения условия
I / (Г) — Л < о.
Таким образом можно обеспечить выбор наиболее эффективных подсистем из исходной многомерной системы.
Из изложенного выше легко заметить, что процедура поиска эффективных подсистем из исходной многомерной системы требует выполнения несложных вычислений, которые легко реализуются на современных ЭЦВМ. Это качество процедуры поиска эффективных подсистем дает нам основание рекомендовать ее к использованию при решении практических задач.
Гл а в а 7. МОДЕЛИ БИОЛОГИЧЕСКИХ
ИМЕДИЦИНСКИХ СИСТЕМ
1.Моделирование эпидемического процесса
Анализ исходных данных. Количественные методы широко приме няются при анализе эпидемических процессов при инфекционных заболеваниях. Теоретическое и практическое изучение эпидеми ческих процессов количественными методами прежде всего важно для понимания сущности этого процесса и научно обоснованно го прогнозирования.
Для изучения особенностей эпидемического процесса в связи с влиянием факторов внешней среды нам кажется целесообразным представить его как взаимосвязанную многомерную сложную дина мическую систему. Отметим, что окружающая среда, которая влия ет на ход эпидемии, характеризуется многочисленными метеоро логическими и социальными факторами. Следовательно, разработ ка математической модели эпидемии, содержащая все возможные влияющие факторы, является практически неосуществимой задачей. Поэтому необходимо сначала исследовать степень влияния каждого фактора и выделить наиболее весомые из них, что приведет к упро щению модели без снижения при этом точности аппроксимации.
В качестве исходных статистических данных для изучения этих закономерностей мы приняли результаты двадцатидвухлетнего наблюдения за числом больных бактериальной дизентерией на фо не ряда метеорологических факторов (табл. 14). Вначале эти дан ные подвергались тщательному анализу при помощи алгоритмов гл. 3, в результате чего были выделены наиболее весомые метеоро логические факторы. Степень влияния этих факторов на заболе вания показана в табл. 15.
Результаты анализов позволили выделить шесть наиболее весомых метеорологических факторов из двадцати. Далее при мо делировании заболеваний мы будем пользоваться в основном эти ми шестью факторами.
Построение модели эпидемического процесса. С целью выяс нения степени влияния выделенных метеорологических факторов на протекание эпидемических процессов среди населения различ ных возрастных групп построим математическую модель, состав ленную по алгоритмам, приведенным в гл. 3.
Приближенными уравнениями регрессии для двух возрастных групп (от 1 года и от 50 и выше лет) соответственно оказались:
41’ = 1.92Ц + 0,39г2 + 0,21*з + 0 .59*4 + 0,95*5 + 1,25*в,
42) = 0,16*1 + 0,55*2 + 0,66*з + 0,62*4 + 0,26*5 + 0,32*6.
159