Файл: Каган Б.М. Цифровые вычислительные машины и системы учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 203

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

среднее время восстановления достоверности информа­ ции после сбоя.

Пользователь должен быть уверен в правильности производимых машиной расчетов, особенно в случае ре­ шения ответственных задач, при работе машины в ре­ альном времени с расчетом и выдачей управляющих воз­ действий на объект управления.

Если вычислительная система не обеспечивает поль­ зователя средствами контроля достоверности функциони­ рования машины, он вынужден непроизводительно за­ трачивать машинное время на двойной просчет, решение контрольных вариантов и т. д.

Выбор методов повышения надежности ЦВМ и их эффективность в значительной мере зависят от того, яв­ ляется ли вычислительная машина восстанавливаемой или невосстанавливаемой, обслуживаемой или необслу­ живаемой системой.

Система называется восстанавливаемой, если во вре­ мя эксплуатации может производиться ремонт для уст­ ранения возникающих отказов. Система считается обслу­ живаемой, если допускается периодическое проведение профилактических испытаний для выявления элементов и узлов, параметры которых близки к предельно допу­ стимым.

В большинстве случаев ЦВМ представляют собой в терминах теории надежности — восстанавливаемые об­ служиваемые системы. К невосстанавливаемым систе­ мам относятся, например, бортовые вычислительные ма­ шины ракет.

Может показаться, что для повышения достоверно­ сти функционирования ЦВМ, уменьшения вероятности возникновения отказов следует возможно чаще и воз­ можно подробнее проводить профилактическое обслужи­ вание ЦВМ. Однако профилактическое обслуживание связано с потерями рабочего времени машины и затра­ тами труда обслуживающего персонала. Эти потери по своему характеру близки к потерям, связанным с устра­ нением отказов.

Назначение периодов и объема профилактического обслуживания должно производиться с учетом надежно­ сти устройств машины и общего показателя эксплуата­ ционной надежности, характеризующего качество работы системы. Исходя из этого, можно оптимизировать стра­ тегию профилактического обслуживания.

626


Очевидно, что чем выше надежность ЦВМ, тем боль­ ше может быть период между профилактическими рабо­ тами. Чем меньше тратится машинного времени и ква­ лифицированного труда на профилактику и устранение возникшей неисправности, тем выше степень обслужива­ емости ЦВМ.

С целью оценки совокупного влияния на работу ЦВМ рассмотренных выше отдельных показателей надежно­ сти введем комплексный коэффиицент эксплуатационной

надежности (комплексный

коэффициент использования)

 

л+яі

m

 

k

 

 

ILI 11

2

т в. с/.

T K 2 т пф3

 

КЭ- Н

 

r=l

s= 1

(121)

n-\-m

n

 

 

 

 

 

 

2

ti -f- 2

TB.0/

 

 

 

 

/=i

 

где n, m, k — соответственно число отказов, сбоев и про­ филактических обслуживаний за рассматриваемый пе­ риод; ti — интервал времени исправной работы машины между (і—1)-м и і-м нарушениями функционирования машины из-за отказов или сбоев; T B.0j — время восста­ новления /-го отказа; тв.ог— время восстановления до­ стоверности информации после r -го сбоя (время, потра­ ченное на повторный пуск программы, части программы, команды и т. д.); тк — суммарное машинное время, за­ траченное в рассматриваемый период пользователями на контроль достоверности (из-за двойного просчета, конт­ рольных вариантов и т. д.); тПф8 — время, затраченное на s-e профилактическое обслуживание. Приведенное выра­ жение позволяет сделать важные выводы.

Чтобы уменьшить потери от сбоев и отказов, порож­ дающих ошибки, надо предотвратить распространение ошибки в вычислительном процессе, так как в против­ ном случае существенно усложнятся и удлинятся про­ цедуры проверки правильности работы программы, оп­ ределения и устранения искажений в программе, данных и промежуточных результатах.

Для этого необходимо обнаруживать появление ошибки в выполняемых машиной преобразованиях ин­ формации возможно ближе к моменту ее возникновения. С этой целью надо иметь систему автоматического конт­ роля достоверности функционирования машины, оста­ навливающую вычисления при появлении ошибки. На­ личие такой системы позволит освободить пользователя

627


от забот по контролю достоверности и снизит связанные с этим потери [тк в формуле (12-1)].

Далее, поскольку последствия, вызываемые ошибкой, различны в зависимости от того, вызвана ошибка отка­ зом (устойчивое нарушение нормального функциониро­ вания) или сбоем (самоустраняющее нарушение функци­ онирования), необходимо диагностирование характера ошибки с тем, чтобы в случае сбоя восстанавливались достоверность информации и выполнение программы и при этом был минимален повторяемый участок програм­ мы, а в случае отказа — обслуживающий персонал изве­ щался о необходимости ремонта машины.

Для повышения комплексного коэффициента эксплуа­ тационной надежности необходимо повышать обслужи­ ваемость машины и добиваться уменьшения потерь вре­ мени на устранение отказов (повышение ремонтопри­ годности) и на проведение профилактических работ. Эти потери времени в таких сложных объектах, как ЦВМ, в первую очередь связаны с поиском места неисправно­ сти. Важнейшим средством уменьшения указанных по­ терь и повышения обслуживаемости ЦВМ является си­ стема автоматической диагностики, позволяющая лока­ лизировать неисправность.

Отметим, что система диагностики использует имею­ щую в машине систему контроля и поэтому трудно про­ вести между ними четкую границу.

Эффективные системы контроля и диагностики могут быть созданы, если их разработка и проектирование ма­ шины ведутся параллельно и взаимосвязанно.

12-2. О Б Щ И Е П Р И Н Ц И П Ы А В Т О М А Т И Ч Е С К О Г О К О Н Т Р О Л Я Ц В М

В процессе развития вычислительной техники повы­ шение безотказности вычислительных машин достига­ лось за счет использования более надежных элементов (переход от ламповых схем к полупроводниковым и за­ тем к интегральным компонентам), совершенствования конструктивно-технологической базы (печатный монтаж, монтаж накруткой, автоматизация изготовления и про­ верки вычислительных машин) и соответствующих логи­ ческих решений (дублирование схем и устройств и др.). Необходимость повышения достоверности работы вычис­ лительной машины потребовала введения в состав ма­ шины системы контроля, осуществляющей проверку пра­

628


вильности работы машины, а в ряде случаев и исправле­ ние обнаруживаемых ошибок.

Различают два основных вида средств автоматичес­ кого контроля: программные и аппаратные.

К программным средствам относятся контрольные программы или специальные приемы программирования, позволяющие проверять правильность работы машины. Контроль может быть произведен с помощью программ тестовых задач (т. е. задач с известным решением), про­ пускаемых перед решением основной задачи. При пра­ вильном решении тестовых задач имеется определенная вероятность, что в течение некоторого ближайшего про­ межутка времени, достаточного для решения основной задачи, машина будет работать правильно. Контроль во время решения основной задачи осуществляется путем введения в выполняемую программу специальных конт­ рольных процедур, позволяющих установить достовер­ ность решения всей задачи или части ее (двойной про­ счет для одной и той же программы, проверка вычисле­ ний по неиспользованным в основном алгоритме соотно­

шениям,

например,

проверка правильности вычисления

sin а : и C

O S X по формуле sin2x+cos2x = l , и т. п.).

Аппаратные средства контроля создаются введением

в состав

машины

специального дополнительного конт­

рольного оборудования, работающего независимо от про­ граммы.

Программные методы контроля отличаются эконо­ мичностью по затратам оборудования, в то же время они обладают рядом существенных недостатков:

а) снижение фактического быстродействия машины вследствие увеличения числа выполняемых машиной команд;

б) неполнота проверки, поскольку неисправности, приводящие, например, к остановке машины, нарушают выполнение как основных, так и контрольных программ; в) отсутствие единой методики контроля для разных программ, поскольку очень часто программные критерии правильности решения обусловлены специфическими осо­

бенностями решаемой задачи; г) усложнение программирования, поскольку забота

о контроле правильности решения полностью возлагает­ ся на программиста.

Аппаратные методы контроля обеспечивают проверку правильности функционирования машины практически

40—333

629