Файл: Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации).pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 73

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Блок-схема 1. Блок-схема технологического процесса обработки на ЭВМ данных формы № 1 по учету ошибок в информации, обраба­ тываемой на ВЦ

ботки полученных статистических данных на ЭВМ. Для выполнения поставленной задачи были разработаны и применены следующие два метода:

1) метод'группировки статистических данных с полу­ чением соответствующих таблиц и средних статистичес­ ких оценок;

2 ) метод регрессионного и корреляционного анализа статистических данных.

Первый метод осуществлялся по технологии, пока­ занной на блок-схеме 1.

Полученные по форме № 1 исходные данные комп­ лектовались в три массива. В первый массив вошли до­ кументы ВЦ системы ЦСУ СССР, во второй — доку­ менты ВЦ системы министерств и ведомств, в третий —

19


Блок-схема 2. Блок-схема алгоритма расчета на ЭВМ данных по

исходные данные по материалам выборочного обследо­ вания отдельных ВЦ.

По каждому документу этих трех массивов осущест­ влялась подготовка данных для обработки на ЭВМ, состоящая из операций: визуального и логического конт­ роля исходных данных; исправления обнаруженных оши­ бок в исходных данных; шифрования текстовой инфор­

мации,

содержащейся в

форме

1; переноса данных

с формы № 1 на перфоленту

в

алфавитно-цифровом

коде 2

МТК; контроля

перфорации и исправления об-

учету ошибок в информации, обрабатываемой на ВЦ (по форме № 1)

г наруженных на перфоленте ошибок, записи исходной ин-

I

формации на магнитную ленту.

t

Решение задачи на ЭВМ сводилось к тому, чтобы на

і

основе записанной на магнитной ленте исходной инфор-

j

мации и с помощью разработанной программы получить

I

заданные группировочные таблицы в последовательно-

сти, указанной на блок-схеме 1. Алгоритм расчета при­ веден в блок-схеме 2 .

Вобщем виде программа решения задачи на ЭВМ осуществляла выбор и группировку информации по

20

21

двум признакам — X (главный признак группировки) и Y (вторичный признак).

По признаку Y проводилась группировка информа­ ции внутри признака X (в некоторых случаях произво­ дилась группировка только по одному признаку).

На основе статистических данных по форме № 1, полученных от различных ВЦ, стало возможным прове­ сти исследование и анализ этих данных в нескольких направлениях, каждое из которых представляет опреде­ ленный интерес и имеет конкретное назначение. К ним относятся:

1) таблицы по каждому ВЦ в отдельности. Эти све­ дения дают возможность получить показатели уровня достоверности информации, обрабатываемой на каждом ВЦ, и ряд других характеристик.

Для каждого ВЦ они будут являться ценным анали­ тическим материалом, способствующим выявлению «уз­ ких мест» в работе ВЦ. Вместе с тем наличие однород­ ных данных по каждому ВЦ, рассчитанных по единой методике, позволяет сравнивать ВЦ по сопоставимым показателям и тем самым выявлять лучшие и отстаю­ щие ВЦ;

2)сводные таблицы по всем обследованным ВЦ си­ стемы ЦСУ СССР. Они позволяют обобщить данные по ВЦ, характеризуемым не столько единой ведомственной принадлежностью, сколько сравнительно однородным характером и условиями выполняемой работы.

Кроме того, при получении статистических данных от многих ВЦ системы ЦСУ и их суммировании могут быть определены показатели, характеризующие в извест­ ной мере состояние данной системы в целом, что позво­ лит сделать некоторые обобщающие выводы и вырабо­ тать рекомендации по улучшению работы системы;

3)сводные таблицы по всем обследованным ВЦ ми­ нистерств и ведомств. Эти сведения аналогичны преды­ дущим, однако при незначительном количестве обследо­ ванных ВЦ данной системы полученные результаты не могут характеризовать систему в целом, они использу­ ются как материалы выборочного обследования. Тем не менее такая обработка данных полезна, она дает воз­ можность сравнить показатели системы ВЦ ЦСУ СССР

сопытом работы вычислительных центров других мини­ стерств и ведомств;

22


4) сводные таблицы по всем обследованным ВЦ. Эти сведения являются главным итогом, представляющим суммарные данные по всем обследованным ВЦ. По­ скольку эти данные базируются на большом числе еди­ ничных наблюдений, они являются наиболее полными и могут послужить выявлением некоторых общих законо­ мерностей и зависимостей, присущих всей системе ВЦ.

Содержание группировочных таблиц, которые могут быть получены при обработке статистических данных, предопределено самой формой № 1.

Из алгоритма расчета (блок-схема 2) видно, что на основе единичных показателей формы № 1 (аі-=-аи) можно получить в результате выполнения вычислитель­ ных и контрольных операций 1, 1а, 2, и 3 и выдачи на печать 4 группировочные таблицы 1—10.

В этих таблицах содержатся следующие расчетные данные:

таблица 1 — частота ошибок в объемах обработан­ ной информации;

таблица 2 — частота ошибок по классам (видам) за­ дач;

таблица 3 — частота ошибок по этапам технологи­ ческого процесса обработки информации;

таблица 4 — частота ошибок в объемах обработан­ ной информации в зависимости от применяемых видов носителей;

таблица 5 — распределение обнаруженных ошибок по их видам и частоте;

таблица 6 — распределение обнаруженных ошибок по причинам их возникновения;

таблица 7 — частота ошибок в объемах обработан­ ной информации в зависимости от категории ВЦ;

таблица 8 — распределёние обнаруженных ошибок в зависимости от загрузки персонала ВЦ;

таблица 9 — данные об эффективности различных методов контроля;

таблица 10 — оценка эффективности различных ме­ тодов контроля в зависимости от уровня квалификации контролеров.

Уже сами названия вышеуказанных группировочных таблиц показывают их целенаправленность и значение при исследовании проблемы достоверности информации, обрабатываемой на ВЦ.

23

Группировочные, таблицы для четырех направлений обработки исходных данных (отдельный ВЦ, ВЦ систе­ мы ЦСУ СССР, ВЦ министерств и ведомств, все обсле­ дованные ВЦ) составляются по одинаковой форме для возможности сопоставления и суммирования соответст­ вующих данных.

Формы каждой из группировочных таблиц приво­ дятся вместе с результатами обработки исходных дан­ ных в главе II. Здесь необходимо лишь указать, что ос­ новной искомой величиной в расчете большинства груп­ пировочных таблиц является частота ошибки, определяе­ мой как отношение количества обнаруженных ошибок к объему обработанной информации и приведенной к ус­ ловному объему (ІО-4 знаков).

Последовательность расчета группировочных таблиц на ЭВМ несколько отличается от нумерации этих таб­ лиц. Это связано с рациональным построением машин­ ной программы.

Рассчитанные на ЭВМ группировочные таблицы вы­ даются на печать и записываются на магнитные ленты для использования в качестве исходной информации второго метода — регрессионного и корреляционного анализа данных проведенного статистического обследо­ вания ВЦ. Этот метод является органическим продолже­ нием и завершением метода группировок и средних статистических оценок.

Как уже отмечалось, ошибки, возникающие при об­ работке информации, по своей природе носят случайный, стохастический характер, что дает основание воспользо­ ваться при количественной оценке достоверности инфор­ мации теорией вероятности и статистическими метода­ ми расчета. Эти методы дают возможность уточнить средние статистические оценки, полученные с помощью первого метода группировок, так как они исключают случайные резко выделяющиеся величины единичных наблюдений и дают более правомерные количественные характеристики исследуемых явлений.

С другой стороны, как известно, корреляционный ме­ тод анализа позволяет оценить влияние и взаимосвязь двух или более величин, что особенно важно при иссле­ довании рассматриваемой проблемы достоверности для выявления существенных факторов, способствующих появлению ошибок в обрабатываемой информации,

24


Таблицы, полученные с помощью метода группиров­ ки статистических данных, записанные на магнитную ленту и, являющиеся исходной информацией для корре­ ляционного анализа, построены таким образом, что в

каждой из

десяти

таблиц

сгруппированы

данные по

двум показателям

(количеству обнаруженных ошибок

и объемам

обработанной информации). Показатели вы­

бираются

по какому-нибудь

одному из

исследуемых

факторов (например, по классу задач, носителям инфор­ мации, этапу технологического процесса и др.).

Таким образом, по каждой таблице может быть сде­ лана парная корреляция, анализирующая влияние рас­ сматриваемого фактора на величину ошибок. Такой анализ, однако, не является достаточно полным, по­ скольку на величину ошибок оказывает совокупное вли­ яние множество факторов. Более полным методом иссле­ дования является метод множественной корреляции, который основан на отборе наиболее значимых факто­ ров, определяемых по соответствующим коэффициентам, полученным при парной корреляции.

Следовательно, первым этапом при обработке полу­ ченных статистических данных по обследованным ВЦ является осуществление метода парной корреляции для последующего проведения на втором этапе — множест­ венной корреляции.

Мы рассмотрим только первый этап обработки полу­ ченных данных, поскольку расчеты уравнений и коэф­ фициентов множественной корреляции еще не заверше­ ны, что отнюдь не снижает интереса к результатам рас­ четов коэффициентов парной корреляции, которые дают наглядное представление и количественную оценку ис­ следуемых факторов.

Порядок расчета регрессионного и корреляционного анализа удобно рассмотреть по укрупненной блок-схе­ ме 3:

1. Получение эмпирического ряда из результатов всех наблюдений, записанных на магнитную ленту. Дан­ ные выбираются по признакам а,: 1) наименование и категория ВЦ, 2) наименование задачи, 3) шифр этапа технологического процесса, шифр носителя информации, 4) шифр метода контроля, 5) шифр вида ошибок, 6) шифр причины ошибок, 7) дата выполнения опера­ ции, 8 ) шифр метода контроля и причины ошибок,

25


Блок-схема 3. Блок-схема алгоритма расчета на ЭВМ статистических характеристик достоверности обработки информации

9) стаж работы контролера. В результате выборки по заданному признаку получаем ряд значений величины объема обработанной информации (Q) и соответствую­

26

щие им количества ошибок (б), расположенных в бес­ порядке:

Qi» 6„ і = 1,..., п. 1

2. Ранжирование (упорядочение) эмпирического ря­ да, выбранного по заданному признаку. Получаем ряд значений величины объема обработанной информации и соответствующих им значений количества ошибок, рас­ положенных в порядке возрастания величины Q.

Результаты-наблюдений по каждой группе от А\ до

.4„ в выбранных данных по заданному признаку имеют следующий вид:

Группа

Номер

Объем

 

Количество

данных

наблюдения

информации

 

ошибок

А

N,

 

Q I . I

бі . і

а 2

N2

Qi , 2

 

öl , 2

An

Nn

Ql ,п

 

Öl ,п

+1

Nn+i

2 +1

 

бг.л+і

Аг

 

 

Q ,n

 

•4л+2

 

2

2 +2

 

бг.л+г

и т. д.

Пп+ .

Q ,л

 

 

 

 

 

 

По условиям сортировки в каждой группе

 

Qi.i

< Qi,2;

Qi,2 <

Qi,3i •••» Qi,n—i< Q i,n

Q2, I < Q2,2»

Q2,2 <

Q2,3» • ■•» Q2, n1<Qi,n

3. Построение усредненного эмпирического ряда объ­ ема обработанной информации. Последовательно рас­ считываются следующие величины:

вариация ряда R = Qm^ — Qmin,

где Qmin и Qmax — соответственно минимальный и мак­ симальный обработанные объемы;

величина (высота) интервала

где L — целая часть числа 1+3,322А/' (N — количество наблюдений в ряду).

Границы расчетных интервалов и их середины опре­ деляются по следующим формулам:

27