Файл: Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации).pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 73
Скачиваний: 0
Блок-схема 1. Блок-схема технологического процесса обработки на ЭВМ данных формы № 1 по учету ошибок в информации, обраба тываемой на ВЦ
ботки полученных статистических данных на ЭВМ. Для выполнения поставленной задачи были разработаны и применены следующие два метода:
1) метод'группировки статистических данных с полу чением соответствующих таблиц и средних статистичес ких оценок;
2 ) метод регрессионного и корреляционного анализа статистических данных.
Первый метод осуществлялся по технологии, пока занной на блок-схеме 1.
Полученные по форме № 1 исходные данные комп лектовались в три массива. В первый массив вошли до кументы ВЦ системы ЦСУ СССР, во второй — доку менты ВЦ системы министерств и ведомств, в третий —
19
Блок-схема 2. Блок-схема алгоритма расчета на ЭВМ данных по
исходные данные по материалам выборочного обследо вания отдельных ВЦ.
По каждому документу этих трех массивов осущест влялась подготовка данных для обработки на ЭВМ, состоящая из операций: визуального и логического конт роля исходных данных; исправления обнаруженных оши бок в исходных данных; шифрования текстовой инфор
мации, |
содержащейся в |
форме |
№ |
1; переноса данных |
с формы № 1 на перфоленту |
в |
алфавитно-цифровом |
||
коде 2 |
МТК; контроля |
перфорации и исправления об- |
учету ошибок в информации, обрабатываемой на ВЦ (по форме № 1)
г наруженных на перфоленте ошибок, записи исходной ин-
I |
формации на магнитную ленту. |
t |
Решение задачи на ЭВМ сводилось к тому, чтобы на |
і |
основе записанной на магнитной ленте исходной инфор- |
j |
мации и с помощью разработанной программы получить |
I |
заданные группировочные таблицы в последовательно- |
‘сти, указанной на блок-схеме 1. Алгоритм расчета при веден в блок-схеме 2 .
Вобщем виде программа решения задачи на ЭВМ осуществляла выбор и группировку информации по
20 |
21 |
двум признакам — X (главный признак группировки) и Y (вторичный признак).
По признаку Y проводилась группировка информа ции внутри признака X (в некоторых случаях произво дилась группировка только по одному признаку).
На основе статистических данных по форме № 1, полученных от различных ВЦ, стало возможным прове сти исследование и анализ этих данных в нескольких направлениях, каждое из которых представляет опреде ленный интерес и имеет конкретное назначение. К ним относятся:
1) таблицы по каждому ВЦ в отдельности. Эти све дения дают возможность получить показатели уровня достоверности информации, обрабатываемой на каждом ВЦ, и ряд других характеристик.
Для каждого ВЦ они будут являться ценным анали тическим материалом, способствующим выявлению «уз ких мест» в работе ВЦ. Вместе с тем наличие однород ных данных по каждому ВЦ, рассчитанных по единой методике, позволяет сравнивать ВЦ по сопоставимым показателям и тем самым выявлять лучшие и отстаю щие ВЦ;
2)сводные таблицы по всем обследованным ВЦ си стемы ЦСУ СССР. Они позволяют обобщить данные по ВЦ, характеризуемым не столько единой ведомственной принадлежностью, сколько сравнительно однородным характером и условиями выполняемой работы.
Кроме того, при получении статистических данных от многих ВЦ системы ЦСУ и их суммировании могут быть определены показатели, характеризующие в извест ной мере состояние данной системы в целом, что позво лит сделать некоторые обобщающие выводы и вырабо тать рекомендации по улучшению работы системы;
3)сводные таблицы по всем обследованным ВЦ ми нистерств и ведомств. Эти сведения аналогичны преды дущим, однако при незначительном количестве обследо ванных ВЦ данной системы полученные результаты не могут характеризовать систему в целом, они использу ются как материалы выборочного обследования. Тем не менее такая обработка данных полезна, она дает воз можность сравнить показатели системы ВЦ ЦСУ СССР
сопытом работы вычислительных центров других мини стерств и ведомств;
22
4) сводные таблицы по всем обследованным ВЦ. Эти сведения являются главным итогом, представляющим суммарные данные по всем обследованным ВЦ. По скольку эти данные базируются на большом числе еди ничных наблюдений, они являются наиболее полными и могут послужить выявлением некоторых общих законо мерностей и зависимостей, присущих всей системе ВЦ.
Содержание группировочных таблиц, которые могут быть получены при обработке статистических данных, предопределено самой формой № 1.
Из алгоритма расчета (блок-схема 2) видно, что на основе единичных показателей формы № 1 (аі-=-аи) можно получить в результате выполнения вычислитель ных и контрольных операций 1, 1а, 2, 2а и 3 и выдачи на печать 4 группировочные таблицы 1—10.
В этих таблицах содержатся следующие расчетные данные:
таблица 1 — частота ошибок в объемах обработан ной информации;
таблица 2 — частота ошибок по классам (видам) за дач;
таблица 3 — частота ошибок по этапам технологи ческого процесса обработки информации;
таблица 4 — частота ошибок в объемах обработан ной информации в зависимости от применяемых видов носителей;
таблица 5 — распределение обнаруженных ошибок по их видам и частоте;
таблица 6 — распределение обнаруженных ошибок по причинам их возникновения;
таблица 7 — частота ошибок в объемах обработан ной информации в зависимости от категории ВЦ;
таблица 8 — распределёние обнаруженных ошибок в зависимости от загрузки персонала ВЦ;
таблица 9 — данные об эффективности различных методов контроля;
таблица 10 — оценка эффективности различных ме тодов контроля в зависимости от уровня квалификации контролеров.
Уже сами названия вышеуказанных группировочных таблиц показывают их целенаправленность и значение при исследовании проблемы достоверности информации, обрабатываемой на ВЦ.
23
Группировочные, таблицы для четырех направлений обработки исходных данных (отдельный ВЦ, ВЦ систе мы ЦСУ СССР, ВЦ министерств и ведомств, все обсле дованные ВЦ) составляются по одинаковой форме для возможности сопоставления и суммирования соответст вующих данных.
Формы каждой из группировочных таблиц приво дятся вместе с результатами обработки исходных дан ных в главе II. Здесь необходимо лишь указать, что ос новной искомой величиной в расчете большинства груп пировочных таблиц является частота ошибки, определяе мой как отношение количества обнаруженных ошибок к объему обработанной информации и приведенной к ус ловному объему (ІО-4 знаков).
Последовательность расчета группировочных таблиц на ЭВМ несколько отличается от нумерации этих таб лиц. Это связано с рациональным построением машин ной программы.
Рассчитанные на ЭВМ группировочные таблицы вы даются на печать и записываются на магнитные ленты для использования в качестве исходной информации второго метода — регрессионного и корреляционного анализа данных проведенного статистического обследо вания ВЦ. Этот метод является органическим продолже нием и завершением метода группировок и средних статистических оценок.
Как уже отмечалось, ошибки, возникающие при об работке информации, по своей природе носят случайный, стохастический характер, что дает основание воспользо ваться при количественной оценке достоверности инфор мации теорией вероятности и статистическими метода ми расчета. Эти методы дают возможность уточнить средние статистические оценки, полученные с помощью первого метода группировок, так как они исключают случайные резко выделяющиеся величины единичных наблюдений и дают более правомерные количественные характеристики исследуемых явлений.
С другой стороны, как известно, корреляционный ме тод анализа позволяет оценить влияние и взаимосвязь двух или более величин, что особенно важно при иссле довании рассматриваемой проблемы достоверности для выявления существенных факторов, способствующих появлению ошибок в обрабатываемой информации,
24
Таблицы, полученные с помощью метода группиров ки статистических данных, записанные на магнитную ленту и, являющиеся исходной информацией для корре ляционного анализа, построены таким образом, что в
каждой из |
десяти |
таблиц |
сгруппированы |
данные по |
двум показателям |
(количеству обнаруженных ошибок |
|||
и объемам |
обработанной информации). Показатели вы |
|||
бираются |
по какому-нибудь |
одному из |
исследуемых |
факторов (например, по классу задач, носителям инфор мации, этапу технологического процесса и др.).
Таким образом, по каждой таблице может быть сде лана парная корреляция, анализирующая влияние рас сматриваемого фактора на величину ошибок. Такой анализ, однако, не является достаточно полным, по скольку на величину ошибок оказывает совокупное вли яние множество факторов. Более полным методом иссле дования является метод множественной корреляции, который основан на отборе наиболее значимых факто ров, определяемых по соответствующим коэффициентам, полученным при парной корреляции.
Следовательно, первым этапом при обработке полу ченных статистических данных по обследованным ВЦ является осуществление метода парной корреляции для последующего проведения на втором этапе — множест венной корреляции.
Мы рассмотрим только первый этап обработки полу ченных данных, поскольку расчеты уравнений и коэф фициентов множественной корреляции еще не заверше ны, что отнюдь не снижает интереса к результатам рас четов коэффициентов парной корреляции, которые дают наглядное представление и количественную оценку ис следуемых факторов.
Порядок расчета регрессионного и корреляционного анализа удобно рассмотреть по укрупненной блок-схе ме 3:
1. Получение эмпирического ряда из результатов всех наблюдений, записанных на магнитную ленту. Дан ные выбираются по признакам а,: 1) наименование и категория ВЦ, 2) наименование задачи, 3) шифр этапа технологического процесса, шифр носителя информации, 4) шифр метода контроля, 5) шифр вида ошибок, 6) шифр причины ошибок, 7) дата выполнения опера ции, 8 ) шифр метода контроля и причины ошибок,
25
Блок-схема 3. Блок-схема алгоритма расчета на ЭВМ статистических характеристик достоверности обработки информации
9) стаж работы контролера. В результате выборки по заданному признаку получаем ряд значений величины объема обработанной информации (Q) и соответствую
26
щие им количества ошибок (б), расположенных в бес порядке:
Qi» 6„ і = 1,..., п. 1
2. Ранжирование (упорядочение) эмпирического ря да, выбранного по заданному признаку. Получаем ряд значений величины объема обработанной информации и соответствующих им значений количества ошибок, рас положенных в порядке возрастания величины Q.
Результаты-наблюдений по каждой группе от А\ до
.4„ в выбранных данных по заданному признаку имеют следующий вид:
Группа |
Номер |
Объем |
|
Количество |
|
данных |
наблюдения |
информации |
|
ошибок |
|
А |
N, |
|
Q I . I |
• |
бі . і |
а 2 |
N2 |
Qi , 2 |
|
öl , 2 |
|
An |
Nn |
Ql ,п |
|
Öl ,п |
|
+1 |
Nn+i |
2 +1 |
|
бг.л+і |
|
Аг |
|
|
Q ,n |
|
|
•4л+2 |
|
2 |
2 +2 |
|
бг.л+г |
и т. д. |
Пп+ . |
Q ,л |
|
||
|
|
|
|
|
|
По условиям сортировки в каждой группе |
|
||||
Qi.i |
< Qi,2; |
Qi,2 < |
Qi,3i •••» Qi,n—i< Q i,n |
||
Q2, I < Q2,2» |
Q2,2 < |
Q2,3» • ■•» Q2, n—1<Qi,n |
3. Построение усредненного эмпирического ряда объ ема обработанной информации. Последовательно рас считываются следующие величины:
вариация ряда R = Qm^ — Qmin,
где Qmin и Qmax — соответственно минимальный и мак симальный обработанные объемы;
величина (высота) интервала
где L — целая часть числа 1+3,322А/' (N — количество наблюдений в ряду).
Границы расчетных интервалов и их середины опре деляются по следующим формулам:
27