Файл: Брага, В. В. Основы технологии машинной обработки статистической информации [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 150

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

позволяет пользоваться минимальными по значности шиф­ рами.

Все шифры данной номенклатуры должны иметь одинаковую значность. Это обусловливается технологией машинной обработки, т. е. необходимостью составлять стандартный макет перфорации, стандартную настройку машины для группировки информации и контроля признаков.

Коды должны быть удобными для запоминания, легко читать­ ся и иметь логичный переход от шифра к наименованию. Много­ значные сложные шифры удобнее записывать через тире. Если номенклатура подлежит частым изменениям, то необходимо остав­ лять свободные номера для новых позиций и шифров. Резерв сво­ бодных номеров не следует делать излишним, так как это может увеличить значность шифра.

Уже упоминалось, что одно из основных назначений шифров — это группировка информации в машине и получение итогов по группам. Это назначение можно реализовать лишь при выборе правильной системы кодирования: порядковой, серийной, десятич­ ной, комбинированной, шахматной и кода повторения. Две по­ следние системы кодирования при разработке статистической от­ четности применяются очень редко, поэтому мы не будем их рас­ сматривать.

Для того чтобы лучше понять возможность применения той или иной системы кодирования, рассмотрим принципиальное разли­ чие обработки информации по шифрам на табуляторе и электрон­ ной вычислительной машиной. Предположим, в сводных таблицах нужно получить три итога: по предприятиям, главкам и министер­ ствам. При обработке информации на табуляторе надо четко вы­

делить каждый

признак:

министерство 3 знака, главк 2

зна­

ка, предприятие 3 знака. Общий шифр будет состоять

из 8

зна­

ков.

Каждый

признак

должен

занимать строго

определен­

ные

разряды

и переноситься на

перфокарты в определенные

колонки.

Перед составлением сводки на табуляторе весь массив перфо­ карт группируется на сортировальной машине по старшинству признаков: министерства, главка, предприятия. При пропуске мас­ сива перфокарт через табулятор каждый признак служит для формирования только одного определенного итога: шифр пред­ приятия дает возможность подсчитывать в определенных счетчиках машины итоги по предприятию, шифр главка в других счетчиках — итоги по главку, шифр министерства в третьих счетчиках — по ми­ нистерству. При вводе перфокарт в табулятор все указанные признаки попадают в контрольный аппарат, который сигнализирует машине об изменении какого-либо признака и заставляет печатать в таблицах накопленйые в счетчиках итоги по различным призна­ кам.

Таким образом, при использовании перфорационных машин в шифре надо четко выделять каждый признак, чтобы машина авто-

Ы


матически смогла подсчитать и напечатать все итоги в сводных

таблицах. В этом случае

шифры

получаются

многозначными.

При

выделении

числа

признаков

в

шифре

надо прежде

всего установить,

какие итоги по ним нужно подсчитать в сводных

таблицах.

 

 

 

 

 

При

обработке

на ЭВМ требования к

структуре шифра не­

сколько иные, так как обработка информации на ЭВМ принципи­

ально отлична от обработки на табуляторе. При обработке ста­

тистических отчетов

на ЭВМ каждая строка

документа (запись)

вместе

с шифрами

и количественно-суммовыми данными

после

ввода

в ЭВМ и контроля записывается на

магнитную

ленту.

Записи могут располагаться в рассортированном виде. В этом случае применяется предварительная, до ввода в ЭВМ, группи­ ровка перфокарт на сортировках. Если информация не сгруппиро­ вана, то сортировка выполняется на ЭВМ путем машинных про­ грамм сортировки. Сводные таблицы формируются в оперативной памяти машины. В ячейках памяти машины должны быть поме­ щены шифры и данные по графам.

 

Для формирования каждой строки сводной таблицы в ячейки

с

магнитных лент заносятся данные первичных отчетов только

с

определенными шифрами, их выборка производится автомати­

чески по машинной программе путем перебора и сравнения шиф­

ров. Предположим,

надо сформировать таблицу, в каждой стро­

ке

которой должны

быть итоги по министерствам. Для

получения

в

оперативной памяти такой таблицы машина сначала

выбирает

по программе с магнитных лент данные предприятий,

имеющих

шифр министерства

101, и накапливает их в ячейках для первой

строки сводной таблицы, размещенной в оперативной памяти. За­ кончив выборку с магнитных лент и суммирование данных пред­

приятий с

шифром министерства 101, машина переходит

к фор­

мированию

следующей строки, где будут накапливаться

итоги по

предприятиям с шифром

министерства 102. Так будет продолжать­

ся до тех

пор, пока в

сводной таблице не будут сформированы

итоги по всем министерствам. После этого таблицу можно печа­ тать на алфавитно-цифровом печатающем устройстве ЭВМ.

При обработке статистической информации на ЭВМ нет надоб­ ности строить громоздкие многозначные цифры. Машине можно заранее задать порядок вхождений одних признаков в другие (см. далее информационные таблицы). В этом случае при построении шифра нет надобности четко выделять в нем место каждого при­ знака: министерства, главка, предприятия. Шифры присваивают лишь предприятиям, подразумевая, что определенные серии номе­

ров составляют главк или министерство. Например,

предприятия

с номерами 0001—0320 можно отнести

к Министерству энергетики

и электрификации СССР; предприятия

с номерами

0321—0800 —

к Министерству нефтедобывающей промышленности

СССР и т. д.

Внутри каждого министерства можно также выделить номера предприятий, относящихся к главкам.

82


Взаимосвязь номеров предприятий с номерами главков и ми­ нистерств позволяет машине автоматически формировать сводные итоги по необходимым признакам. Таким образом, при обработке данных на ЭВМ коды строятся малозначные и место каждому

признаку отводить не надо. Все необходимые

степени

итогов

получаются и

печатаются

в машине автоматически на осно­

вании заранее

заданного

порядка вхождений

одних

призна­

ков в другие.

 

 

 

 

Рассмотрим технику построения наиболее часто употребляемых систем кодирования: порядковой, серийной, десятичной и комби­ нированной (смешанной).

При порядковой системе все позиции номенклатуры шифруют­ ся порядковым номером после расположения номенклатуры в ка­ кой-либо последовательности, например по алфавиту. Этот код малозначный, простой по построению. Однако при этой системе свободные номера не предусматриваются и автоматически на та­ буляторе получаются итоги только по одному (младшему) при­ знаку номенклатуры. Поэтому при статистических разработках на перфорационных машинах эта система применяется в основном для кодирования постоянных однопризначных номенклатур, напри­ мер месяца, республики.

При обработке информации на ЭВМ порядковой системой мож­ но кодировать двух-трех;п'ризначные постоянные номенклатуры с указанием машине порядка вхождений значений одних признаков в другие, что дает возможность получать итоги в сводных табли­ цах и по старшим признакам.

Основной недостаток порядковой системы — отсутствие резерв­ ных номеров, поэтому при появлении дополнительных позиций стройность кода нарушается. При использовании порядковой си­ стемы номенклатуры должны быть устойчивыми.

При серийной системе каждой группе старших признаков но­ менклатур присваивается серия номеров. В пределах этой серии каждая позиция младших признаков номенклатуры шифруется порядковым номером. Серийная система предусматривает резерв­

ные номера для старших признаков

номенклатуры. Однако,

так же как и порядковая система,

серийная

система

обес­

печивает автоматически получение на

табуляторе

итогов

только

по

одному младшему признаку номенклатуры. Поэтому при

разработке на

перфорационных

машинах эту

систему удоб­

но

применять

для кодирования

неустойчивых

однопризначных

номенклатур.

 

 

 

При обработке информации на ЭВМ серийной системой можно кодировать двух-трехпризначные неустойчивые номенклатуры, ука­ зывая машине параметры вхождений одних признаков в другие. Серийная система наиболее удобна для обработки информации на ЭВМ, так как при сравнительно небольшой значности шифра дает возможность получить автоматически все итоги в сводных табли­ цах; эта система предусматривает свободные номера; поэтому при

83


расширении номенклатуры стройность кода сохраняется. Однако серийный код труден для запоминания.

При десятичной системе каждому признаку номенклатуры от­ водится один или несколько разрядов. Для построения десятичного кода в номенклатуре надо четко выделить все признаки, т. е. раз­ бить номенклатуру на группы, подгруппы, классы и т. д. Затем

каждому признаку присваивается номер, начиная с

1, 01, 001 и т. д.,

в зависимости от значности признака. В десятичном

коде четко вы­

делен каждый признак, ему отведено определенное место, что при­

дает системе логичность и стройность, несмотря на

многознач­

ность.

Рассмотрим

четырехпризначный

код

товара

(полный

код

товара

семизначный).

 

 

 

 

 

 

 

 

группа

подгруппа

артикул

размер

 

 

0

 

00

000

 

0

 

 

 

1 знак

.2

знака

3

знака

1

знак

 

Десятичную систему наиболее удобно применять для кодиро­

вания

многопризначных

номенклатур

при обработке

информации

на перфорационных машинах, когда нужно

четко выделить

каж­

дый признак номенклатуры и обеспечить на

табуляторе автома­

тическое получение

и печать

сводных

итогов

по этим

признакам.

При использовании ЭВМ десятичный код также может применять­ ся, что дает машине автоматически формировать все итоги без заданного порядка вхождений значений признаков, однако код при этом получается многозначным.

 

Комбинированная

(смешанная) система

предусматривает, так

же

как и десятичная,

четкое

выделение признаков номенклатуры.

Но

каждый признак

может

кодироваться

по любой системе: по­

рядковой, серийной или десятичной. Эта система наиболее гиб­ кая, поэтому она широко применяется при обработке статистиче­ ских отчетов на перфорационных машинах. Преимущество ее перед десятичной системой в том, что она не содержит излишних резерв­ ных номеров, т. е. код можно построить короче. Комбинированная система также обеспечивает получение на табуляторе автомати­ чески всех необходимых итогов.

Рассмотрим примеры построения порядковой, серийной, деся­ тичной и комбинированной систем кодирования для одной и той же номенклатуры (табл. 1). Имеются три группы материалов: чер­ ные, цветные металлы и лесные материалы. Внутри каждой груп­ пы выделены еще два признака: подгруппа и вид.

При построении порядковой системы кодирования учитывается только самый младший признак — вид. Всем позициям присвоены порядковые номера (резервных номеров нет). Эту систему можно будет применить только в том случае, если при составлении сводки на табуляторе надо получить итоги по одному младшему призна-

84


со

ел

 

 

 

 

 

 

Построение систем кодирования

 

 

 

 

Т а б л и ц а I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Признаки

номенклатуры

 

 

 

 

Системы

кодирования

 

комбинированная

 

 

 

 

 

 

 

поряд­

серий­

 

десятичная

 

 

группа

(А)

подгруппа (Б)

 

вид

(В)

 

 

 

Iполный

 

 

полный

 

ковая

ная" (В)

А

Б

 

A

J БВ

 

 

 

 

 

 

 

(В)

 

в

1 шифр

шифр

Черные

метал-

Чугун

 

передельный

01

01

1

1

1

111

1

01

101

лы

 

 

 

литейный

 

02

02

1

I

1

112

1

02

102

 

 

 

 

 

 

 

 

резерв

 

 

 

 

 

резерв

 

 

 

 

 

 

 

 

 

03—06

 

 

 

 

 

03—06

 

 

 

Сталь

 

среднесортная

03

07

1

2

1

121

1

07

107

 

 

 

 

мелкосортная

04

08

1

2

2

122

1

08

108

 

 

 

 

обручная

 

05

09

1

2

3

123

1

09

109

 

 

 

 

 

 

 

 

резерв

 

 

 

 

 

резерв

 

 

 

 

 

 

 

 

 

10-15

 

 

 

 

 

10—15

 

Цветные метал-

Без лома

 

медь

 

06

16

2

1

1

211

2

16

216

лы

 

 

 

алюминий

 

07

17

2

1

2

212

2

17

217

 

 

 

 

никель

 

08

18

2

1

3

213

2

18

218

 

 

 

 

свинец

 

09

19

2

1

4

214

2

19

219

 

 

 

 

цинк

 

10

20

2

1

5

215

2

20

220

 

 

 

 

 

 

 

 

резерв

 

 

 

 

 

резерв

 

 

 

 

 

 

 

 

 

21-23

 

 

 

 

 

21—23

 

 

 

Лом и отходы

меди

 

11

24

2

2

1

221

2

24

224

 

 

 

 

алюминия

 

12

25

2

2

2

222

2

25

225

 

 

 

 

никеля

 

13

26

2

- 2

3

223

2

26

22S

 

 

 

 

свинца

 

14

27

2

2

4

224

2

27

227

 

 

 

 

цинка

 

15

28

2

2

5

225

2

28

228

 

 

 

 

 

 

 

 

резерв

 

 

 

 

 

резерв

 

 

 

 

 

 

 

 

 

29—33

 

 

 

 

 

29—33

 

Лесные

мате­

Деловая

древепиловочник

16

34

3

1

1

311

3

34

334

риалы

 

сина

 

фанера

 

17

35

3

1

2

312

3

35

335

 

 

 

 

 

 

 

 

резерв

 

 

 

 

 

резерв

 

 

 

 

 

 

 

 

 

36—38

 

 

1

 

 

36—38

 

 

 

Пиломатериалы для сельскохозяйст­

18

39

3

2

321

3

39

339

 

 

 

 

венного

машино­

19

40

3

2

2

322

3

40

340

 

 

 

 

строения

 

20

41

3

2

3

323

3

41

341

 

 

 

 

для

вагоностроения

 

 

 

 

из

распиловки

21

42

3

2

4

324

3

42

342