Файл: Брага, В. В. Основы технологии машинной обработки статистической информации [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 151

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ку — виду материалов. Эта система может быть

также

применена

при обработке информации на ЭВМ, когда в

сводных

таблицах

требуется получить итоги по различным признакам: виду, под­

группе,

группе. В этом случае машине

указывают порядок вхожде­

ний значений признаков, например

черные металлы — номера

01—05,

из них чугун 01—02, сталь

03—05 и т. д. Необходимое

условие применения порядковой системы при обработке на перфо­ рационных и электронных машинах-—устойчивость номенклатуры.

При серийной системе кодирования для этой же номенклатуры также учитывается только один признак —вид. Группа и подгруп­ па зашифрованы в неявном виде. Например, чугуну соответствуют

номера 01—05,

стали 06—15, а всей

группе черных металлов —

01 —15. После

каждого вида материала оставлены свободные но­

мера. Серийная

система, так же как и

порядковая, дает возмож­

ность на табуляторе автоматически получить итог только по видам. При обработке информации на перфорационных машинах эту си­ стему удобно применять в том случае, если номенклатура неустой­ чивая и в сводных таблицах необходимо получить итоги только по видам материалов. Применение серийной системы для обработки

информации на ЭВМ дает возможность получить в сводных

таб­

лицах итоги по всем признакам при указании машине порядка

вхо­

ждений значений признаков. Эту систему

кодирования (в

отличие

от порядковой системы)

можно применять

и при неустойчивых но­

менклатурах.

 

 

 

 

При построении десятичной системы четко выделен

каждый

признак номенклатуры:

группа, подгруппа, вид. Для

каждого

признака установлена значность. В нашем примере она везде рав­ на 1. Каждому признаку присвоены номера, начиная с № 1; при чем учтена подчиненность признака. Так, группам присвоены но­ мера 1, 2, 3. Каждая группа имеет более мелкий признак-подгруп­ пу. Каждая подгруппа внутри группы также будет начинаться с 1. Например, внутри группы черных металлов чугун обозначается 1, сталь 2. Внутри подгруппы каждый вид также начинается с 1. Десятичная система позволяет получить на машине итоги и напе­

чатать их по всем признакам номенклатуры, каждый

признак в

ней четко выделен определенной цифрой.

 

При комбинированной системе в примере используется две си­

стемы кодирования: десятичная (для шифровки групп)

и серий­

ная (для шифровки подгрупп и вида). В данном случае комбини­ рованный код четко выделяет два признака: группу и вид. Под­ группа зашифрована не явно. Такое построение кода можно при­ менить, если в сводных таблицах надо получить две степени ито­

гов: по группам и виду. Возможны и другие

варианты построения

комбинированной системы в зависимости

от структуры итогов

в сводных таблицах.

 

Рассмотренные системы построения кодов в основном пресле­ дуют цель правильно сформировать структуру итоговых данных в сводных таблицах. Но в построении этих кодов не заложена воз^

86


можность автоматического контроля достоверности проставлен­ ных шифров, так как в первоначальном виде коды были предназна­ чены для обработки информации на вычислительных перфорацион­ ных машинах. Электронные вычислительные машины, в отличие от ВПМ, имеют возможность автоматически обнаружить ошибки в проставленных шифрах: перестановку цифр или неправильное про­ ставление цифры в шифре. Но, как показали исследования, это наиболее распространенные ошибки, которые допускают экономи­

сты,

проставляя шифры в статистические отчеты. Для обнаруже­

ния

таких ошибок применяется система

защитных

кодов.

В этом случае каждому шифру добавляется один защитный кон­ трольный разряд, значение которого исчисляется по определенной формуле и записывается в документ вместе с основным шифром через тире. Например, в шифре 11253—4 число 11253 основной шифр, 4 — защитный контрольный разряд. В электронной вычисли­ тельной машине шифр проверяется автоматически по специальной программе, которая обнаруживает ошибочные шифры. Исправ­ ляется шифр вручную.

Единые коды системы ЦСУ СССР. Единая программа разра­ ботки статистических задач предопределяет единство группировок, что вызывает необходимость пользоваться едиными кодами во всей системе. Коды и шифры составляются отраслевыми отделами ста­ тистики совместно со специалистами по машинной обработке и сообщаются всем статистическим управлениям и их вычислитель­ ным установкам. Установленные номенклатуры и их шифры могут быть напечатаны в подлежащем статистического отчета, что об­ легчает применение их при подготовке к машинной обработке.

Рассмотрим некоторые единые коды, действующие в системе ЦСУ. Типичным является код форм подчиненности, включающий перечень и шифры министерств, ведомств СССР, союзных респуб­ лик, а также некоторых союзных организаций. Последовательность кодируемых наименований точно соответствует структуре таблиц народнохозяйственного плана, эта структура сохраняется и в от­ четных формах органов ЦСУ СССР. Указанное обстоятельство свойственно и другим системам кодирования и в значительной ме­ ре предопределяет структуру кодов.

Код подчинения построен по комбинированной системе: первые три знака построены по серийной системе и обозначают конкрет­ ное министерство (ведомство), четвертый знак—младший разряд кода, который пишется обычно через черточку, он показывает, яв­ ляется ли данное министерство союзным, союзно-республиканским или речь идет о республиканской части подчинения союзно-респуб­ ликанского министерства.

Если предприятие подчиняется союзному министерству, то шифр его подчиненности будет оканчиваться единицей, например 122—1 Министерство электротехнической промышленности СССР

или 151 — 1—Министерство целлюлозно-бумажной промышлен­ ности СССР,

87


Если предприятие относится к союзной части союзно-республи­ канского министерства, то его шифр подчинения в младшем раз­ ряде будет иметь двойку, а если предприятие относится к респуб­ ликанской части того же министерства, то шифр его будет оканчи­ ваться тройкой. Например, 150—2 —это шифр предприятий союз­ ного подчинения союзно-республиканского Министерства лесной и деревообрабатывающей промышленности СССР, 150—3 — шифр предприятий республиканского подчинения того же министерства.

Шифр подчиненности министерств и ведомств республиканского подчинения будет иметь четвертым знаком цифру 4. Первые три знака рассматриваемого кода имеют серийную структуру.

Министерства и ведомства союзного и союзно-республикан­ ского подчинения занимают серию 100—500, а для республикан­

ских министерств

и ведомств отведена серия от 700 и более. Для

промышленных министерств отведена серия 100.

 

Поскольку структура форм подчиненности изменяется, то в пре­

делах каждого

десятка и каждой сотни есть запасные номера, а не­

которые сотни

(200, 300) вообще не используются. Такая

структура

кодов

является

весьма гибкой и в значительной мере инвариант­

ной к

изменениям

схемы управления, что обеспечивает

стабиль­

ность системы шифров в течение длительного времени. Кроме того, комбинированная структура шифров позволяет получать автомати­ чески необходимые промежуточные и окончательные итоги. Осо­ бенно удобным для автоматического получения итогов по союз­ ному и республиканскому подчинению является четвертый знак,

обеспечивающий

получение

итогов по формам

подчинения.

Действующие

в системе

ЦСУ шифры

министерств

и

ведомств

с 1968 г. являются

едиными для трех

организаций — Госплана

СССР, Госснаба СССР и ЦСУ СССР.

 

 

 

 

Код предприятий построен по десятичной системе и состоит из

восьми знаков: первые три знака — шифры министерств,

следую­

щие два — шифр

главного

управления (объединения,

треста), три

младших знака — шифр предприятия в пределах главного

управле­

ния.

 

 

 

 

 

 

 

Коды территории должны обеспечить получение итогов по рес­

публикам, краям, областям, городам и экономическим

районам.

Структура этого

кода

осложнена тем, что союзная республика мо­

жет включать

несколько

экономических

районов

(например,

РСФСР); в то же время экономический район

может включать не­

сколько союзных республик (Закавказский экономический район). Поэтому, несмотря на наличие четырех знаков, получить строй­ ную систему здесь не удалось.

Структура кодов десятичная: первый знак характеризует рес­ публику только по РСФСР и Украинской ССР, а по остальной территории Советского Союза — экономический район; второй знак обозначает экономический район только по РСФСР и Укра­ инской ССР, а по остальной территории — республику; третий и четвертый знаки — порядковые номера областей; при помощи их

88


разрабатываются итоги по областям (краям, городам). Такая си­ стема кодов не позволяет получить автоматически все итоги, но это касается только 1-го уровня системы, так как на других уров­ нях информация по нескольким республикам вместе не обрабаты­ вается.

Определенный интерес представляют коды сельскохозяйствен­ ных культур, составленные для разработки нескольких статисти­ ческих форм, в которых учитывается широкий круг сельскохозяй­ ственной продукции. Код сельскохозяйственной продукции также прост: первый и второй знаки означают вид культуры, третий, чет­ вертый и пятый — сорт. Все сорта данной культуры располагаются в алфавитном порядке и каждой букве алфавита отводится серия номеров с резервными Помарами на случай появления новых сор­ тов. Сложность кодирования сельскохозяйственных культур заклю­ чается в том, что сообщение о появлении новых сортов поступает только после окончания отчетного периода, в результате чего в первый год им невозможно присвоить постоянный шифр. При ме­ ханизированной разработке машиносчетные установки вынуждены сами вновь появившемуся сорту присваивать временный шифр, который только после окончания разработки узаконивается цен­ трализованно.

Большое значение в статистике имеют коды отраслей народнего хозяйства и промышленности, так как разработка по отрас­ лям производится в статистике промышленности, капитального строительства, труда, новой техники и т. д.

При построении кода отраслей промышленности и народного хозяйства применена комбинированная система. Каждый шифр со­ стоит из пяти знаков: первый знак шифра показывает отрасли сферы материального производства (1—8); прочие отрасли в пер­ вом знаке имеют цифру 9, причем 91—98 — отрасли народного хо­ зяйства непроизводственной сферы; третий и четвертый знаки обо­

значают отрасль промышленности, или

группу конкретной отрасли

народного хозяйства; младшие знаки

шифра — порядковые но­

мера в пределах широкой отрасли или подотрасли, в некоторых подотраслях четвертый знак определяет группу подотрасли. Очень важно, чтобы в различных таблицах отрасли были расположены в одинаковой последовательности и имели одинаковые шифры; это дает возможность сопоставить данные разных таблиц и облегчает механизированную обработку.

Большое значение при машинной разработке статистических данных имеет правильное построение шифра строки. Почти во всех статистических отчетах, имеющих постоянный состав подлежащего, рядом с наименованием строки проставлен ее шифр. В шифре строки выделен один знак, учитывающий взаимосвязь показателей графы отчета. Например, сумма данных с 1 в последнем знаке шифра будет равна итоговым данным с 0 в последнем знаке шиф­ ра; сумма данных с шифром 2 означает позиции «в том числе», ко­ торые в сумме составляют данные строки с шифром 1;

89