Файл: Брага, В. В. Основы технологии машинной обработки статистической информации [учеб. пособие].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 151
Скачиваний: 0
ку — виду материалов. Эта система может быть |
также |
применена |
при обработке информации на ЭВМ, когда в |
сводных |
таблицах |
требуется получить итоги по различным признакам: виду, под
группе, |
группе. В этом случае машине |
указывают порядок вхожде |
ний значений признаков, например |
черные металлы — номера |
|
01—05, |
из них чугун —01—02, сталь |
03—05 и т. д. Необходимое |
условие применения порядковой системы при обработке на перфо рационных и электронных машинах-—устойчивость номенклатуры.
При серийной системе кодирования для этой же номенклатуры также учитывается только один признак —вид. Группа и подгруп па зашифрованы в неявном виде. Например, чугуну соответствуют
номера 01—05, |
стали — 06—15, а всей |
группе черных металлов — |
01 —15. После |
каждого вида материала оставлены свободные но |
|
мера. Серийная |
система, так же как и |
порядковая, дает возмож |
ность на табуляторе автоматически получить итог только по видам. При обработке информации на перфорационных машинах эту си стему удобно применять в том случае, если номенклатура неустой чивая и в сводных таблицах необходимо получить итоги только по видам материалов. Применение серийной системы для обработки
информации на ЭВМ дает возможность получить в сводных |
таб |
|||
лицах итоги по всем признакам при указании машине порядка |
вхо |
|||
ждений значений признаков. Эту систему |
кодирования (в |
отличие |
||
от порядковой системы) |
можно применять |
и при неустойчивых но |
||
менклатурах. |
|
|
|
|
При построении десятичной системы четко выделен |
каждый |
|||
признак номенклатуры: |
группа, подгруппа, вид. Для |
каждого |
признака установлена значность. В нашем примере она везде рав на 1. Каждому признаку присвоены номера, начиная с № 1; при чем учтена подчиненность признака. Так, группам присвоены но мера 1, 2, 3. Каждая группа имеет более мелкий признак-подгруп пу. Каждая подгруппа внутри группы также будет начинаться с 1. Например, внутри группы черных металлов чугун обозначается 1, сталь — 2. Внутри подгруппы каждый вид также начинается с 1. Десятичная система позволяет получить на машине итоги и напе
чатать их по всем признакам номенклатуры, каждый |
признак в |
ней четко выделен определенной цифрой. |
|
При комбинированной системе в примере используется две си |
|
стемы кодирования: десятичная (для шифровки групп) |
и серий |
ная (для шифровки подгрупп и вида). В данном случае комбини рованный код четко выделяет два признака: группу и вид. Под группа зашифрована не явно. Такое построение кода можно при менить, если в сводных таблицах надо получить две степени ито
гов: по группам и виду. Возможны и другие |
варианты построения |
комбинированной системы в зависимости |
от структуры итогов |
в сводных таблицах. |
|
Рассмотренные системы построения кодов в основном пресле дуют цель правильно сформировать структуру итоговых данных в сводных таблицах. Но в построении этих кодов не заложена воз^
86
можность автоматического контроля достоверности проставлен ных шифров, так как в первоначальном виде коды были предназна чены для обработки информации на вычислительных перфорацион ных машинах. Электронные вычислительные машины, в отличие от ВПМ, имеют возможность автоматически обнаружить ошибки в проставленных шифрах: перестановку цифр или неправильное про ставление цифры в шифре. Но, как показали исследования, это наиболее распространенные ошибки, которые допускают экономи
сты, |
проставляя шифры в статистические отчеты. Для обнаруже |
||
ния |
таких ошибок применяется система |
защитных |
кодов. |
В этом случае каждому шифру добавляется один защитный кон трольный разряд, значение которого исчисляется по определенной формуле и записывается в документ вместе с основным шифром через тире. Например, в шифре 11253—4 число 11253 — основной шифр, 4 — защитный контрольный разряд. В электронной вычисли тельной машине шифр проверяется автоматически по специальной программе, которая обнаруживает ошибочные шифры. Исправ ляется шифр вручную.
Единые коды системы ЦСУ СССР. Единая программа разра ботки статистических задач предопределяет единство группировок, что вызывает необходимость пользоваться едиными кодами во всей системе. Коды и шифры составляются отраслевыми отделами ста тистики совместно со специалистами по машинной обработке и сообщаются всем статистическим управлениям и их вычислитель ным установкам. Установленные номенклатуры и их шифры могут быть напечатаны в подлежащем статистического отчета, что об легчает применение их при подготовке к машинной обработке.
Рассмотрим некоторые единые коды, действующие в системе ЦСУ. Типичным является код форм подчиненности, включающий перечень и шифры министерств, ведомств СССР, союзных респуб лик, а также некоторых союзных организаций. Последовательность кодируемых наименований точно соответствует структуре таблиц народнохозяйственного плана, эта структура сохраняется и в от четных формах органов ЦСУ СССР. Указанное обстоятельство свойственно и другим системам кодирования и в значительной ме ре предопределяет структуру кодов.
Код подчинения построен по комбинированной системе: первые три знака построены по серийной системе и обозначают конкрет ное министерство (ведомство), четвертый знак—младший разряд кода, который пишется обычно через черточку, он показывает, яв ляется ли данное министерство союзным, союзно-республиканским или речь идет о республиканской части подчинения союзно-респуб ликанского министерства.
Если предприятие подчиняется союзному министерству, то шифр его подчиненности будет оканчиваться единицей, например 122—1 —Министерство электротехнической промышленности СССР
или 151 — 1—Министерство целлюлозно-бумажной промышлен ности СССР,
87
Если предприятие относится к союзной части союзно-республи канского министерства, то его шифр подчинения в младшем раз ряде будет иметь двойку, а если предприятие относится к респуб ликанской части того же министерства, то шифр его будет оканчи ваться тройкой. Например, 150—2 —это шифр предприятий союз ного подчинения союзно-республиканского Министерства лесной и деревообрабатывающей промышленности СССР, 150—3 — шифр предприятий республиканского подчинения того же министерства.
Шифр подчиненности министерств и ведомств республиканского подчинения будет иметь четвертым знаком цифру 4. Первые три знака рассматриваемого кода имеют серийную структуру.
Министерства и ведомства союзного и союзно-республикан ского подчинения занимают серию 100—500, а для республикан
ских министерств |
и ведомств отведена серия от 700 и более. Для |
|||
промышленных министерств отведена серия 100. |
|
|||
Поскольку структура форм подчиненности изменяется, то в пре |
||||
делах каждого |
десятка и каждой сотни есть запасные номера, а не |
|||
которые сотни |
(200, 300) вообще не используются. Такая |
структура |
||
кодов |
является |
весьма гибкой и в значительной мере инвариант |
||
ной к |
изменениям |
схемы управления, что обеспечивает |
стабиль |
ность системы шифров в течение длительного времени. Кроме того, комбинированная структура шифров позволяет получать автомати чески необходимые промежуточные и окончательные итоги. Осо бенно удобным для автоматического получения итогов по союз ному и республиканскому подчинению является четвертый знак,
обеспечивающий |
получение |
итогов по формам |
подчинения. |
||||
Действующие |
в системе |
ЦСУ шифры |
министерств |
и |
ведомств |
||
с 1968 г. являются |
едиными для трех |
организаций — Госплана |
|||||
СССР, Госснаба СССР и ЦСУ СССР. |
|
|
|
|
|||
Код предприятий построен по десятичной системе и состоит из |
|||||||
восьми знаков: первые три знака — шифры министерств, |
следую |
||||||
щие два — шифр |
главного |
управления (объединения, |
треста), три |
||||
младших знака — шифр предприятия в пределах главного |
управле |
||||||
ния. |
|
|
|
|
|
|
|
Коды территории должны обеспечить получение итогов по рес |
|||||||
публикам, краям, областям, городам и экономическим |
районам. |
||||||
Структура этого |
кода |
осложнена тем, что союзная республика мо |
|||||
жет включать |
несколько |
экономических |
районов |
(например, |
|||
РСФСР); в то же время экономический район |
может включать не |
сколько союзных республик (Закавказский экономический район). Поэтому, несмотря на наличие четырех знаков, получить строй ную систему здесь не удалось.
Структура кодов десятичная: первый знак характеризует рес публику только по РСФСР и Украинской ССР, а по остальной территории Советского Союза — экономический район; второй знак обозначает экономический район только по РСФСР и Укра инской ССР, а по остальной территории — республику; третий и четвертый знаки — порядковые номера областей; при помощи их
88
разрабатываются итоги по областям (краям, городам). Такая си стема кодов не позволяет получить автоматически все итоги, но это касается только 1-го уровня системы, так как на других уров нях информация по нескольким республикам вместе не обрабаты вается.
Определенный интерес представляют коды сельскохозяйствен ных культур, составленные для разработки нескольких статисти ческих форм, в которых учитывается широкий круг сельскохозяй ственной продукции. Код сельскохозяйственной продукции также прост: первый и второй знаки означают вид культуры, третий, чет вертый и пятый — сорт. Все сорта данной культуры располагаются в алфавитном порядке и каждой букве алфавита отводится серия номеров с резервными Помарами на случай появления новых сор тов. Сложность кодирования сельскохозяйственных культур заклю чается в том, что сообщение о появлении новых сортов поступает только после окончания отчетного периода, в результате чего в первый год им невозможно присвоить постоянный шифр. При ме ханизированной разработке машиносчетные установки вынуждены сами вновь появившемуся сорту присваивать временный шифр, который только после окончания разработки узаконивается цен трализованно.
Большое значение в статистике имеют коды отраслей народнего хозяйства и промышленности, так как разработка по отрас лям производится в статистике промышленности, капитального строительства, труда, новой техники и т. д.
При построении кода отраслей промышленности и народного хозяйства применена комбинированная система. Каждый шифр со стоит из пяти знаков: первый знак шифра показывает отрасли сферы материального производства (1—8); прочие отрасли в пер вом знаке имеют цифру 9, причем 91—98 — отрасли народного хо зяйства непроизводственной сферы; третий и четвертый знаки обо
значают отрасль промышленности, или |
группу конкретной отрасли |
народного хозяйства; младшие знаки |
шифра — порядковые но |
мера в пределах широкой отрасли или подотрасли, в некоторых подотраслях четвертый знак определяет группу подотрасли. Очень важно, чтобы в различных таблицах отрасли были расположены в одинаковой последовательности и имели одинаковые шифры; это дает возможность сопоставить данные разных таблиц и облегчает механизированную обработку.
Большое значение при машинной разработке статистических данных имеет правильное построение шифра строки. Почти во всех статистических отчетах, имеющих постоянный состав подлежащего, рядом с наименованием строки проставлен ее шифр. В шифре строки выделен один знак, учитывающий взаимосвязь показателей графы отчета. Например, сумма данных с 1 в последнем знаке шифра будет равна итоговым данным с 0 в последнем знаке шиф ра; сумма данных с шифром 2 означает позиции «в том числе», ко торые в сумме составляют данные строки с шифром 1;
89