Файл: Баясанов, Д. Б. Автоматизированные системы управления трубопроводными объектами коммунального хозяйства.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 124
Скачиваний: 0
шается иметь несколько сопредшественников. При фасет
ной — многоаспектной классификации дескриптор |
внутри |
каждого фасета (разряда) имеет сильную иерархию, |
меж |
ду фасетами — слабую.
Существуют также способы фиксирования связей между
дескрипторами при помощи алфавитного указателя-тезу-
руса, специальных таблиц дескрипторов, составленных в оп
ределенном линейном порядке, методами взаимного фикси рования и т. п. Более общим методом установления отно
шений между дескрипторами является способ взаимного
фиксирования. Метод записи дескрипторов в линейной по
следовательности имеет тот недостаток, что он позволяет
устанавливать в системе только бинарные связи, т. е. связи между определенными и примыкающими к ним дескрипто рами, а отношения более высоких порядков здесь учтены
быть не могут.
Важным вопросом при создании автоматизированных информационно-поисковых систем является выбор носителей информации, который обусловливал бы наиболее эффектив
ное функционирование системы. Выбор каждого носителя
определяется задачами и типом информационно-поисковой
системы, объемом материалов, подлежащих хранению, и т. п. При организации поисковой картотеки должны быть учтены
следующие характеристики системы: тип носителя инфор
мации и используемое оборудование; форма организации картотеки; способ доступа к картотеке, расположение вводов на карточках, порядок расстановки карточек в кар тотеке, тип вывода информации из системы; взаимораспо
ложение поискового образа и оригинала документа. В ка
честве носителей информации могут быть использованы: перфокарты с внешней и внутренней перфорацией (с краевой перфорацией), перфокарты цедевые, суперпозиционные, апертурные, кляссерные, перфорированные и магнитные ленты и другие.
Карты с краевой перфорацией изготовляют из прочной,
плотной, гладкой бумаги с одним или несколькими рядами
отверстий по краям. Для осуществления обмена информа цией при стандартных системах кодирования выпускаемые нашей промышленностью карты стандартизированы. Кодо вое поле карты типа К-5, к примеру, дает возможность
закодировать до 200 различных поисковых признаков. При
большем числе поисковых признаков осуществляется мно
гоаспектный поиск по совокупности поисковых призна ков. Большое свободное от перфорации внутреннее поле
111
карты может быть использовано для хранения визуальной
информации — текстов, чертежей и т. п.
Условия ручного использования карт, сравнительно
небольшое количество поисковых признаков, которые можно
на них закодировать, и чисто технические трудности поиска при сложных системах кодирования информации ограни
чивают сферу применения этих карт.
В связи с использованием счетно-перфорационных ма
шин для поиска и обработки информации применяют и ма
шинные перфокарты, которые по форме фиксируемой ин
формации можно разделить на карты:
1) кодированные без какой-либо визуальной инфор мации на естественном языке;
2)содержащие кодированные и визуальные части;
3)апертурные, содержащие, помимо закодированных данных, вмонтированные в них микрофильмы.
Использование для поиска информации карт второго и третьего типов может быть ограничено по чисто техни ческим причинам, и главным образом из-за срока их служ бы. При частом прогоне через аппаратуру перфокарты быст
ро выходят из строя. Замена кодированной части перфокарт
несложна, а восстановление текстовых или апертурных
перфокарт — операция более сложная и дорогая.
Суперпозиционные карты применяют при инверсном
способе организации поисковых информационных масси
вов, когда носитель информации (карта) соответствует по
исковому признаку и на нем фиксируются все адреса (но мера) документов, в которых и содержится поисковый
признак. Для организации инверсного массива нужно сфор
мировать общий для всей поисковой системы перечень поисковых признаков и для каждого признака выделить
носитель информации. При этом каждому поступающему
в поисковую систему документу присваивается адрес, по которому его можно найти в хранилище, причем этот адрес
не зависит от содержания документа. Затем документ ана
лизируют с целью определения его поискового образа. Для этого в документе отыскивают независимо друг от
друга все содержащиеся в нем поисковые признаки, входя
щие в ранее составленный перечень поисковых признаков
системы. Адрес документа записывают на карты с соответ
ствующими поисковыми признаками. Для поиска запрос анализируют так же, как и сам документ. В поисковых си
стемах можно использовать в качестве суперпозиционных — машинные перфокарты. На 80-колонной перфокарте можно
112
закодировать до 960 номеров документов. Суперпозицион-
ные перфокарты являются эффективным средством много
аспектного поиска документов. Создание поисковых массивов
на них требует тщательной подготовки списков поисковых
признаков документов в процессе формирования массива. Поиск при этом осуществляется быстро, с малой затратой труда. Система для своей реализации не требует дорогих и сложных технических средств. Одной из очень важных положительных сторон суперпозиционных карт является то, что, в противоположность картам с краевой перфора
цией и отчасти машинным картам, при их использовании
практически не ограничены ни общее число поисковых при
знаков системы, ни число поисковых признаков каждого
вводимого в систему документа. Действительно, увеличение
общего числа поисковых признаков в системе будет означать
просто увеличение числа карт в картотеке, а увеличение
числа поисковых признаков документа приведет только
к необходимости отперфорировать адрес этого документа
на большем числе карт.
В качестве носителей информации используют и микро
фильмы. Микрофильмирование является наиболее эффектив
ным средством сжатия объемов документальных хранений.
В микрофильмированных массивах возможен быстрый поиск
ивыдача копий документов. Возможны два варианта тех нического осуществления документального поискового мас
сива на микрофильмах: рулонный, карточный, когда доку менты копируются на короткие отрезки пленки или карты.
Карточное хранение имеет ряд преимуществ по сравнению
с рулонным. В этом случае можно легко упорядочить хране ние уже после подготовки микрокопий микрофильмов. Съемки при этом можно вести в любом порядке. Можно легко изъять, пополнить в любом месте, заменить документы в массиве, а в случае необходимости — реорганизовать, пе ресортировать информационный массив. Недостатком дис
кретного хранения является то, что не удается полностью
использовать площадь носителя информации-микрофильма,
так как размер микрокарты стандартный, а размеры доку ментов меняются в широких пределах, что ведет к лишнему
расходу кинопленки.
Процесс перевода содержания документов или запросов
на язык информационно-поисковой системы складывается из анализа их содержания и самого перевода результатов
анализа на машинный язык — операция кодирования. Вы
деление из документа или запроса их содержания на естест-
113
венном языке, предназначенных для последующего поиска, осуществляется: реферированием — концентрированным
изложением на обычном языке основных элементов содер
жания документов; индексированием — выделением из до
кументов отдельных слов или понятий, представляющих
существенное содержание материалов; классифицирова
нием — отнесением документов к элементам классифика
ционной структуры.
Операция кодирования — перевода результатов анализа
документов на язык информационно-поисковой системы —
должна удовлетворять требованиям однозначности, крат кости, аддитивности, программируемости результатов. Ос
новными положительными признаками, определяющими
выбор способа кодирования, являются степень соответст
вия целям информационно-поисковой системы и пригод ность для экономной и эффективной работы как в процессе
самого кодирования, так и при поиске. Различают кодиро
вание: прямое, когда кодируемому поисковому признаку
соответствует элемент носителя информации; комбиниро
ванное, когда кодируемому поисковому признаку соот
ветствует комбинация элементов носителей информации; в фиксированной зоне, когда поисковому признаку отво дится на носителе информации зона, включающая строго
определенное количество элементов, что характерно для перфокарт; с наложением, когда в одной зоне кодируется несколько признаков.
В качестве символов кодирования используют цифры,
буквы, специальные символы и т. п. При выборе метода
кодирования, а следовательно, и вида оборудования сле дует учитывать природу информационных запросов и ха
рактер информационных материалов.
Любой код обычно состоит из определенного количества символов и установленных правил отношений между этими символами. В теории информации принято считать, что код является оптимальным, если он занимает 50% площади но сителя, отведенной под кодирование. Работа с кодирован ным материалом будет минимальной, если коды употреб ляются одинаково часто и равны по длине или употреб
ляются с различной частотой, но при этом длина кодового
сообщения обратно пропорциональна частоте его употреб
ления.
В зависимости от конфигурации и места расположения кодовых символов коды подразделяются на локальные, пря
мые, нелокальные и суперпозиционные. При локальном
114
коде кодовое обозначение характеристик различается рас положением полей для записи характеристики и конфигу
рации кодовых символов. Локальный код применяют в слу
чае кодирования взаимоисключающих характеристик, об
разующих отдельную группу. При этом для каждой группы
отводится свое поле перфокарты, где любая характеристика группы может быть записана в виде определенной конфигу
рации символов. Взаимоисключаемость означает, что каж дый элемент информации имеет не более одной характе
ристики из любой группы взаимоисключающих характе
ристик.
Прямой код представляет собой одну из разновидностей локального. Здесь кодовые обозначения характеристик раз личаются только расположением отводимых для них полей, в каждом из которых возможны только две конфигурации символов, отмечающих наличие или отсутствие характе ристики. Прямой код бывает выгоден, когда элементы ин
формации содержат большое число характеристик. При
этом коде каждому понятию соответствует вполне опреде
ленное отверстие на перфокарте. Иногда для каждого де
сятичного разряда порядкового номера понятия на карте
отводят 10 отверстий. Тогда для записи любого номера от
0 до 99 понадобятся только 20 отверстий. Второй способ
более трудно реализуем. Кроме этих способов составления
прямых кодов применяют код 0— 1—2—4—7 и пирамидаль
ный.
С помощью кода 0— 1—2—4— 7 можно записать проре зями любое число от 0 до 9 включительно, т. е. код позво ляет записывать в отдельности десятичный разряд номера понятия поискового образа. Для записи любой цифры от
0 до 9 надо отвести только 5 отверстий, а не 10, как в пре
дыдущем случае. В коде 0— 1—2—4—7 каждое число изо
бражается двумя прорезями на перфокарте. Этот код пред
ставляет собой частный случай пирамидального кода, с по мощью которого можно записать любые буквы и числа (рис. 22). При использовании этого кода на перфокартах печатается пирамида.
Для нелокального кода обозначения характеристик раз
личаются конфигурациями кодовых символов, помещенных
в отдельных для каждой характеристики произвольно рас
положенных полях. Нелокальный код наиболее гибкий
и компактный. При его использовании на перфокарте записываются только те характеристики, которые содер
жатся в данном элементе информации.
115