Файл: Курс лекций по дисциплине проектирование информационных систем Для студентов iv курса специальности 080801 Прикладная информатика (по областям).doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 02.02.2024
Просмотров: 229
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Рассматриваемые вопросы:
-
Основные понятия классификации экономической информации.
-
Понятия и основные системы кодирования экономической информации. -
Состав и содержание операций проектирования классификаторов.
1. Основные понятия классификации экономической информации
Информация – это совокупность некоторых сведений.
Экономическая информация имеет следующие особенности:
-
большие объемы ежегодно создаваемой, обрабатываемой и хранимой информации (до нескольких сотен млн. символов в год для среднего предприятия); -
большая часть информации имеет символьное представление, слабо приспособленное для логической и арифметической обработки; -
высокий уровень стоимостных и трудовых затрат на поиск и ее обработку.
Для того чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде. Для этого ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора.
Классификатор - это документ, с помощью которого осуществляется описание экономической информации в ЭИС, содержащий наименования объектов, наименования классификационных группировок и их кодовые обозначения.
Экономическая информация существует в двух формах: в форме экономических показателей и документов.
Экономический показатель является составной единицей информации, содержащей количественную характеристику некоторого процесса – реквизит-основание и однозначно определяющие его качество реквизиты-признаки.
Реквизиты-основания подразделяются по типу алгоритмов их получения на количественные, стоимостные, проценты, удельные веса и др.
Реквизиты-признаки делятся на два подмножества:
-
справочные – наименования предназначены для понимания показателя пользователем-экономистом; -
группировочные – это закодированные аналоги справочных признаков, предназначенные для логической обработки информации на ЭВМ.
Основными объектами классификации и кодирования являются справочные реквизиты-признаки:
-
наименования элементов – наименования материальных, трудовых, денежных, энергетических ресурсов, основных средств, готовой продукции и услуг; -
наименования процессов – наименования функций управления, операций поступления сырья и материалов, отпуска их в производство, производства и выпуска готовой продукции или оказания услуг, расчетов с поставщиками и покупателями и т.д.; -
наименования показателей и документов; -
наименования компонентов проекта ЭИС – наименования файлов, задач, подсистем, программных модулей и др.
Целью разработки классификаторов является установление соответствия между значениями справочных признаков какого-либо элемента или процесса и значениями группировочных признаков (между значением реквизита ФИО рабочего и значением Табельный номер рабочего или между значениями Наименование материала и Код материала)
Для кодирования объектов необходимо их упорядочить по некоторым признакам.
Классификация – результат упорядоченного распределения объектов заданного множества.
Система классификации – совокупность правил распределения объектов множества на подмножества.
Признак классификации – это свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами классификации.
Классификационная группировка – множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам.
Основанием классификации называется признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации.
Ступень классификации - это результат очередного распределения объектов одной классификационной группировки.
Уровень классификации - это совокупность классификационных группировок, расположенных на одних и тех же ступенях классификации.
Глубина системы классификации - это количество уровней классификации, допустимое в данной системе.
Каждая система классификации характеризуется следующими свойствами:
-
гибкостью системы; -
емкостью системы; -
степенью заполненности системы (коэффициент заполненности).
Гибкость системы - это способность допускать включение новых признаков, объектов без разрушения структуры классификатора. Гибкость определяется временем жизни системы.
Емкость системы (P)- это наибольшее количество классификационных группировок, допускаемое в данной системе классификации.
Степень заполненности системы (Kзап) определяется как частное от деления фактического количества группировок (Qф) на величину емкости системы (Р): Kзап=Qф/P
В настоящее время чаще всего применяются два типа систем классификации:
иерархическая и фасетная.
Иерархическая система классификации строится следующим образом:
-
исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; -
каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; -
каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.
Иерархическая система классификации
В иерархической системе классификации из-за жесткой структуры особое внимание следует уделять выбору классификационных признаков.
При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:
-
получающиеся на каждом уровне классификационные группировки должны составлять исходное множество объектов; -
классификационные группировки на каждой ступени не должны пересекаться; -
классификация на каждой ступени должна проводиться только по одному признаку.
Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
Достоинства иерархической системы классификации:
-
простота построения; -
использование независимых классификационных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации:
-
жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; -
невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Фасетная система классификации.
Аспект - точка зрения на объект классификации, который характеризуется одним или несколькими признаками.
Фасет - это совокупность однородных значений данного аспекта, которые используются для образования независимых классификационных группировок.
Значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.
Фасетная система классификации строится следующим образом:
-
множество классифицируемых объектов рассматривается в нескольких аспектах, каждый из которых может характеризоваться одним или несколькими признаками, образующими фасет; -
устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач); -
определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам.
Внутри фасета значения признаков могут просто перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.
Фасетную систему классификации удобно строить в виде таблицы. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,..., Фi,..., Фn. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования фасетов. При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.
Фасетная система классификации
Достоинства фасетной системы классификации:
-
возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; -
возможность выбора признаков классификации независимо друг от друга. -
возможность простой модификации всей системы классификации без изменения структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Пример. Множество студентов института ИИТ.
Фасет форма обучение содержит значения: очная, вечерняя, заочная.
Фасет курс содержит значения: 1 курс, 2 курс, 3 курс ….
Фасет специальность содержит значения: ПИЭ, ПИМ.
Структурную формулу любого класса можно представить в виде:
Ks=(Форма обучения, курс, специальность)
Присваивая конкретные значения каждому фасету, получим следующие классы:
К1=(Очная форма обучения, 1 курс, ПИЭ);
K2=(Очная форма обучения, 2 курс, ПИМ);
К3=(Вечерняя форма обучения, 3 курс, ПИЭ) и т.д.
Форма обучения | Курс | Специальность |
Очная | 1 курс | ПИЭ |
Заочная | 2 курс | ПИМ |
Вечерняя | 3 курс | |
| 4 курс | |
| 5 курс | |
| 6 курс | |
2. Понятия и основные системы кодирования экономической информации
Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование.
Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.
Кодирование – это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования.
Система кодирования – это совокупность правил обозначения объектов и группировок с использованием кодов.
Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.
Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.
Код характеризуется следующими параметрами:
-
длиной (L); -
основанием кодирования (A); -
структурой кода, под которой понимают распределение знаков по признакам и объектам классификации; -
степенью информативности (I) , рассчитываемой как частное от деления общего количества признаков (R) на длину кода (L): I=R/L; -
коэффициентом избыточности (Kизб), который определяется как отношение максимального количества объектов (Qmax) к фактическому количеству объектов (Qфакт): Kизб=Qmax/Qфакт.
Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:
классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
регистрационную систему кодирования, не требующую предварительной к лассификации объектов.
Регистрационные системы кодирования используются для однозначной идентификации объектов и не требуют предварительной классификации объектов. Различают порядковую и серийную систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.