Файл: Развитие технологий обработки данных.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.03.2024

Просмотров: 107

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Инфологическая модель включает в себя всю информацию о предметной области. Этой информации для проектирования базы данных необходимо и достаточно. Этот факт надо учитывать при переходе от инфологической модели к даталогической. Это не означает, что в даталогической модели должны быть отражены все сущности, имеющиеся в инфологической модели. Решение о том, какая информация будет храниться в базе данных, является первоочередным для построения даталогической модели. К примеру, вычислительные показатели должны быть отражены в инфологической модели, но совсем не обязательно они должны хранится в базе данных.

Есть различные подходы к определению достаточного состава показателей, хранящихся в базе данных. Один из подходов говорит, что в базе данных должны храниться только исходные показатели, а все производные от исходных показателей должны быть получены расчетным путем в момент реализации запроса. Такой подход называется принципом синтезирования, который подразумевает возможность «синтезировать» требуемые показатели из хранимых в информационной базе данных.

Рассмотрим достоинства данного подхода:

      принятие решения «что хранить» является простым и однозначным;

      неявное дублирование информации отсутствует, следовательно, затрачивается меньшие объемы памяти, чем при хранении как исходных, так и производных показателей, и значительно упрощаются проблемы, связанные с контролем целостности данных;

      возможность получить не только те показатели, которые хранятся в базе данных, но и любой расчетный показатель.

Ключевым полем файла является идентификатор объекта, отражающего объект в файле базы данных. В некоторых случаях есть необходимость введения искусственных идентификаторов, которые называются кодами. Рассмотрим такие случаи:

1. Появление в предметной области синонимии, когда идентификатор не обладает уникальностью. Среди сотрудников организации могут быть однофамильцы. В этом случае однозначная идентификация обеспечивается использованием искусственных кодов.

2. Повторение идентификатора объекта вызвано многосвязным участием объекта и в этом случае создается несколько файлов. Чтобы не использовать во всех этих файлах длинного естественного идентификатора объекта вводится более короткий код. Кроме экономии памяти это позволит уменьшить трудоемкость ввода информации.


3. Изменение со временем естественного идентификатора приводит к различным проблемам. Исправить это можно использованием дополнительного «статического» искусственного идентификатора к уже используемому «динамическому».

Когда идентификаторы присваиваются каким-либо объектам, то хорошо бы, чтобы они были постоянными.

Выполнение шагов проектирования даталогической модели производится итеративно. Итерации внутри стадии даталогического проектирования не ограничиваются, а происходят с «захватом» других смежных стадий проектирования базы данных.

Напомним, предметной областью будем называть конкретные явления реального мира, представляющие интерес для проводимого нами исследования.

Проектирование или непосредственное моделирование базы данных представляет собой сложный многоэтапный процесс. Рассмотрим эти основные этапы. Они приведены на рисунке 5.2.

Дадим краткое описание приведенных на рисунке блоков.

Особое внимание при рассмотрении блоков 1 и 2 следует обратить на понятие абстрагирования. Это связано с тем, что процесс проектирования базы данных ведется не под конкретный документ или действия пользователя с этим документов, а под абстрактный или обобщенный образ документа и такие же под абстрактные или обобщенные действия пользователей.

Например рассматривается документ с абстрактными числами n и m, а не с конкретными числами строк и столбцов, или рассматривается поиск по любому полю, вместо требуемого для пользователя поиска по определенному полю. Важность состоит в том, что часто меняется форма документов и действия пользователя при работе с ними.

Процесс проектирования может осложниться дополнительными временными или стоимостными затратами, если каждый раз при изменении вышеприведенных форм придется заниматься перепроектированием.

В блоке 4 производится выбор системы управления базой данных. От этого выбора зависит в значительной степени работоспособность созданной базы данных. На выбор системы управления базой данных влияет количество форм используемых пользователем документов, сложность связей, объем информации обрабатываемой в базе данных, количество работающих с базой данных пользователей и многое другое.

Системой управления базой данных производится отображение логической модели в структуру хранения, то есть представление информации в памяти компьютера.



Для повышения эффективности функционирования многими системами управления базами данных осуществляется представление выбора параметров, которые могут затем оказывать влияние на представление данных в памяти компьютера. В 6 блоке осуществляется выбор таких параметров.



Рисунок 5.2 – Этапы проектирования базы данных

Оценка возможной работоспособности базы данных является очень важной составляющей в процессе проектирования БД. Процесс проектирования завершается оценкой при реализации предполагаемых запросов пользователей. Если в рамках построенной модели нет возможности отвечать на предполагаемые запросы, то необходимо произвести возврат на шаг назад и построить более эффективное обобщенное концептуальное представление, которое уже не приведет к невозможности реализации соответствующего запроса в реальном масштабе времени. Такие оценки производятся и при завершении других этапов проектирования в блоках 6 и 7. При этом в процессе проектирования базы данных всегда предполагается возврат на один или несколько шагов назад. Это производится и в случае если при проектировании логической модели в блоке 5 не удалось достичь адекватного представления концептуальной модели средствами системы управления базой данных. В этом случае либо надо возвратиться на шаг назад, либо произвести выбор другой системы управления базой данных, либо изменить вид концептуальной модели, вернувшись к блоку 3. Если при завершении процесса проектирования, произведя оценки эксплуатационных характеристик в блоке 7, мы видим что они не отвечают требованиям пользователя, возможен пересмотр всех уже принятых решений в блоках 3, 4, 5, 6, 7. И в дополнение производится возврат к проектированию обобщенного концептуального представления в тех случаях, когда меняются внешние требования пользователей и при выявлении явных ошибок в проектировании.

 

Описание предметной области. ЕR-диаграмма

Покажем вводимые понятия на этапе проектирования базы данных в доступной для студента и близкой для восприятия форма. Рассмотри предметную область на примере студентов вуза. Необходимо дать краткое описание предметной области. В некотором вузе имеется несколько факультетов. На каждом факультете ведется подготовка студентов по нескольким специальностям и направлениям подготовки. Для каждого направления или специальности на факультете выработан свой конкретный учебный план. В этом плане приводится перечень изучаемых курсов по учебной программе с приведением количества учебных часов по разным видам занятий. Студенты, которые учатся на конкретном направлении факультета, изучают представленные в учебной программе дисциплины и сдают различные курсовые и промежуточные контроли, при этом получают зачеты и оценки.


В этом случае концептуальная модель может быть представлена в виде диаграммы сущностей – связей (entity – relationship) или ЕR-диаграммы. Процесс непосредственного построения диаграммы «сущностей – связей» называется ЕR-моделированием.

С помощью каких понятий можно описать предметную область? Дадим краткое описание таких основных понятий.

Сущностью (Еntity) или объектом информационной системы называется нечто такое, за чем хотелось бы наблюдать пользователю (о чем будет собираться информация).

Если в информационной системе обрабатывается информация о факультетах, сущностью будет считаться факультет, если в информационной системе обрабатывается информация о студентах, сущностью будет считаться студент и так далее.

Сущности при моделировании «сущность – связь» имеет имя, которое обычно записывается заглавными буквами. Каждой сущности присущи определенные свойства, набор которых зависит от интереса пользователя и рамок проводимых исследований. Эти свойства запоминаются в информационной системе. Поясним, в качестве свойства сущности ФАКУЛЬТЕТ может быть указан номер этого факультета или его название. В качестве свойства сущности СТУДЕНТ может быть указана фамилия, дата рождения, место рождения или номер зачетной книжки. В качестве свойства сущности ЭКЗАМЕН может быть указан предмет, дата проведения экзамена и экзаменатор (или несколько экзаменаторов).

Введение атрибута осуществляется для информационного описания сущности. Атрибут называется поименованное свойство или характеристика сущности. Атрибут представлен информационным отображением свойства сущности и принимает некоторое конкретное значение из множества допустимых значений. Приведем пример. Для сущности ФАКУЛЬТЕТ атрибутом будет «название». И соответственно конкретный экземпляр сущности принимает конкретное значение, то есть название – «экономический факультет». Атрибут не только представляет информационное описание количественных или качественных свойств сущности. Он так же описывает состояние сущности и позволяет ее идентифицировать. Совокупностью атрибутов представлена наиболее полная информация о сущности. Такая совокупность атрибутов обычно называется записью об объекте.

Есть так же понятие класса сущностей. Классом сущностей или наборов объектов называется совокупность сущностей, характеризующихся в информационной системе одинаковыми наборами свойств. Поясним. Совокупность всех сущностей СТУДЕНТ составляет класс сущностей СТУДЕНТ, совокупность всех сущностей ФАКУЛЬТЕТ составляет класс сущностей ФАКУЛЬТЕТ. Класс сущностей описывается перечнем свойств сущностей, составляющих этот класс.


Сущность с конкретными значениями соответствующих свойств является конкретная сущность и называется экземпляром сущности. Ранее было определено предназначение сущности как накопителя информации в информационной системе. Но это только одно направление для чего предназначена сущность. Данные должны не просто накапливаться и храниться. Они должны использоваться для потребителя с точки зрения удовлетворения информационных потребностей. Интересующий пользователя экземпляр сущности может, в последствии, обрабатываться, корректироваться или удаляться. Нахождение экземпляра сущности производится для реализации запросов. Однозначная идентификация является важнейшим свойством сущности. Она производится по уникальному идентификатору в виде одного или группы атрибутов. Для сущности ФАКУЛЬТЕТ уникальным атрибутом будет номер или название. Для сущности СТУДЕНТ уникальным атрибутом будет фамилия, имя отчество или специальный идентификатор присваиваемый студентам при зачислении, так называемый «код студента».

ЕR-диаграмма является самым распространенным способом для представления концептуальной модели. ЕR-диаграмма может обозначаться по разному в зависимости от источников, стандартов или программных продуктов. Ознакомившись с документацией можно в кратчайшие сроки освоить используемую систему обозначений. Практически разность в обозначениях не вызывает у проектировщиков сложностей. Представим один из вариантов. Представим ЕR-диаграмму где класс сущностей будет представлен в виде четырехугольника. В этом четырехугольнике будет записано прописными буквами уникальное имя класса сущности и строчными буквами имена атрибутов данной сущности. Пример класса сущности СТУДЕНТ представлен на рисунке (Рис. 5.3).



Рисунок 5.3 – Класс сущностей и экземпляр сущности

Нахождение интересующей пользователя экземпляр сущности является не достаточным условием для реализации его информационных потребностей. Функциональные взаимоотношения тесно связаны с информационными потребностями. Необходимость определения, на каком факультете учится студент, связывает функциональными взаимоотношениями, существующими в организации с информационными потребностями. Такие запросы, как информационные потребности пользователя реализуются с использованием взаимоотношений между сущностями, которые существуют в предметной области. Эти взаимоотношения определяются связями (Rеlаtionships). Можно выделить экземпляры связей и классы связей. Различают классы связей и экземпляры связей. Экземпляры связей это взаимоотношения между экземплярами сущностей. Классы связей это взаимоотношения между классами сущностей.