Файл: Развитие технологий обработки данных.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.03.2024

Просмотров: 115

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
, вычисляются по заранее заданным формулам).

В примере на рис. 4.10 б каждое значение ячейки Объем продаж однозначно определяется комбинацией временного измерения (Месяц продаж) и модели автомобиля. На практике зачастую требуется большее количество измерений. Пример трехмерной модели данных приведен на рисунке 4.11.

В существующих многомерных системах управления базой данных используются два основных варианта (схемы) организации данных: гиперкубическая и поликубическая



Рисунок 4.11 – Пример трехмерной модели

В поликубической схеме предполагается, что в базе данных может быть определено несколько гиперкубов с различной размерностью и с различными измерениями в качестве граней. Примером системы, поддерживающей поликубический вариант базы данных, является сервер Оracle Еxpress Server.

В случае гиперкубической схемы предполагается, что все показатели определяются одним и тем же набором измерений. Это означает, что при наличии нескольких гиперкубов баз данных все они имеют одинаковую размерность и совпадающие измерения. Очевидно, что в некоторых случаях, информация в базе данных может быть избыточной (если требовать обязательное заполнение ячеек).

В случае многомерной модели данных применяется ряд специальных операций, к которым относятся: формирование «среза», «вращение», агрегация и детализация.

«Срез» (Slice)представляет собой подмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений. Формирование «срезов» выполняется для ограничения используемых пользователем значений, так как все значения гиперкуба практически никогда одновременно не используются. Например, если ограничить значения измерения Модель автомобиля в гиперкубе (Рис. 4.11) маркой «Nissan», то получится двухмерная таблица продаж этой марки автомобиля различными менеджерами по годам.

«Вращение» (Rotate) применяется при двухмерном представлении данных. Суть ее заключается в изменении порядка измерений при визуальном представлении данных. Так, «вращение» двумерной таблицы, показанной на рисунке 4.10 б, приведет к изменению ее вида таким образом, что по оси Х будет марка автомобиля, а по оси Y – время.

Операцию «вращение» можно обобщить и на многомерный случай, если под ней понимать процедуру изменения порядка следования измерений. В простейшем случае, например, это может быть взаимная перестановка двух произвольных измерений.

«Агрегация» (Drill Up) и «детализация» (Drill Down) означают соответственно переход к более общему и к более детальному представлению информации пользователю из гиперкуба.


Достоинством многомерной модели данных можно считать удобство и эффективность аналитической обработки больших объемов данных, связанных со временем. При организации обработки аналогичных данных на основе реляционной модели происходит нелинейный рост трудоемкости операций в зависимости от размерности базы данных и существенное увеличение затрат оперативной памяти на индексацию.

Недостатком многомерной модели данных можно считать ее громоздкость для простейших задач обычной оперативной обработки информации.


Объектно-ориентированная модель.

В объектно-ориентированной модели при представлении данных имеется возможность идентифицировать отдельные записи базы. Между записями базы данных и функциями их обработки устанавливаются взаимосвязи с помощью механизмов, подобных соответствующим средствам в объектно-ориентированных языках программирования.

Стандартизованная объектно-ориентированной модель описана в рекомендациях стандарта ODMG-93 (Object Database Management Group — группа управления объектно-ориентированными базами данных). Реализовать в полном объеме рекомендации ODMG-93 пока не удается.

Структура объектно-ориентированной базы данных графически представима в виде дерева, узлами которого являются объекты. Свойства объектов описываются некоторым стандартным типом (например, строковым — string) или типом, конструируемым пользователем (определяется как class).

Значением свойства типа string является строка символов. Значение свойства типа class есть объект, являющийся экземпляром соответствующего класса. Каждый объект-экземпляр класса считается потомком объекта, в котором он определен как свойство. Объект-экземпляр класса принадлежит своему классу и имеет одного родителя. Родовые отношения в базе данных образуют связную иерархию объектов.

Внешне логическая структура объектно-ориентированной базы данных внешне схожа с структурой иерархической базы данных. Но есть отличия, основным из которых являются методы манипулирования данных.

Рассматриваемая модель базы данных может выполнять какие-либо действия над данными применяя логические операции, которые усилены объектно-ориентированными механизмами инкапсуляции, наследования и полиморфизма. С некоторыми ограничениями, но все таки могут применяться операции, подобные командам SQL.

Проектирование, создание и изменение базы данных в данной модели может сопровождаться автоматическим формированием и последующей корректировкой индексов или так называемых индексных таблиц. Индексы или индексные таблицы содержат информацию для быстрого поиска данных.

К чему сводится поиск объектов в объектно-ориентированной базе данных? Он заключается в выборе конкретных элементов сходства между теми элементами или объектами, которые задает системе пользователь и элементами или объектами, которые хранятся в базе данных. Пользователь определяет объект. Определение объекта значит задаются свойства объекта (gоаt) и называется объектом-целью. Объект-цель может представлять подмножество всей хранимой в базе данных иерархии объектов. Так же как и результаты выполненных запросов, объект-цель может храниться в самой базе данных.


Объектно-ориентированные модели данных обладают достоинством, которое по сравнению с реляционной моделью является важным и говорит о возможности отображать информацию не простых взаимосвязях объектов базы данных. Они так же позволяют пользователю идентифицировать отдельную запись базы данных и определять функции их обработки.

К недостаткам объектно-ориентированной модели можно отнести высокую понятийную сложность, неудобство обработки данных и низкую скорость выполнения запросов.

Типы данных.

На первом и последующих этапах своего развития системы управления базами данных преимущественно использовались для решения финансово-экономических задач. Надо отметить, что основные типы данных используются независимо от моделей представления. В базах данных используются в основном следующие типы данных:

      числовые. Примеры значений данных: 0,43; 328; 326,456; 2Е+4;

      символьные или алфавитно-цифровые. Примеры значений данных: «суббота», «столбец», «начальник»;

      даты, задаваемые с помощью специального типа «Дата» или как обычные символьные данные. Примеры значений данных: 2.06.14, 14/6/2015.

В отличии от приведенных типов, необходимо отметить, что различие систем управления базами данных не обуславливается существенным различием этих типов. Они могут незначительно отличаться друг от друга по различным критериям (название, диапазон значений, вид представления). В современных условиях, когда стала необходимость в появлении различных специализированных систем (обработка видео, геоинформационные системы) стали появляться новые типы данных. Они стали добавляться к традиционным в классические системы управления базами данных. К их числу можно отнести следующие новые типы данных:

временные и дата-временные, предназначенные для хранения информации о времени и/или дате. Примеры значений данных: 31.01.15 (дата), 9:10:03 (время), 20.05.1969 02:00 (дата и время);

символьные переменной длины, предназначенные для хранения текстовой информации большой длины, например, текстовый документ в различных текстовых форматах;

двоичные, предназначенные для хранения графических объектов, аудио- и видеоинформации, пространственной, хронологической и другой специальной информации. Например, в Мicrosoft Aссess таким типом является тип данных «Поле объекта ОLЕ», который позволяет хранить в БД графические данные в формате ВМР (Вitmap) и отображать их в автоматическом режиме при работе с базой данных;


гиперссылки (hyperlinks), предназначенные для хранения ссылок на различные ресурсы (узлы, файлы, документы и т.д.), находящиеся вне базы данных, например, в сети Internet, корпоративной сети intranet или на жестком диске компьютера или сервера.

В современных системах управления базой данных с различными моделями данных могут использоваться все перечисленные типы данных.

 

Разделение систем управления базами данных на настольные и промышленные

Когда необходимо выполнить сравнительно небольшие задачи используются настольные системы управления базами данных. Сравнительно небольшие задачи подразумевают, использование небольшого объема обрабатываемой информации и, сравнительно малого количества пользователей). Настольные системы управления базами данных имеют упрощенную архитектуру , то есть могут функционировать в файл-серверном режиме. Такие системы поддерживают на все возможные функции системы управления базой данных. Может не вестись журнал транзакций, может отсутствовать возможность автоматического восстановления базы данных после сбоев и многое другое. Несмотря на приведенные существенные ограничения эти системы имеют обширную применяемую область. Это могут быть государственные и муниципальные учреждения, организации сфера образования, предприятия сфера обслуживания а так же различные фирмы малого и среднего бизнеса. Возникающие задачи в приведенной области применения имеют специфика, которая заключается в не огромных объемах данных, в низкой частоте обновления, в территориальной близости и небольшом количестве пользователей. В приведенных условиях использование настольных систем управления базами данных с их существенными ограничениями является рентабельным.

Первыми системами управления базами данных были так называемые dВase-совместимые программные системы, разработанные параллельно совершенно разными фирмами. Система dВase III – РLUS произведенная фирмой Аchton-Тate стала первой системой такого класса, получившей достаточно широкое распространение. Развитые языковые возможности, с точки зрения программирования, очень удобный или «дружественный» интерфейс, доступный для любого даже очень массового пользователя, стали основными причинами широчайшего распространения данной системы. Тем не менее, есть сложности обусловленные низкой производительностью на стадии интерпретации, что неизбежно повлияло на появление новых систем-компиляторов, близких к системе dВase III – РLUS: