Файл: Способы представления данных в информационных системах.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 11.03.2024

Просмотров: 28

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Содержание:

Введение

В данной курсовой работе будет расмотрет вопрос по теме КР «Способы представления данных в информационных системах» и разработана программа для тестирования для примера.

Существуют разные способы представления данных. Наиболее распространенный из них - графический. Например, Panorama предоставляет следующие возможности (предполагается, что система использует в качестве механизма связи сообщения):

карта процессоров (процессоры и их соединения, а также текущие сообщения между ними);

окно отладки (состояния задач, данные, и.т.п.);

окно потока сообщений (все сообщения между процессорами во времени (и время приема, и время получения).

В дополнение к графическому способу можно использовать, например, звуковой, как это описано в [14]. Преимущество использования звука при отладке состоит в том, что при большом объеме собранных данных может быть сложно обнаружить ошибку визуально. Например, если в процессе работы затерялось какое-то сообщение от одного процессора к другому, то, анализируя графическое представление взаимодействия процессоров, трудно найти потерянное сообщение, так как оно может быть графически просто не представлено. Однако, если каждое сообщение (от посылки до получения) будет сопровождать некоторый звуковой сигнал, то потерянное сообщение будет сразу обнаруживаться.

Как видно, при отладке распределенных приложений необходимо учитывать связь между процессорами и, в основном, асинхронный ее характер, то есть на первое место выступает обнаружение ошибок, связанных со взаимодействием задач и усиленных тем, что задачи выполняются на разных процессорах.

Программа подразумевает выбор правильного варианта ответа из представленных посредствам переключателя. Каждый правильный ответ приносит пользователю один балл. По окончанию тестирования, когда пользователь ответит на все вопросы, программа подсчитывает количество баллов и отображает результат тестирования с оценкой. В программе предусмотрен вариант пробного тестирования, где правильные варианты ответа выделены другим цветом. Доступ к пробному тестированию предоставляется по паролю. Вопросы и варианты ответа к тесту хранятся в отдельном текстовом файле.

Цель курсовой работы – Способы представления данных в информационных системах.


1 Теоритические аспекты о представлениях данных в информационных системах

1.1 Понятие данных в ИС

Информация и данные. Восприятие окружающего мира связано с регистрацией различных, часто взаимосвязанных явлений, в результате чего мы получаем информацию о реальном мире. С давних времен человечество пыталось как-то описать эти явления вне зависимости от того, достигалось их полное понимание или нет. Элементы такого описания реального мира будем называть данными.

Слово «данные» происходит от латинского «datum», буквально означающего «факт». Тем не менее, данные не всегда соответствуют конкретным или действительным фактам. Иногда они неточны или описывают нечто, не имеющее место в реальной действительности, например идею или сновидение. Поэтому к данным будем относить описания любых явлений (в широком смысле слова), которые представляются ценными для того, чтобы их зафиксировать. Под информацией понимают любые сведения о каком-либо событии, сущности, процессе, явлении и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Иными словами информация – это знание о чем-либо. На современном этапе считается, что информация присуща всем видам и формам движения материи и связана с неотъемлемыми свойствами или атрибутами материи (отражением, разнообразием, структурой, распределением вещества и энергии в пространстве и времени и т.д.). Для того, чтобы соотнести между собой данные и информацию, представим следующую абстрактную ситуацию. Имеется некоторая система, ин формация о состоянии которой представляет интерес, и наблюдатель, способный воспринимать состояния системы и в определенной форме фиксировать их в своей памяти (никаких других действий он не выполняет). В этом случае говорят, что в памяти наблюдателя находятся данные, описывающие состояние системы.

В качестве такого «наблюдателя» в общем случае выступают СОД. Таким образом, данные можно определить также как информацию, фиксированную в определенной форме, пригодной для последующей обработки, хранения и передачи. Данные соответствуют зарегистрированным фактам об объектах и явлениях реального мира. Чтобы в дальнейшем использовать данные, требуется их смысловое содержание – семантика данных. Поэтому в СОД должны быть предусмотрены правила и средства интерпретации данных. Традиционно фиксация данных осуществляется с помощью конкретного средства общения (например, с помощью языка или изображений) на некотором носителе (например, бумаге, камне и т.п.). Основное и самое мощное средство представления семантики данных – естественный язык. Чаще всего данные описываются на естественном языке и фиксируются на бумаге.


Обычно данные (факты) и их интерпретация (семантика) фиксируются совместно, так как естественный язык достаточно гибок для представления и того и другого. Примером может служить утверждение «Рост Иванова – 173 см». Здесь «173» данное, а его семантика «рост Иванова в сантиметрах». Однако использование естественного языка в СОД вызывает известные трудности, поэтому в них широко используют формализованные языки, позволяющие эффективно организовать обработку данных и, с определенными ограничениями, – представлять семантику данных, удовлетворяющую практическим потребностям.

Данные и их интерпретация могут быть разделены. Например, расписание авиарейсов представляет собой таблицу данных, а их интерпретация приводится в начале (шапке) таблицы. Разделение данных и их интерпретации может затруднять работу с данными, что проявляется, в частности, и при пользовании расписанием авиарейсов. Широкое применение СОД привело к разделению данных и интерпретации. Компьютеры имеют дело главным образом с данными как таковыми. Большая часть интерпретирующей информации вообще не фиксируется в явной форме. Например, программа численного анализа, предназначенная для решения дифференциальных уравнений в частных производных, получает в качестве исходных данных некоторые числа и вырабатывает другие числа. Она не содержит информации о том, какие реальные явления описывают эти дифференциальные уравнения.

Ответственность за интерпретацию результатов в контексте их применения лежит на пользователе программы. Существуют, по крайней мере, две причины, по которым применение компьютеров привело к отделению данных от интерпретации. Во-первых, компьютеры не обладают достаточными возможностями для обработки текстов на естественном языке, который остается основным средством кодирования и интерпретации семантики данных. Во-вторых, стоимость компьютерной памяти была первоначально весьма велика, и память использовалась в основном для хранения самих данных, а интерпретация традиционно возлагалась на пользователя. По мере развития вычислительной техники возможность обеспечения автоматической интерпретации возрастает.

Программы, в которых заложена интерпретация используемых данных, имеют существенно большую значимость, так как без интерпретации данные не несут для потребителя никакой полезной информации и представляют собой не более чем совокупности битов. Однако в современных СОД, в условиях совместного использования данных, при множестве различных приложений такой подход можно применять только до определенного предела. За этим пределом написание программ, в каждую из которых встроены близкие, хотя и не идентичные механизмы интерпретации, становится весьма неэффективным.


В такой ситуации целесообразнее ассоциировать данные и механизмы интерпретации и обеспечить однократность представления интерпретирующей информации. В результате изменяется роль данных. Их уже нельзя рассматривать как совокупность битов, они приобретают определенную семантическую окраску. В таком качестве их можно расценивать уже как семантически значимое представление реального мира, как некоторое абстрактное знание. Интерпретация данных должна позволять наряду со стабильным базисом отображать множественность и эволюцию взглядов на данные. Такая гибкость достигается двумя способами. Во-первых, обеспечиваются разносторонние взгляды на одни и те же данные. Например, различные приложения могут накладывать на данные свои ограничения и конкретную интерпретацию. Так, человек может рассматриваться в приложениях, связанных с кадровыми вопросами – как служащий, в производственных приложениях – как исполнитель работ, при обработке данных выборных кампаний – как избиратель, в медицинских приложениях – как пациент и т.д. Вместе с тем, та часть интерпретации данных, которая осуществляется системой ведения данных, должна оставаться достаточно абстрактной для того, чтобы обеспечить множественность взглядов.

С другой стороны, должна существовать возможность единообразного представления различных данных. Например, администраторы, клерки, торговые агенты, секретари могут рассматриваться как служащие независимо от рода их деятельности. Это также требует значительной абстрактности интерпретации. Двум понятиям – «информация» и «данные» в СОД соответствуют два аспекта рассмотрения вопросов: инфологический и датологический. Инфологический аспект употребляется при рассмотрении вопросов, связанных со смысловым содержанием данных (семантика данных) независимо от способов их представления. Датологический аспект употребляется при рассмотрении вопросов представления данных в памяти СОД.

Моделирование данных. Очевидно, что наряду с абстрактностью интерпретации должны обеспечиваться развитые возможности представления соотношения данных. Интеллектуальное средство, позволяющее реализовать интерпретацию данных, находящихся между собой в определенных взаимоотношениях, называется моделью данных. Модель данных – это средство абстракции, которое дает возможность составить целостную картину отображения данных определенной предметной области, т.е. увидеть «лес» (информационное содержание данных), а не «отдельные деревья» (конкретные значения данных). Модели данных широко используются в различных дисциплинах, они помогают понять проблемы и абстрагироваться от деталей. Уровень абстрактности модели может меняться в зависимости от того, как она будет использоваться. Существует множество моделей, отражающих различные аспекты реального мира: физические, позволяющие понять его физические свойства, математические, представляющие собой абстрактное описание мира с помощью математических знаков, экономические, отображающие тенденции экономики и позволяющие получить прогноз ее развития. Модели данных дают возможность представить частичную семантику данных, что в свою очередь обеспечивает пользователей частичными знаниями о реальном мире. Привлекательной, на первый взгляд, может показаться мысль – найти универсальную модель данных, которая бы полностью отражала реальный мир.


Однако возможность создания такой модели весьма проблематична. Система наших знаний о мире – это открытая система. Даже, располагая самыми обширными знаниями в некоторой области, мы фактически никогда не достигнем исчерпывающего ее познания. Важно, чтобы объем знаний и семантика данных, представленные в модели, были адекватны желаемому использованию данных. Приступая к задаче моделирования данных, необходимо, прежде всего, определить элементарные объекты моделирования. Примем в качестве рабочего определения элементарной единицы данных кортеж .

Первый элемент кортежа – имя объекта – является, по существу, идентификатором объекта, явления (или идеи). Второй элемент – свойство объекта – дает определенную характеристику объекту, явлению и может принимать некоторое конкретное значение (значение свойства) в определенное время (время). Среди названных четырех характеристик данных наибольшие проблемы вызывает характеристика времени. Для множества данных требуется решить сложную задачу синхронизации времени их представления и изменения. Кроме того, часто представляет интерес не абсолютное, а относительное время наблюдения явления (т. е. последовательность, в которой возникают явления). В этом случае необходимый результат достигается временным упорядочением данных, а не фиксацией абсолютного времени. В разных аспектах использования данных может меняться информационная ценность новых и старых данных. Например, в расчетах заработной платы предприятия используется текущий размер заработной платы служащего и не требуется знания всех предыдущих изменений его заработка. В то же время, для других приложений, связанных, например, с динамикой роста заработной платы на предприятии, сведения об изменениях заработка служащего станут необходимыми.

Поэтому характеристика времени во многих моделях данных подменяется, либо некоторыми другими характеристиками, либо упорядочением объектов. Опуская временную характеристику, приходим к следующему представлению элементарной единицы данных: . Она может быть реализована множеством способов, что и привело к созданию множества моделей данных. Простым и естественным способом представления элементарных данных и связей между ними является сетевая структура, в которой вершины соответствуют элементам, а дуги – связям между ними. Другой мощный способ установления связей между данными состоит в распределении их по категориям. Данные одной категории предполагаются подобными.