Файл: Операции, производимые с данными (Основное понятие).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 11.03.2024

Просмотров: 14

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Содержание:

Введение

Специфической чертой цивилизации является рост производства, потребления и накопления информации по всем направлениям человеческой деятельности. Для текущего столетия характерен интенсивный прогресс науки, техники и компьютерных технологий. Установлено, что сейчас специалист должен тратить примерно 80% своего времени на то, чтобы уследить за всеми новинками печатных работ в той или иной области деятельности [2].

Рост объемов информации, а также увеличивающийся спрос на нее аргументировали возникновение отрасли, связанной с автоматизацией обработки информации, - информатики.

Но для перехода непосредственно к науке информатике, необходимо сказать о самой информации. Мы живём в материальном мире. Всё, что нас окружает, и с чем мы сталкиваемся, относится либо к физическим телам, либо физическим полям. Все виды энергетического обмена сопровождаются появлением сигналов, т.е. все сигналы имеют в своей основе материальную энергетическую природу. При взаимодействии сигналов с физическими телами, в них возникают определённые изменения свойств – это явление называется регистрацией сигналов. В результате образуются данные – зарегистрированные сигналы.

Актуальность данной курсовой работы заключается том, что одной из ключевых проблем человечества является лавинообразный поток информации в любой сфере его жизнедеятельности.

Предметом исследования данной курсовой работы является технология программирования.

Объектом исследования данной курсовой работы являются данные.

Целью курсовой работы является изучений операций, производимых с данными.

Для реализации поставленной цели необходимо выполнить ряд задач, а именно:

- изучить основные понятия касательно данных;

- проанализировать существующие носители данных;

- рассмотреть операции, осуществляющиеся с данными;

- изучить процесс кодирования данных.

Структура курсовой работы состоит из введения, двух глав, заключения и списка использованных источников.

1. Данные

1.1 Основное понятие

Информация – это отражение действительности при помощи разнообразных сведений [1]. Вместе с этим термином в информатике применяется понятие «данные», предполагающее отрывочные, не связанные каким-либо образом между собой сведения.


В технологическом процессе обработки данных имеют место четыре этапа, а именно:

- формирование первичных данных – первичные сообщения о хозяйственных операциях, документы, включающие нормативные и юридические акты, результаты экспериментов, например, характеристики новой модели дирижабля и пр.;

- накопление и систематизация данных – организация такого размещения данных, которое реализует оперативный поиск и фильтрацию необходимых сведений, методические обновление данных, защиту от искажения и пр.;

- обработка данных – процессы, итогом которых на базе ранее накопленных данных являются новые их виды – обобщающие, аналитические, прогнозные и пр. Такие данные вторичной обработки могут быть обработаны еще раз для того, чтобы выдать более целостные и осмысленные обобщения;

- отображение данных – представление данных в удобной форме для человека. Это может быть и вывод на печать, и звук, и графики [3].

Сообщение, создаваемые на этапе формирования данных, может быть различного вида (бумажный документ, звук, анимация и т.д.). Чаще всего носители первичной информации – бумага, кассеты, виниловые диски и т.д. – крайне недолговечны [1].

Компьютерные технологии являются совершенно прогрессивным подходом – они записывают информацию в цифровом виде на магнитных и лазерных носителях.

При помощи технических и программных средств ЭВМ первичные данные трансформируются в машинный код.

Одной из ключевых проблем касательно документации данных в компьютере является точность и корректность четырех различных видов данных.

Точность – это реализация задачи без каких-либо погрешностей или ошибок. Также точность можно определить и как степень соответствия меры к установленному стандарту [5].

Корректность – это мера частоты возникновения ошибок в данных. Ошибки способы появиться в процессе сбора данных, наблюдений или же измерениях.

Точность находится в зависимости от степени детализации, например, от числа десятичных знаков при измерении какой-либо величины. Вес тела, определенный как 56,23 кг более точен, чем вес, определенный как 56,2 кг.

Данные – это диалектический компонент информации, являющийся зарегистрированными сигналами [7]. Вместе с тем, физический метод регистрации может быть разным:

- механическое перемещение физических тел;

- изменение формы физических тел или характеристик качества поверхности;

- изменение электрических, магнитных, оптических характеристик;

- изменение химического состава или связей;


- изменение состояния электронной системы и т.д.

В соответствии с методом регистрации данные способны храниться и перемещаться на носителях разных видов.

1.2 Носители данных

Самым известным носителем данных является бумага. На ней данные фиксируются при помощи изменения оптических характеристик ее поверхности. Данное изменение (изменение коэффициента отражения поверхности в установленном диапазоне длин волн) применяется и в устройствах, реализующих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD-ROM). Носителями, использующими изменение магнитных свойств, являются магнитные ленты и диски. Регистрация данных при помощи изменения химического состава поверхностных веществ носителя повсеместно применяется в фотографии. На биохимическом уровне осуществляется накопление и трансляция данных в живой природе [9].

Рисунок 1 – Простейший компакт-диск

Носители данных представляют интерес по той причине, что свойства информации прямым образом связаны с характеристиками ее носителей. Всякий носитель можно определить параметром разрешающей способности (объемом данных, записанных в установленной для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд наибольшего и наименьшего регистрируемого сигнала). От данных свойств носителя находятся в тесной зависимости определенные свойства информации – полнота, доступность и достоверность [11]. Так, вполне можно рассчитывать на то, что в базе данных, находящейся на компакт-диске, легче реализовать полноту информации, чем в схожей по назначению базе данных, находящейся на гибком магнитном диске, т.е. в первом случае плотность записи данных на единице длины дорожки существенно выше. Для рядового пользователя доступность информации в книге существенно выше, чем на диске, т.к. не все пользователи имеют нужное оборудование. Также логично, что визуальный эффект от просмотра слайдов на проекторе существенно больше, чем от просмотра бумажных иллюстраций.

Рисунок 2 – Книга в бумажной и в электронной форме

Задача преобразования данных для смены носителя является одной из ключевых задач информатики. В структуре стоимости ЭВМ устройства ввода-вывода данных, взаимодействующие с носителями информации, составляют до 50% от стоимости аппаратных средств.


Отличным запоминающим устройством и носителем данных является мозг человек, имеющий примерно 10-15*109 нейронов – ячеек, обладающих функциями памяти и логической обработки информации [13].

Примерный объем мозга – 1,5 м3, масса – 1,2 кг, потребляемая мощность – 2,5 кВт. Самые современные электронные запоминающие устройства при аналогичной емкости имеют объем в несколько кубических метров, массу в десятки и сотни килограммов и мощность в диапазоне нескольких десятков киловатт.

Научно обоснованные прогнозы позволяют сделать вывод о том, что развитие электронной техники и использование новых высокоэффективных аккумулирующих сред в комплексе с повсеместным применением методов бионики при реализации задач синтеза запоминающих устройств дает возможность производить запоминающие устройства, схожие по характеристикам с памятью человека [15].

1.3 Операции с данными

Данные определяются своим типом и разнообразием действий над ними. Данные в компьютере можно разделить на простые и сложные [2].

В таблице 1 приведены примеры простых данных, которые могут быть подвергнуты компьютерной обработке.

Таблица 1

Типы данных, обрабатываемых компьютером

Типы данных

Операции

1

Числа (числовые данные)

Все арифметические действия

2

Тексты (символьные данные)

Замещение, вставка, удаление символов, сопоставление, конкатенация строк

3

Логические (бинарные данные)

Все логические действия

4

Изображения: рисунки, графика, анимация (графические данные)

Операции над пикселями, из которых состоит изображение: яркость, цвет, контрастность

5

Видео данные

Удаление фрагмента, вставка фрагмента, работа с кадрами

6

Аудио данные

Усиление, уменьшение, удаление, вставка фрагмента

К сложным данным принадлежат:

- массивы и списки (однотипные);

- структуры;

- записи;

- таблицы (разнотипные) [2].

С течением информационного процесса данные трансформируются из одного вида в другой благодаря различным методам. Обработка данных состоит из разнообразия операций. В ходе научно-технической революции и всеобщего усложнения связей в социуме трудовые затраты на обработку данных стабильно растут. В первую очередь это происходит ввиду непрерывного усложнения условий управления производством и общество. Во вторую очередь это вызвано интенсивностью возникновения и интеграции носителей данных, средств их хранения и перемещения.


В структуре вероятных операций с данными имеют место быть такие, как:

- сбор – накопление информации для реализации достаточной полноты для вынесения того или иного решения;

- формализация – приведение данных из различных источников к одинаковой форме для того, чтобы сделать их сравнимыми друг с другом, т.е. повысить их уровень доступности;

- фильтрация – устранение лишних данных, которые не нужны для принятий решения; в данном случае должен снижаться уровень «шума», а достоверность и адекватность данных должны расти;

- сортировка – упорядочение данных по определенному признаку для удобства применения; это повышает доступность информации;

- архивация – организация хранения данных в доступной форме; необходима для сокращения денежных затрат по хранению данных, также повышает общую надежность информационного процесса;

- защита – совокупность мероприятий, ориентированных на предупреждение утраты, воспроизведения и изменения данных;

- транспортировка – прием и передача данных между удаленными участниками информационного процесса; вместе с тем источник данных является сервером, а потребитель – клиентом;

- преобразование – перевод данных из одной формы (структуры) в другую. Данная операция зачастую связана с изменением типа носителя – так, книги можно хранить и в бумажной, и в электронной форме [4].

Потребность в многократном преобразовании данных появляется и при их транспортировке, тем более есть она реализуется средствами, которые не предназначены для транспортировки такого вида данных. В роли примера можно привести факт того, что для транспортировки цифровых потоков данных по телефонному каналу (в первую очередь направленных лишь на трансляцию аналоговых сигналов в узком диапазоне частот) нужно преобразование цифровых данных в определенное подобие звуковых сигналов, что реализуют специальные устройства – телефонные модемы [6].

2. Кодирование данных

2.1 Кодирование данных двоичным кодом

Для того, чтобы автоматизировать работу с данными, которые принадлежат к разнообразным типам, крайне важно унифицировать их форму отображения. Для этого нередко применяется прием кодирования, т.е. выражение данных одного типа через данные другого типа. Естественные человеческие языки – это системы кодирования понятий для выражения мыслей при помощи речи [8]. К языкам близко примыкают азбуки (системы кодирования языковых элементов графическими символами). В ходе истории было немало интересных, но безуспешных попыток создания универсальных языков и азбук. Скорее всего, такая тщетность их интеграции обусловлена тем, что национальные и социальные образования естественным образом понимают, что трансформация системы кодирования общественных данных однозначно ведет к трансформации общественных методов (т.е. норм права и морали), а это может быть связано с социальными потрясениями. Аналогичная проблема универсального средства кодирования эффективно реализуется в различных отраслях техники, науки и культуры [10]. В роли примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку и т.д. Своя система есть и в вычислительной технике – это двоичное кодирование, базирующееся на отображении данных последовательностью всего двух знаков: нуля и единицы. Такие знаки именуются двоичными цифрами и по-английски называются сокращенно bit (бит). Примеры разнообразных систем кодирования отражены на рис. 3.