Файл: Методы кодирования данных(Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования» ).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 12.03.2024

Просмотров: 25

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Содержание

Введение 3

Глава I. Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования» 
1.1. Понятие и принципы кодирования информации 
1.2. Теория кодирования 
Глава II. Кодирование разных типов информации 
2.1. Методы кодирования данных 
Заключение 
Список использованной литературы 

Введение

Теорию кодирования можно сравнить с древнейшим искусством криптографией. Криптография (от др.-греч. тайнопись), это область знаний о методах обеспечения конфиденциальности, целостности данных, аутентификации, невозможности отказа от авторства[1]. Среди известных ученых умов, которые работали над созданием разного рода шифров можно выделить философа Ф. Бэкона, математиков Д.Валлиса, Д. Кардано и других[2]. По мере развития методов шифрования получили развитие различные способы расшифровки или, другими словами, криптоанализа.

Одновременно с появлением компьютера возникла потребность в кодировании разных видов данных, с которыми работает как отдельная личность, так и все человечество. Однако, нужно отметить, что работа по кодированию информации была начата задолго до возникновения компьютера.

Так, одни из величайших достижений человека- письменность с арифметикой- представляют собой самую настоящую систему кодировки речи и числовых данных. Информация нигде не может быть представлена в чистом виде, ее всегда преподносят в закодированном виде.

Для лучшего понимания данной темы следует рассмотреть примеры кодировки информации, которые использовались в быту. Во времена Руси, в лесах, которые подавляли звуковые волны, чтобы передать срочное сообщение, люди использовали дым от костров. Большинство племен Африки и по сей день применяют специальные барабаны тамтамы, чтобы обмениваться сообщениями на скорости звука. В настоящее время в морском флоте применяется семафорная азбука, где каждая буква обозначается определенным положением рук сигнальщика, которое он подчеркивает флажками. Более того, чтобы ваш сигнал был принят и правильно понят, заранее договаривались о значении двух дымов либо последовательности пары быстрых ударов барабана, а также, например, руки сигнальщика, поднятые наверх.

В результате помимо самого сообщения и методов по его доставке был образован один из важнейших компонентов в виде преобразования полученных сведений или кодирование. При его отсутствии вы не сможете передать информацию.


Стоит добавить, что стандартная разговорная либо письменная речь также представляют собой своеобразную кодировку. В процессе изучения иностранных языков человек изучает новые звуковые и буквенные коды предметов и процессов, с которыми он знаком с детства.

По мере развития человечества возникали новые способы передачи срочных сообщений. Так, в 1831 году Майклом Фарадеем было сделано открытие, которое смогло перевернуть все взгляды: он смог открыть метод, по которому можно было получить электрический ток, которые почти сразу использовали, чтобы передавать разного рода сообщения[3].

Американским изобретателем С. Морзе были созданы и внедрены телеграфы и линии связи[4]. Морзе также создал язык, который похож на африканский барабанный телеграф. Нужно отметить, что у электрического тока и барабана совсем небольшой собственный язык. По барабану могут стучать или нет, электрический ток проходит или не проходит. Аналогично и кодирование Морзе применяло только три специальные буквы в виде длинного сигнала (тире), короткого сигнала (точки), нет сигнала (паузы), чтобы разделять буквы. Поэтому известный сигнал спасения SOS, который означает спасите наши души (Save Our Souls), поддается кодировке в следующем виде:

<точка>, <точка>, <точка> - S

<пауза>

<тире>, <тире>, <тире> - O

<пауза>

<точка>, <точка>, <точка> - S[5]

Азбука Морзе 150 лет служила людям. Ее сигналы могли пробиваться при непогоде, которая глушила всякую речь. Только недавно с появлением спутников связи, ее перестали использовать. Все попытки по созданию машины, которая понимала бы код Морзе, провалились. Созданная техника была то очень большой, то ненадежной и слишком затратной. Конечно, машины, созданные в то время, были несовершенными по сравнению с современными, но и сам код оказался сложным для автоматов.

В 1933 году В.А.Котельников для участия в «I Всесоюзном съезде по вопросам технической реконструкции связи» написал труд «О пропускной способности «эфира» и «проволоки»». Кроме того, его имя входит в название одной из основных теорем теории кодирования, которая помогает определить условия, при которых переданный сигнал можно восстановить, не теряя при этом информации. Данная теорема имеет несколько названий, среди которых «теорема WKS» (первые буквы фамилий ученых Whittaker, Kotelnikov, Shannon). Российские учебники для ВУЗов используют название «теорема Котельникова».[6]


Стоит отметить, что эту теорему отличает долгая история. Так, первая ее часть была доказана французским математиком Э. Борелем. В 1915 году над ее доказательством работал Э. Уиттекер. В 1920 году японцем К. Огурой были опубликованы поправки к работе Уиттекера, в 1928 году американским ученым Гарри Найквистом были уточнены принципы оцифрования и восстановления аналоговых сигналов.

В середине двадцатого века Алан Тьюринг и его команда в столице Великобритании создали компьютеры, которым было под силу обработать буквы и цифры, другими словами символьные данные. В пригороде Лондона в 1943 году им удалось создать компьютер, получивший название Колосс, который смог расшифровать военные коды немцев.[7] Все неприятельские сообщения, которые были перехвачены за один день, вводили в память компьютера, который для поиска соответствий перебирал сотни тысяч вариаций, благодаря чему расшифровке поддавались самые сложные коды.

Пик развития теории связи пришелся на послевоенное время (1948-1949 гг.) после появления работ Клода Шеннона и Норберта Винера. Труд Винера явился следствием исследований военного периода по автоматическому управлению огнем, произведения К. Шеннона: "Математическая теория связи" и "Связь при наличии шума" являются исследованиями по шифрованию сообщений и их передачи по секретным каналам связи.

Итак, с 1949 года началось бурное развитие теории кодирования как отдельной научной дисциплины, а также развитие таких тесно с нею связанных научных дисциплин, как сжатие информации и криптология[8].

Актуальность: По причине повсеместного распространения персональных компьютеров как средств, обрабатывающих данные, так и оперативных устройств общения (электронная почта, телефаксный способ передачи информации), могут появиться трудности с обеспечением защиты данных от преднамеренных искажений. Для предотвращения подобного появляется необходимость в проведении процесса кодировки сведений. Поэтому в современном мире кодирование всякого рода данных играет основную роль и является актуальной.

Объект: Информационные процессы

Предмет: Кодирование информации

Целью написания данной курсовой работы является закрепление знаний, которые были получены в ходе изучения учебной дисциплины «Технологии программирования», рассмотрение особенностей кодировки данных в системе обработки информации.

Задачи работы: определить понятие и роль кодирования данных, рассмотреть методы кодировки; провести анализ особенностей кодирования разных видов данных в системах обработки информации и изучить теорию кодирования.


Глава I. Определение понятия «кодирование информации» и его значение в дисциплине «Технологии программирования»

Понятие и значение кодирования информации

Любая тайна, порожденная человеческим сознанием,

им же может быть и раскрыта.

Шерлок Холмс

В нашей повседневной жизни мы постоянно обмениваемся информацией. По мнению Норберта Винера, одного из создателей современной теории информации, информация есть информация, а не материя или энергия[9].

Винер полагал, что информация предстает новым элементом в дополнении к материи и энергии. Важность информации можно сравнить с трудностью ее представления в естественнонаучной форме.

Мы можем слышать фразу от собеседника «Эта информация важна для меня», при конкретной ситуации либо событии. Но при техническом представлении информации подобное субъективное представление не подойдет. В качестве строгого научного понятия, ее необходимо вводить как измеряемую величину, подобно длине в метрах, напряжению в вольтах.[10]

Любая система подразумевает передачу информации в виде сообщений, представляющих собой совокупность знаков, или беспрерывных сигналов, которые выступают переносчиками информации.

Степень качества информации считают одной из важнейших характеристик для потребителей данных. Его определяют такими характеристиками как[11]:

Репрезентативность – представляет собой правильный выбор информационных источников, который помогает должным образом отразить источник данных;

Достаточность- наименьший, но нужный объем данных, который необходим для целей, которые имеет пользователь информационных источников. В данном случае наличие неполной, либо наоборот избыточной информации может снизить эффективное принятие решений потребителем информации;

Доступность- отсутствие затруднений в процессе нахождения и преобразования данных. Так, информационная система предусматривает передачу информации в доступном и удобном для понимания потребителя виде;

Актуальность- данную характеристику определяет степень сохранения ценности данных во время их использования, которая зависит от временного отрезка, который прошел со времени появления этих сведений;

Своевременность- поступление информации не позднее намеченного времени, которое согласовано с периодом, необходимым для решения поставленных задач;


Точность- уровень сходства передаваемых данных с реальным состоянием предмета, явления, ситуации и так далее;

Адекватность- процент соответствия создаваемых с помощью полученных данных образов с реальным объектом, процессом, явлением и так далее;

Устойчивость- свойство реагирования информации на возможные изменения первоначальных данных, не нарушая при этом необходимую точность;

Сообщения подразделяются на несколько видов:

Дискретные- являются результатом поочередной выдачи источником сообщений отдельных частей-знаков. В этом случае все различные знаки называются «алфавит сообщения», размер множества- объем алфавита;

Непрерывные- делятся на элементы, их можно описать посредством непрерывных сигналов-функций времени, которые принимают значения из непрерывного континиума.

Среду, которая передает сообщения между источником и приемником сообщений, называют канал связи или канал передачи информации. При этом трансформация сообщения в сигнал, который подходит для передачи по определенному каналу связи в широком смысле называют кодированием; обратную последовательность называют декодированием[12].

Другими словами, кодирование информации представляет собой процесс превращения одной последовательности сигналов в другую. Под кодированием сведений понимают выражение данных одного вида через другой. Чтобы автоматизировать информацию, которая относится к различным типам, следует провести процесс ее унификации для представления. В этом случае специалистами используется методика кодирования.

По мере развития информационных технологий кодирование заняло центральное место в вопросах решения различных задач программирования[13]:

  • Представление данных разного вида (числовые, текстовые, графические) в памяти компьютера;
  • Обеспечение помехоустойчивости в процессе передачи данных по каналам связи;
  • Сжатие информации в базах данных.

Выше уже было дано определение понятию «кодирование информации», однако для лучшего понимания необходимо рассмотреть другие понятия, которые помогут в полном изучении темы.

  • Код - представляет собой систему соответствия между частями сообщений и кодовой комбинацией.
  • Кодер- устройство, которое осуществляет кодирование.
  • Декодер- устройство, которое проводит обратное действие, другими словами преобразует кодовую комбинацию в сообщение.
  • Алфавит- представляет собой множество составных частей кода или элементарные символы (кодовые символы) X = {xi}, гдеi = 1, 2, ..., m
  • Основание- количество элементов кода- m. В случае двоичного кода xi = {0, 1} и m = 2.
  • Кодовая комбинация (кодовое слово) является конечной последовательностью символов определенного алфавита.
  • Значность (длина комбинации) является числом элементов кодовой комбинации-n.
  • Объем либо мощность кода представляет собой число разных кодовых комбинаций (N = mn)[14].