Файл: Методы кодирования данных (Кодирование информации).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 13.03.2024

Просмотров: 25

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

В oc разных oc странах oc используются oc различные oc виды oc штриховых oc кодов. oc В oc каждом oc из oc них oc установлено oc определенное oc соотношение oc между oc широкими oc и oc узкими oc полосками oc и oc между oc полосками oc и oc интервалами oc между oc ними. oc Так, oc в oc "Коде oc 39" oc каждому oc знаку oc цифрового oc кода oc соответствует oc комбинация oc из oc девяти oc элементов oc (три oc широких oc полоски oc и oc шесть oc узких) oc и oc из oc них oc пять oc штрихов oc и oc четыре oc интервала oc между oc ними.

Разработка oc штриховых oc кодов oc осуществляется oc Международной oc ассоциацией oc по oc нумерации oc (ЕАН), oc коды oc которой oc являются oc наиболее oc распространенными oc в oc Европе. oc Наша oc страна oc с oc 1987 oc года oc также oc стала oc членом oc ЕАН. oc В oc 1988 oc году oc Госстандарт oc СССР oc утвердил oc РД oc 50-666-88 oc "Методические oc указания. oc Присвоение oc цифровых oc кодов oc товарам oc народного oc потребления". oc Этим oc документом oc устанавливались oc правила oc присвоения oc товарам oc народного oc потребления oc цифровых oc (торговых) oc кодов. oc Эти oc цифровые oc коды oc служат oc основой oc для oc штриховых oc кодов, oc наносимых oc на oc ярлыки, oc упаковку oc и oc этикетки oc товаров. oc Такой oc цифровой oc (торговый) oc код oc строится oc в oc полном oc соответствии oc с oc кодом oc ЕАН-13. oc Он oc состоит oc из oc тринадцати oc разрядов oc и oc имеет oc следующую oc структуру:

  • 1. 2 знака - идентификатор страны-изготовителя товара;
  • 2. 5 знаков - идентификатор фирмы-изготовителя товара;
  • 3. 5 знаков - идентификатор товара;
  • 4. 1 знак - контрольное число.

В этом коде, например, США и Канада oc имеют oc идентификаторы oc с oc 00 oc до oc 09, oc Франция oc - oc с oc 30 oc до oc 37, oc ФРГ oc - oc с oc 40 oc до oc 43, oc СНГ oc - oc 46, oc Япония oc - oc 49, oc Италия oc -с oc 80 oc до oc 83, oc Корея oc -88 oc и oc так oc далее.

В oc штриховом oc коде, oc построенном oc на oc основе oc ЕАН-13, oc каждому oc знаку oc цифрового oc кода oc соответствует oc комбинация oc из oc семи oc элементов oc - oc штрихов oc и oc пробелов oc между oc ними.

Штриховые oc коды oc могут oc использоваться oc кроме oc торговли oc также oc в oc таких oc областях, oc как oc медицина, oc банковское oc дело, oc промышленность oc и oc других. oc При oc этом oc в oc качестве oc цифровых oc кодов oc для oc них oc могут oc использоваться oc коды oc классификаторов oc ТЭСИ.

Использование oc кодов oc ТЭСИ oc требует oc обеспечения oc высокой oc степени oc достоверности oc кодированной oc информации. oc В oc классификаторах oc ТЭСИ oc для oc выявления oc ошибок oc в oc кодах oc используется oc метод oc контрольных oc чисел.

Контроль oc правильности oc записи oc кодов oc при oc обработке oc информация oc основан oc на oc принципе oc делимости oc чисел. oc Иначе oc его oc называют oc контролем oc по oc модулю. oc Суть oc метода oc заключается oc в oc том, oc что oc к oc коду oc добавляется oc ещё oc один oc проверочный oc знак oc --контрольное oc число, oc связанный oc с oc кодом oc определенной oc математической oc зависимостью. oc При oc вводе oc кодированной oc информации oc в oc базу oc данных, oc ее oc обработке oc или oc использовании oc в oc ЭВМ oc специальной oc программой oc контроля oc выполняется oc проверка oc этой oc зависимости oc по oc каждому oc коду. oc Если oc зависимость oc нарушается, oc машина oc выдает oc информацию oc о oc наличии oc ошибки oc в oc коде.


Контроль oc по oc модулю oc широко oc используется oc в oc классификаторах oc ТЭСИ oc как oc у oc нас oc в oc стране, oc так oc и oc за oc рубежом. oc В oc качестве oc модуля oc используют oc различные oc числа, oc но oc наибольшее oc распространение oc получил oc в oc настоящее oc время oc контроль oc по oc модулю oc 11. oc Для oc общероссийских oc классификаторов oc расчет oc контрольных oc чисел oc осуществляется oc в oc соответствии oc с oc методикой, oc разработанной oc ВНИИКИ". oc В oc соответствии oc с oc этой oc методикой oc контрольным oc числом oc является oc остаток oc от oc деления oc на oc 11 oc суммы oc произведений oc весов oc на oc значения oc разрядов oc кода. oc Весом oc (весовым oc коэффициентом) oc является oc порядковый oc номер oc разряда oc в oc коде oc слева oc направо.

Формула, oc по oc которой oc вычисляется oc контрольное oc число, oc имеет oc следующий oc вид:

КЧ=? oc aixi-11

где oc КЧ oc - oc контрольное oc число oc по oc модулю oc 11,

ai oc - oc вес oc i-го oc разряда oc кода,

xi oc - oc значение oc I oc -го oc разряда oc кода,

? oc aixi oc - oc модуль oc 11, oc т.е oc целая oc часть oc суммы oc произведений oc значений oc разрядов oc кода oc на oc их oc веса.

Методика oc ВНИИКИ oc предлагает oc использовать oc в oc качестве oc весов oc натуральный oc ряд oc чисел oc от oc 1 oc до oc 10. oc Если oc разрядность oc кода oc больше oc 10, oc то oc набор oc весов oc повторяется. oc При oc использовании oc данного oc метода oc остаток oc может oc получить oc значение oc от oc 0 oc до oc 10. oc Так oc как oc методика oc предусматривает oc использование oc одноразрядных oc контрольных oc чисел, oc то oc при oc получении oc остатка, oc равного oc 10, oc следует oc сделать oc повторный oc расчет oc контрольного oc числа oc со oc сдвигом oc строки oc весов. oc В oc этом oc случае oc весовой oc ряд oc начинается oc с oc 3 oc до oc 10, oc а oc если oc разрядность oc кода oc больше, oc то oc дальше oc веса oc идут oc с oc 1 oc до oc 10. oc В oc случае oc повторного oc получения oc контрольного oc числа, oc равного oc 10, oc в oc качестве oc контрольного oc числа oc используется oc 0. oc В oc случае, oc если oc сумма oc произведений oc весов oc на oc значения oc разрядов oc получается oc меньше oc 10, oc то oc эта oc сумма oc и oc является oc контрольным oc числом.

Использование oc контрольных oc чисел oc обеспечивает oc возможность oc обнаруживать oc и oc исправлять oc ошибки oc в oc кодированной oc документной oc информации, oc что oc повышает oc ее oc достоверность.

КОДИРОВАНИЕ ИНФОРМАЦИИ

Код – это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.


Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Обычно каждый образ при кодировании (иногда говорят – шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

В более узком смысле под термином "кодирование" часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

На компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

 КОДИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Начиная с конца 60-х годов, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).


Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.

Традиционно для кодирования одного символа используется количество информации, равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события): К = 2= 28 = 256, т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Такое количество символов вполне достаточно для пред­ставления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

В процессе вывода символа на экран компьютера произ­водится обратный процесс — декодирование, то есть преоб­разование кода символа в его изображение. Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой табли­це.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.


ВИДЫ ТАБЛИЦ КОДИРОВОК

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для информационного обмена), кодирующая первую половину символов с числовыми кодами от 0 до 127 ( коды от 0 до 32 отведены не символам, а функциональным клавишам).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Порядковый номер

Код

Символ

0 - 31

00000000 - 00011111

Символы с номерами от 0 до 31 принято называть управляющими.

Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

32 - 127

0100000 - 01111111

Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.

Символ 32 - пробел, т.е. пустая позиция в тексте.

Все остальные отражаются определенными знаками.

128 - 255

10000000 - 11111111

Альтернативная часть таблицы (русская).

Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.

Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Первая половина таблицы кодов ASCII

Обращается внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.