Файл: Крулькевич, М. И. Основы систем производственно-экономической информации учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 69

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 3. С татистическое к оди ров ан и е

Сжатие данных с использованием статистического коди­ рования представляет сббой сокращение среднего числа сим­ волов, передаваемых в кодах по каналам связи и хранимых в памяти ЭВМ, для чего при статистическом кодировании элементам сообщений с высокой вероятностью появления ставятся в соответствие более короткие кодовые комбинации.

Априори, зная статистические свойства источника сооб­ щения, можно минимизировать среднее число двоичных или* иных символов, требующихся для выражения одного элемен­ та сообщения, что в итоге позволяет уменьшить время пере­ дачи информации и объем запоминающих устройств ЭВМ.

В основу статистического кодирования положена теоре­ ма Шеннона о кодировании для дискретного капала без по­ мех. Согласно теореме, если источник информации имеет эн­ тропию Н единиц информации на символ сообщения, а ка­ нал связи обладает пропускной способностью С единиц ин­ формации в единицу времени, то сообщения источника всегда можно закодировать таким образом, чтобы скорость V' их передачи была сколь угодно близкой к величине, определяе­ мой соотношением

и не существует способа кодирования, позволяющего достичь таково положения, чтобы выполнить неравенство V>V z . При этом величину H'=VH называют потоком информации, созда­ ваемой источником.

Теорема фактически не указывает конкретного способа кодирования, но из нее следует весьма важное свойство, что при выборе каждого символа кодовой комбинации необ­ ходимо стараться, чтобы он нес максимальную информацию.

Другими словами, по возможности каждый символ со­ общения должен принимать значения 0 и 1 с равными веро­ ятностями, 'и каждый выбор должен быть независим от. зна­ чений предыдущих символов.

Рассмотрим следующий пример. Пусть необходимо оп­ тимально закодировать наименование некоторых материа-

78

лов, отпускаемых со склада. Перечень материалов и вероят­ ность запроса на них представлены в табл. 5.

 

 

 

 

 

Таблица 5

 

 

Частота

Традиционмое

Статистическое

 

 

кодирование

кодирование

 

Наименование

или

 

материала

вероятность

код

КОЛ-ВО

код

КОЛ-ВО

 

 

запроса

СИМВО­

симво­

 

 

 

 

ЛОВ

 

лов

1.

Бензин

0,15

0

1

11

2

2.

Керосин

0,10

1

1

100

3

3.

Нигрол

0,05

10

2

1

3

4.

1— 13

0.3

11

й

0

1

5.

Солидол

0,18

100

3

10

2

6.

Графитная смазка

0,22

101

3

101

1

С учетом вероятности запроса на представление и пере­ дачу всех сообщений о материалах необходимо затратить в среднем двоичных символов

i= m

О = 2 Pi ni , i=i

где Pj — вероятность запроса на i-й материал;

n г — количество двоичных символов в коде i-ro мате­ риала.

В нашем случае; а) при традиционном кодировании

Q=0,15-1+0,10-1+0,05-2+0,3-2+0,18-2 + 0,22-3= 1,9'

дв. символов; б) при использовании теоремы Шеннона

<3 = 0,15-2 + 0,10-3+0,05-3+0,3-1+0,18-2+0,22-1 = 1,63 дв. сим­ волов.

Таким образом, использование принципов статистичес­ кого кодирования позволяет в данном случае сократить коли­ чество двоичных символов, необходимых для передачи сооб­ щений или ^отражения в соответствующих документах про­ цесса движения материалов, примерно на 20%.

79



Способы статистического кодирования различны и за­ висят они от статистики передаваемых сообщений. Обычно для сообщения со статистически независимыми элементами наиболее эффективным является либо поэлементное.описание оптимальными кодами, когда энтропия распределения эле­ ментов близка к единице, либо кодирование укрупненных блоков элементов исходного сообщения, когда энтропия рас­ пределения меньше единицы.

Известны две основные разновидности методов статисти­ ческого кодирования — пеадаптцвное и адаптивное.

Неадаптивные методы используются в том случае, ког­ да статистика сообщений априори известна. Если же инфор­ мации о статистике сообщений нет, то применение неадап­ тивных методов статистического кодированияможет не при­ вести к сокращению избыточности данных, а иногда даже увеличить ее.

В случае использования адаптивных методов процесс статистического кодирования осуществляется на основе дан­ ных о статистике передаваемого сообщения, полученных са ­ мим кодирующим устройством..

Необходимость передачи разделительного знака между элементами сообщений снижает эффект неадаптивного ста­ тистического кодирования. В связи с этим применение извест­ ного способа классического кодирования по Шеннону-Фано к сообщениям с низкой энтропией и некоррелированными символами нецелесообразно.

Из адаптивных методов статистического кодирования можно отметить метод представления сообщений кодами пе­ ременной длительности. Данный метод позволяет устранить е кодовых посылках нули, не несущие никакой информации, п служащие лишь д^тя выделения границ элементов сообще­ ния.

Организация сжатия информации с использованием данного способа является весьма сложной.

• В какой-то мере аналогичные адаптивному статистичес­ кому кодированию принципы используются в так называе­ мом матричном кодировании, которое применяется, напри­ мер, для уплотнения кодов монотонно изменяющихся или периодически повторяющихся чисел.

80

§ 4. А п ер тур н ое сж а т и е

Метод апертурного сжатия состоит в устранении тех выборок передаваемых сообщений, которые можно восстано­ вить путем анализа предшествующих или последующих вы­ борок, а также путем сопоставления с эталонными функция­ ми или графиками.

Основным критерием выделения избыточности в данном методе является полоса допустимого отклонения, или апер­ тура. Базируются способы либо на предсказании по преды­ дущим выборкам, либо на апостериорной интерполяции по­ следующих выборок. Размеры апертуры, исходя из требова­ ний потребителя информации, могут быть различными.

Сжатие информации при использовании апертурных ме­ тодов связано с частично допустимой потерей информации.

Потеря возникает в результате пороговой фильтрации данных в процессе сокращения избыточности. Ценным при использовании данного метода является то, что исходная информация может быть восстановлена с требуемой для потребителя точностью, а также то, что он позволяет по­ лучить очень высокие коэффициенты сжатия.

Относительная простота в реализации и высокая эффек­ тивность способствуют широкому распространению метода в настоящее время.

Практическое применение могул найти три следующих разновидности метода апертурного, сжатия:

а)

с квантованием;

■;

б) с априорной функцией;

 

в)

с предсказанием.

 

Апертурное сжатие с квантованием представляет собой дискретизацию исходной непрерывной функции конечным числом точек. Минимальный объем сообщения получается в том случае; когда шаг квантования берется настолько боль­ шим, насколько это возможно при условии незаметности потребителем искажений исходной функции за счет дискре­ тизации.

При квантовании по уровню и по времени непрерывная величина как бы накладывается на сетку с координатами уровня и времени. Интервалы по времени т определяет шаг

6 834

81


квантования по контролируемой функции, величина которо­ го равна

А У, = у, — у,_1,

Значение уровня, удовлетворяющее неравенству

Уi —1< У < yi

,

 

 

округляется до величины,

незначительной

для

выбранного

интервала. Совокупность

значений

\л (i=l,

2,

..., п), до ко­

торых округляются значения у, определяет дискретную шка­ лу преобразования и называется уровнем квантования.

При одинаково выбранных Лул квантование называется равномерным. В практике такой вид квантования наиболее распространен.

Выбор числа уровней квантования зависит от разреша­ ющей способности датчика и от требуемой точности ввода соответствующего параметра в ЭВМ.

При выборе интервала т приходится учитывать нали­ чие автокорреляционной зависимости между соседними от­ счетами. Влияние медленных нестационарных изменений контролируемой переменной наблюдаться не должно.

В качестве примера неудачного использования метода

апертурного

сжатия

с квантованием

можно .

привести

способ дискретизации,

примененный

в

шахтной

системе

ЛИСТ. Выдача на печать результатов

работы

комплексов

КМ-87 через каждые 15 минут ничем

не обоснована. Безус­

ловно, сжатие информации в системе

осуществляется,

но не

в достаточной мере эффективно. Основной причиной

явля­

ется то, что

запросы

потребителя информации

не

изучены,

н исходная функция не анализировалась перед проектирова­ нием системыконтроля.

Апертурное сжатие с априорной функцией во многом аналогично разностному кодированию. Отличие состоит толь­ ко в том, что информация о приращении в данном случае передается только в те моменты времени, когда отклонения текущих значений функции от априори заданного закона из­ менения превосходят размеры установленной апертуры или зоны допустимого отклонения.

Размеры апертур

для разных участков

передаваемой

функции могут быть

одинаковы и различны.

Это зависит

от требований, предъявляемых потребителям

информации.

82


Применение данного способа возможно в том случае, ког­ да на основании полученных ранее статистик можно предпо­ ложить об аналогичном характере поведения контролируе­ мого процесса в последующие моменты времени. Наличие априорных сведений дает возможность использовать в каче­ стве критерия величину допустимого отклонения действи­ тельного хода наблюдаемой ' функции от предполагаемой. На основании такого критерия в процессе анализа можно ус­ тановить избыточность той или иной выборки. Избыточными при этом считаются те выборки, которые не выходят за гра­ ницы установленного для данной области допуска. Неизбы­ точными являются те, которые превышают границы аперту­ ры и определяют существенное изменение в характере изме­ нения исходной функции.

Таким образом, апертура определяется как разность ко­ ординат верхней зоны и планового уровня, то есть

а = hB( ti ); —hn ( t, ) »= Ah ( ti ).

На приемной стороне имеется плановый график процес­ са нарастания объема, а через выбранные интервалы времени

ей передаются

величины отклонения с указанием соответ­

ствующего знака.

 

 

Эффект от применения данного метода сжатия инфор­

мации может

быть оценен с помощью соотношения

 

N

hcp( t,

)

 

2

 

s - i f

1 ’

.

 

2 A h ( t,

)

 

j= l

 

Нетрудно оценить и более высокую эффективность дан­ ного способа по сравнению с разностным кодированием,- Для этого значение знаменателя в данном соотношении достаточ-

N

но разделить на cvmmv 2 А Ь(ф ), i=l

где j = 1,2, ..., n — количество существенных выборок; Ah (ti ) — величина отклонения от допустимой зоны.

Так как n < N и Л hcp( ti ) < Л h( ti ), то S' < 1.

Причем, чем меньше S', тем эффективнее способ апертурно­ го сжатия по сравнению с разностным кодированием.

Апертурное сжатие с предсказанием осуществляется сле­

дующим

образом.

 

 

По

предыдущим

значениям выборок контролируемого

процесса

вычисляются

значения следующей выборки. Если

разность

между фактической выборкой у (t)

и предсказан­

ной у' (t) находится в допустимых пределах,

то считается,

что предсказание осуществляется правильно и выборка у (t) из дальнейшего рассмотрения устраняется как избыточная. В противном случае она передается потребителю инфор­ мации.

Наиболее удобно в практике использовать в качестве предсказателя полином Ньютона нулевого порядка. Этот предсказатель работает по принципу: каждая последующая выборка сообщения равна по величине последней передан­ ной неизбыточной выборке в пределах заданной полосы до­ пусков, то есть

У'« ( О - У . ( t - 1),

где Yi (t—1) — значение предыдущей неизбыгочной вы­ борки.

Вычисленное в момент появления неизбыточной выбор­ ки значение У'| (t) принимается за эталонное для всех в по­ следующем поступающих выборок до появления очередного

неизбыточного значения.

г

Если предсказание точное, то новая выборка обязатель­ но попадет в одну и ту же зону с эталонной величиной. Раз­ меры апертуры в каждом конкретном случае задаются заранее приемником информации, исходя из характера изменения контролируемого процесса и требуемой точности информационных данных. Для определения значения апер­ туры можно использовать выражение

h = ^ 1 0 0 % ,

84