Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 132

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

7)

 

 

словарь словоформ для декодирования

наименований понятий

(словоформы представлены в побуквенном коде).

 

 

 

 

 

Введем следующие условные обозначения:

 

 

 

 

 

 

X

— количество элементарных сообщений;

 

 

 

 

 

 

Пі — длина

машинного кода

элементарного

сообщения (в

двоич­

L

 

 

ных знаках);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

— количество различных наименований понятий;

 

 

 

 

«2

— длина

номера

наименования

понятия

(в двоичных знаках);

к

 

— количество различных основ слов в

наименованиях

поня­

к

 

 

тий;

номера

основы

слова

двоичных знаках);

 

 

длина

 

Пз — количество различных значений характеристик;

 

 

 

 

 

 

— длина

номера

значения

характеристики

(в двоичных зна­

 

 

 

ках);

 

 

 

различных

словоформ в

наименованиях

поня­

я4— количество

 

 

 

 

тий;

номера

словоформы

(в двоичных знаках);

 

 

к

 

-— длина

 

 

я5 — общее

количество

номеров

наименований понятий

в

клас­

к

 

 

сификационном словаре;

 

 

кода

наименования

понятия

 

 

— средняя

длина

пословного

 

к

 

 

в С Н П

 

(в двоичных знаках);

наименования

понятия

 

 

— средняя

длина

пословного

 

кода

к

 

 

в словаре, предназначенном для декодирования сообщений

 

 

 

 

(в двоичных знаках);

 

 

кода

основы

слова

по

словарю

 

 

—-средняя

длина

буквенного

к

 

 

 

(в буквах)

 

*{

буквенного

кода

словоформы

по

словарю

к

— средняя

длина

 

 

 

 

(в буквах);

 

буквенного

кода

значения характеристики

 

 

— средняя

длина

V

 

 

по словарю

(в буквах);

 

в

наименовании

понятия;

 

 

Гер — среднее

количество

слов

 

 

к о

 

— объем

классификационного

 

словаря понятий

двоичных

 

 

 

знаках);

 

 

 

 

 

 

 

между

элементами

 

сообщения

 

— длина

кода отношения

 

 

kiß rrii

 

 

(в двоичных знаках);

 

 

 

Нижние

индексы

этих

пара­

 

— параметры

 

формулы (16.1).

 

 

 

метров совпадают с соответствующими нижними индексами

 

 

 

величин

/г, 0 = 1 , 2, 3,...).

 

 

 

 

 

 

 

 

 

 

Длина кода элементарцого сообщения может быть определена

как сумма длин кодов его компонент:

 

 

 

 

 

 

(16.10)

 

 

 

 

 

 

 

 

 

 

к

 

к ,

 

 

 

 

 

 

Длина

кодов

 

 

L = 2 l i + k + k o -

в свою очередь, может быть

компонент

 

и

 

 

приближенно выражена через логарифм соответствующихк и к ъ

величин я.

При этом величины я могут быть

определены

на основе

данных

табл.

16.1.

Подставляя

выражения для

 

 

формулу

(16.10),

придем к выражению вида L -= a x + b 1lo g 2 x ,

 

 

 

 

 

 

 

где

 

 

 

ai = 2

log2 Äi + logü

k3+ l K0; b l = 2m l +

m 3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

* В дальнейшем мы будем считать, что буквы кодируются ком­ бинациями из шести двоичных разрядов.

2 76


Длина

элементарного

формализованного

сообщения в буквен­

ном коде,

до его ввода в

машину, в среднем

равна величине

L ' = Q(2r срД ф.ср + ізн.ср) + / ко-

(^сф.ср — средняя длина слова в тексте; /зн.с р — средняя длина бук­ венного кода значения характеристики в массиве сообщений). Сле­ довательно, коэффициент сжатия сообщений

 

 

 

U

 

 

U

(16.11)

 

 

 

каж =

L

a .- H i l o g ,* '

Как видно из (16.11), при

Іѵвозрастании объема х массива сооб­

щений коэффициент сжатия йсда уменьшается. Обращаясь к данным

табл.

16.1

и 16.11 и полагаяксж =о=6,

получим, что

в фактографиче­

ской

И П С

для

л:== 103 йсш = 17,5;

для

х = 8 - 1 0 3 £Сж = 19,2; для * =

= 105 £ СЖ = П ,9;

для х = 1 0 6

 

10,3.

 

 

При оценке степени сжатия информации мы не учитывали не­

обходимости хранения в памяти

ЭВ М

словарей. Определим объем

словарной информации, необходимой для функционирования фак­ тографической И П С .

 

1. Объем словаря основ слов

 

(в двоичных знаках);

где

 

 

 

 

а т а = то, =

6

п г1і = Ы^к^х”1* ,

 

 

k0 =

k'[t,k 2,

 

 

 

 

 

 

 

 

 

 

 

 

лт2.

 

 

 

 

 

 

 

 

 

2. Объем словаря наименований понятий для перевода сооб­

щений с русского языка на информационный,

 

 

 

3.

 

ѵ2

=

logs «г =

Topfe!*'” ' (logs fe0 -f- /и„ logs * ) .

 

Объем классификационного словаря понятий:

 

4.

 

0 ) = к ьп ^ і 1 1

=

 

k j t f *

хт'т>(logs fe, + ш , log2 х).

 

Объем словаря значений характеристик:

 

 

 

 

 

 

 

Ѵі

=

6л,/9 = 6

12к3х тъ.

 

 

 

5. Объем словаря наименований понятий для декодирования

сообщений:

Т0РЯ, logs «4 =

 

Тсpfe!*m' flogs ( к ? ‘ fe4) +

от,/и* logs X ].

 

 

Ѵъ —

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6. Объем словаря словоформ для декодирования наименований

понятий:

 

 

ив =

 

n J z

=

 

6/sfe4fe|”* х'”1'”* .

 

 

 

 

 

 

 

6

 

 

 

 

 

Суммарный объем массивов словарей равен

 

 

 

 

 

 

V =

1>1 +

Ü2 +

 

 

 

5

0

 

 

 

 

 

 

 

Ѵз + Цд+ О + Ü .

 

 

Введем величину относительного объема словарей:

Тощ а

с учетом

 

 

 

 

 

 

R

=

ѵ/х.

 

 

 

необходимости хранения словарей коэффициент сж а ­

тия сообщений может быть определен согласно формуле

 

 

 

 

 

 

 

 

k 'cm = L ' f ( L + R ) .

 

( 6. 12)

1 9 — 3 1 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

277

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


На основех =данных8 ■ ІО3 /г'сжтабл. 16.1 и 16.11 находим:/г'Сж

 

 

 

 

 

для объема f eсообщений х = 1 0 3 /:'сж = 3,14;

= 9,3;k 'аук

 

 

 

для

х = 1 0 6

 

 

= 7,86; для

х = 1 0 5

 

L

 

 

для

'c > K

= 9,3.

 

 

 

 

 

 

 

 

 

При

х = 1 0 6 коэффициент

сжатия

сообщений

достигает

мак­

симального значения

Rформуле (16.12)

величина

 

— монотонно

возрастающая, величина

 

— монотонно убывающая).

 

 

 

Отношение объема словарей к объему массива сообщений мож­

но определить как величину

d — R IL .

 

что для

х = 1 0 3 d=4 ,6 ;

Произведя необходимыеk'cm

d

вычисления,

найдем,

для х = 8 - 1 0 3

d = l ,l ;

для x = 1 0 5

d =

0,28;

для

%=106

d = 0 ,ll.

 

Величины

 

 

и

 

были

определены

в

предположении,

что

длина ячейки памяти машины не оказывает влияния на объемы

массивов

сообщений и словарей. Это ограничение может быть сня­

то, если

обратиться к формуле (16.8).

Г л а в а 17 ТЕХНИЧЕСКИЕ СРЕДСТВА АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Классификация технических средств

Технические средства АСУ, с помощью которых реа­ лизуются АИС, можно условно разделить на следующие основные группы в соответствии с выполняемыми ими

функциями, назначением

и местом в системе:

— средства,

предназначенные для обработки инфор­

мации,— ЭВМ и комплексы ЭВМ;

между элементами

— средства

обмена

данными

АСУ — технические средства связи,

средства коммута­

ции, контроля, преобразования сигналов, повышения до­ стоверности передаваемой информации и т. д.;

— средства оконечных объектов (органов-) АСУ, вклю­ чающие аппаратуру преобразования и распределения информации, аппаратуру ввода — вывода данных, пред­ ставленных в различных формах и на различных носите­ лях информации; средства отображения, документирова­ ния, размножения, подготовки и контроля подготовки информации, а также специальные рабочие места, обес­ печивающие работу операторов АСУ.

Центральное место среди перечисленных технических средств автоматизации процессов управления принадле­ жит электронной вычислительной технике. ЭВМ реали­ зуют вычислительный процесс, который в широком смыс-

'278


ле этого слова можно трактовать как процесс двусторон­ него обмена информацией между человеком и машиной и переработки информации в машине. Специальные вы числительные средства, предназначенные для обеспече­

ния решения таких

задач,

часто называют

и н ф о р м а ­

ц и о н н о - л о г и ч е с к и м и

электронными

вычислитель­

ными машинами

(ИЛ ЭВМ) или комплексами (ИЛ

ЭВК).

Заметим, что понятие «комплекс» часто имеет неод­ нозначное толкование. Оно может относиться либо к не­ скольким ЭВМ, либо к отдельной ЭВМ совместно со средствами обмена данными и техническими средствами оконечных объектов АСУ. Договоримся, что при даль­ нейшем изложении понятие «комплекс» будем относить к совместно работающим ЭВМ, т. е. ЭВМ, скомплексированным на уровне вычислителей (процессоров), памяти или так называемых каналов. Во всех остальных случа­ ях, включая соединенные линиями связи машины, будем говорить об отдельных ЭВМ, работающих в системе.

Отметим также, что разработка любой ЭВМ обычно ориентируется на решение некоторого класса определяю­ щих задач. В связи с этим деление ЭВМ на универсаль­ ные и специализированные весьма условно. Эта услов­ ность проявляется особенно сильно, когда мы рассма­ триваем ИЛ ЭВМ, в которых элементы универсальности выражены в значительно большей степени, чем в обыч­ ных ЭВМ, которые правильно называть у н и в е р с а л ь- н ы м и.

Существует, хотя и не очень четко определенное, де­ ление ЭВМ на первое, второе и третье поколения. В ос­ нове этого деления лежат особенности, обусловленные элементной базой ЭВМ. Так, первое поколение исполь­ зовало в качестве элементной базы электровакуумные приборы, второе связано с использованием полупровод­ никовой техники, а третье создавалось на основе микро­ электроники с малой степенью интеграции схем. Есть от­ дельные попытки перехода к созданию образцов вычи­ слительной техники четвертого поколения. В их основе лежат большие интегральные схемы (микроэлектроника с большой степенью интеграции схем). Если исходить из приведенной классификации, то возможности и особен­ ности современных ИЛ ЭВМ в значительной степени определяются возможностями машин второго и в основ­ ном третьего поколения. Это связано с тем, что период

19:

279