Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 132
Скачиваний: 3
7) |
|
|
словарь словоформ для декодирования |
наименований понятий |
|||||||||||||||||
(словоформы представлены в побуквенном коде). |
|
|
|
|
|
||||||||||||||||
Введем следующие условные обозначения: |
|
|
|
|
|
|
|||||||||||||||
X |
— количество элементарных сообщений; |
|
|
|
|
|
|
||||||||||||||
Пі — длина |
машинного кода |
элементарного |
сообщения (в |
двоич |
|||||||||||||||||
L |
|
|
ных знаках); |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
к |
|
— количество различных наименований понятий; |
|
|
|
|
|||||||||||||||
«2 |
— длина |
номера |
наименования |
понятия |
(в двоичных знаках); |
||||||||||||||||
к |
|
— количество различных основ слов в |
наименованиях |
поня |
|||||||||||||||||
к |
|
|
тий; |
номера |
основы |
слова |
(в |
двоичных знаках); |
|
||||||||||||
|
— |
длина |
|
||||||||||||||||||
Пз — количество различных значений характеристик; |
|
|
|
|
|||||||||||||||||
|
|
— длина |
номера |
значения |
характеристики |
(в двоичных зна |
|||||||||||||||
|
|
|
ках); |
|
|
|
различных |
словоформ в |
наименованиях |
поня |
|||||||||||
я4— количество |
|
||||||||||||||||||||
|
|
|
тий; |
номера |
словоформы |
(в двоичных знаках); |
|
|
|||||||||||||
к |
|
-— длина |
|
|
|||||||||||||||||
я5 — общее |
количество |
номеров |
наименований понятий |
в |
клас |
||||||||||||||||
к |
|
|
сификационном словаре; |
|
|
кода |
наименования |
понятия |
|||||||||||||
|
|
— средняя |
длина |
пословного |
|
||||||||||||||||
к |
|
|
в С Н П |
|
(в двоичных знаках); |
наименования |
понятия |
||||||||||||||
|
|
— средняя |
длина |
пословного |
|
кода |
|||||||||||||||
к |
|
|
в словаре, предназначенном для декодирования сообщений |
||||||||||||||||||
|
|
|
|
(в двоичных знаках); |
|
|
кода |
основы |
слова |
по |
словарю |
||||||||||
|
|
—-средняя |
длина |
буквенного |
|||||||||||||||||
к |
|
|
|
(в буквах) |
|
*{ |
буквенного |
кода |
словоформы |
по |
словарю |
||||||||||
к |
— средняя |
длина |
|||||||||||||||||||
|
|
|
|
(в буквах); |
|
буквенного |
кода |
значения характеристики |
|||||||||||||
|
|
— средняя |
длина |
||||||||||||||||||
V |
|
|
по словарю |
(в буквах); |
|
в |
наименовании |
понятия; |
|
|
|||||||||||
Гер — среднее |
количество |
слов |
|
|
|||||||||||||||||
к о |
|
— объем |
классификационного |
|
словаря понятий |
(в |
двоичных |
||||||||||||||
|
|
|
знаках); |
|
|
|
|
|
|
|
между |
элементами |
|
сообщения |
|||||||
|
— длина |
кода отношения |
|
|
|||||||||||||||||
kiß rrii |
|
|
(в двоичных знаках); |
|
|
|
Нижние |
индексы |
этих |
пара |
|||||||||||
|
— параметры |
|
формулы (16.1). |
||||||||||||||||||
|
|
|
метров совпадают с соответствующими нижними индексами |
||||||||||||||||||
|
|
|
величин |
/г, 0 = 1 , 2, 3,...). |
|
|
|
|
|
|
|
|
|
|
|||||||
Длина кода элементарцого сообщения может быть определена |
|||||||||||||||||||||
как сумма длин кодов его компонент: |
|
|
|
|
|
|
(16.10) |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
к |
|
к , |
|
|
|
|
|
|
|||
Длина |
кодов |
|
|
L = 2 l i + k + k o - |
в свою очередь, может быть |
||||||||||||||||
компонент |
|
и |
|
|
|||||||||||||||||
приближенно выражена через логарифм соответствующихк и к ъ |
величин я. |
||||||||||||||||||||
При этом величины я могут быть |
определены |
на основе |
данных |
||||||||||||||||||
табл. |
16.1. |
Подставляя |
выражения для |
|
|
формулу |
(16.10), |
||||||||||||||
придем к выражению вида L -= a x + b 1lo g 2 x , |
|
|
|
|
|
|
|
||||||||||||||
где |
|
|
|
ai = 2 |
log2 Äi + logü |
k3+ l K0; b l = 2m l + |
m 3. |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* В дальнейшем мы будем считать, что буквы кодируются ком бинациями из шести двоичных разрядов.
2 76
Длина |
элементарного |
формализованного |
сообщения в буквен |
ном коде, |
до его ввода в |
машину, в среднем |
равна величине |
L ' = Q(2r срД ф.ср + ізн.ср) + / ко-
(^сф.ср — средняя длина слова в тексте; /зн.с р — средняя длина бук венного кода значения характеристики в массиве сообщений). Сле довательно, коэффициент сжатия сообщений
|
|
|
U |
|
|
U |
(16.11) |
|
|
|
|
каж = |
L |
— |
a .- H i l o g ,* ' |
||
Как видно из (16.11), при |
Іѵвозрастании объема х массива сооб |
|||||||
щений коэффициент сжатия йсда уменьшается. Обращаясь к данным |
||||||||
табл. |
16.1 |
и 16.11 и полагаяксж =о=6, |
получим, что |
в фактографиче |
||||
ской |
И П С |
для |
л:== 103 йсш = 17,5; |
для |
х = 8 - 1 0 3 £Сж = 19,2; для * = |
|||
= 105 £ СЖ = П ,9; |
для х = 1 0 6 |
|
10,3. |
|
|
|||
При оценке степени сжатия информации мы не учитывали не |
||||||||
обходимости хранения в памяти |
ЭВ М |
словарей. Определим объем |
словарной информации, необходимой для функционирования фак тографической И П С .
|
1. Объем словаря основ слов |
|
(в двоичных знаках); |
||||||||||||||
где |
|
|
|
|
а т а = то, = |
6 |
п г1і = Ы^к^х”1* , |
|
|
||||||||
k0 = |
k'[t,k 2, |
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
лт2. |
|
|
|
|
|
|
|
|
|||||
|
2. Объем словаря наименований понятий для перевода сооб |
||||||||||||||||
щений с русского языка на информационный, |
|
|
|||||||||||||||
|
3. |
|
ѵ2 |
= |
logs «г = |
Topfe!*'” ' (logs fe0 -f- /и„ logs * ) . |
|||||||||||
|
Объем классификационного словаря понятий: |
||||||||||||||||
|
4. |
|
‘0 ) = к ьп ^ і 1 1 |
= |
|
k j t f * |
хт'т>(logs fe, + ш , log2 х). |
||||||||||
|
Объем словаря значений характеристик: |
|
|||||||||||||||
|
|
|
|
|
|
Ѵі |
= |
6л,/9 = 6 |
12к3х тъ. |
|
|
||||||
|
5. Объем словаря наименований понятий для декодирования |
||||||||||||||||
сообщений: |
Т0РЯ, logs «4 = |
|
Тсpfe!*m' flogs ( к ? ‘ fe4) + |
от,/и* logs X ]. |
|||||||||||||
|
|
Ѵъ — |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6. Объем словаря словоформ для декодирования наименований |
||||||||||||||||
понятий: |
|
|
ив = |
|
n J z |
= |
|
6/sfe4fe|”* х'”1'”* . |
|
||||||||
|
|
|
|
|
|
6 |
|
|
|
|
|||||||
|
Суммарный объем массивов словарей равен |
|
|||||||||||||||
|
|
|
|
|
V = |
1>1 + |
Ü2 + |
|
|
|
5 |
0 |
|
||||
|
|
|
|
|
|
Ѵз + Цд+ О + Ü . |
|
||||||||||
|
Введем величину относительного объема словарей: |
||||||||||||||||
Тощ а |
с учетом |
|
|
|
|
|
|
R |
= |
ѵ/х. |
|
|
|
||||
необходимости хранения словарей коэффициент сж а |
|||||||||||||||||
тия сообщений может быть определен согласно формуле |
|||||||||||||||||
|
|
|
|
|
|
|
|
k 'cm = L ' f ( L + R ) . |
|
( 6. 12) |
|||||||
1 9 — 3 1 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
277 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На основех =данных8 ■ ІО3 /г'сжтабл. 16.1 и 16.11 находим:/г'Сж |
|
|
|
|
|
||||||||||
для объема f eсообщений х = 1 0 3 /:'сж = 3,14; |
= 9,3;k 'аук |
|
|
|
|||||||||||
для |
х = 1 0 6 |
|
|
= 7,86; для |
х = 1 0 5 |
|
L |
|
|
||||||
для |
'c > K |
= 9,3. |
|
|
|
|
|
|
|
|
|
||||
При |
х = 1 0 6 коэффициент |
сжатия |
сообщений |
достигает |
мак |
||||||||||
симального значения |
(в |
Rформуле (16.12) |
величина |
|
— монотонно |
||||||||||
возрастающая, величина |
|
— монотонно убывающая). |
|
|
|
||||||||||
Отношение объема словарей к объему массива сообщений мож |
|||||||||||||||
но определить как величину |
d — R IL . |
|
что для |
х = 1 0 3 d=4 ,6 ; |
|||||||||||
Произведя необходимыеk'cm |
d |
вычисления, |
найдем, |
||||||||||||
для х = 8 - 1 0 3 |
d = l ,l ; |
для x = 1 0 5 |
d = |
0,28; |
для |
%=106 |
d = 0 ,ll. |
|
|||||||
Величины |
|
|
и |
|
были |
определены |
в |
предположении, |
что |
длина ячейки памяти машины не оказывает влияния на объемы
массивов |
сообщений и словарей. Это ограничение может быть сня |
то, если |
обратиться к формуле (16.8). |
Г л а в а 17 ТЕХНИЧЕСКИЕ СРЕДСТВА АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
Классификация технических средств
Технические средства АСУ, с помощью которых реа лизуются АИС, можно условно разделить на следующие основные группы в соответствии с выполняемыми ими
функциями, назначением |
и местом в системе: |
||
— средства, |
предназначенные для обработки инфор |
||
мации,— ЭВМ и комплексы ЭВМ; |
между элементами |
||
— средства |
обмена |
данными |
|
АСУ — технические средства связи, |
средства коммута |
ции, контроля, преобразования сигналов, повышения до стоверности передаваемой информации и т. д.;
— средства оконечных объектов (органов-) АСУ, вклю чающие аппаратуру преобразования и распределения информации, аппаратуру ввода — вывода данных, пред ставленных в различных формах и на различных носите лях информации; средства отображения, документирова ния, размножения, подготовки и контроля подготовки информации, а также специальные рабочие места, обес печивающие работу операторов АСУ.
Центральное место среди перечисленных технических средств автоматизации процессов управления принадле жит электронной вычислительной технике. ЭВМ реали зуют вычислительный процесс, который в широком смыс-
'278
ле этого слова можно трактовать как процесс двусторон него обмена информацией между человеком и машиной и переработки информации в машине. Специальные вы числительные средства, предназначенные для обеспече
ния решения таких |
задач, |
часто называют |
и н ф о р м а |
ц и о н н о - л о г и ч е с к и м и |
электронными |
вычислитель |
|
ными машинами |
(ИЛ ЭВМ) или комплексами (ИЛ |
ЭВК).
Заметим, что понятие «комплекс» часто имеет неод нозначное толкование. Оно может относиться либо к не скольким ЭВМ, либо к отдельной ЭВМ совместно со средствами обмена данными и техническими средствами оконечных объектов АСУ. Договоримся, что при даль нейшем изложении понятие «комплекс» будем относить к совместно работающим ЭВМ, т. е. ЭВМ, скомплексированным на уровне вычислителей (процессоров), памяти или так называемых каналов. Во всех остальных случа ях, включая соединенные линиями связи машины, будем говорить об отдельных ЭВМ, работающих в системе.
Отметим также, что разработка любой ЭВМ обычно ориентируется на решение некоторого класса определяю щих задач. В связи с этим деление ЭВМ на универсаль ные и специализированные весьма условно. Эта услов ность проявляется особенно сильно, когда мы рассма триваем ИЛ ЭВМ, в которых элементы универсальности выражены в значительно большей степени, чем в обыч ных ЭВМ, которые правильно называть у н и в е р с а л ь- н ы м и.
Существует, хотя и не очень четко определенное, де ление ЭВМ на первое, второе и третье поколения. В ос нове этого деления лежат особенности, обусловленные элементной базой ЭВМ. Так, первое поколение исполь зовало в качестве элементной базы электровакуумные приборы, второе связано с использованием полупровод никовой техники, а третье создавалось на основе микро электроники с малой степенью интеграции схем. Есть от дельные попытки перехода к созданию образцов вычи слительной техники четвертого поколения. В их основе лежат большие интегральные схемы (микроэлектроника с большой степенью интеграции схем). Если исходить из приведенной классификации, то возможности и особен ности современных ИЛ ЭВМ в значительной степени определяются возможностями машин второго и в основ ном третьего поколения. Это связано с тем, что период
19: |
279 |