Файл: Крулькевич, М. И. Основы систем производственно-экономической информации учеб. пособие.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 67
Скачиваний: 0
Для простоты и наглядности анализ 'информации доку мента произведем на уровне десятичных символов.
Всего в одной строке представлен 31 десятичный символ. При использовании ЭВМ, телетайпной связи и технических средств в управлении потребителю информации для оценки наблюдаемогопроцесса добычи угля достаточно первого числа каждого месяца представлять данные трех колонок (2-й, 4-й, 9-й), а в остальные дни месяца передавать только фактические данные за прошедшие сутки. Указанная инфор мация позволит полностью восстановить все необходимые показатели документа как по данной строке, так и по всем предыдущим. Для этого в памяти ЭВМ достаточно хранить показатели добычи угля с начала года на конец предыдуще го месяца, план на сутки (±) за каждый рабочий день текущего месяца и, естественно, расчетную программу. Все остальные данные учетной ведомости могут быть всегда вос созданы, если в этом появится необходимость. К тому же многие из показателей формы нужны лишь при подготовке документа вручную (колонки 4 и 5). Некоторые из них 'дуб лируют друг друга (например, колонки 6 и 8). Фактически для анализа и принятия решения достаточно иметь данные всего по трем колонкам: 3-й, б-й и 9-й.
Другими словами, необходимая для принятия решения информация каждые сутки может быть представлена всего 13-ю десятичными символами, или, примерно, 58% всей ин формации строки — избыточна.
Эффект от использования данного способа описания со-, общений очевиден:
—передача и представление значительно.меньшего ко личества символов, что весьма благоприятно для АСУ;
—лучшее восприятие информации состороны ее потре
бителя;
—упрощение формы документа;
—более - оперативное и качественное управление про цессом производства.
Редукция или свертка информации — это представле ние'результатов наблюдения за объектом в компактной фор ме, удобной для опубликования, хранения, контроля и сопо ставления с другими данными.
70
Областью применения данного'метода сжатия информа ции являются случайные процессы, количественная опенка которых производится на основании статистического анализа результатов наблюдений. Примером таких процессов могут быть оценки времени обработки деталей, выемки полосы угля в лаве, фактические скорости перевозок грузов и т.'д.
Сущность, метода проиллюстрируем на следующем при мере.
Пусть имеем выборку (табл. 3), характеризующую дли тельность выемки полосы угля в лаве.
|
|
|
|
|
|
Таблица 3 |
Длительность |
Количество |
; |
Длительность |
Количество |
||
времени, |
мин. |
наблюдений |
j |
времени, мин. |
наблюдений |
|
|
|
|
|
I |
|
|
30 |
|
• |
2 |
|
40 |
14 |
32 |
|
5 |
|
42 |
9 |
|
34 |
|
|
9 |
|
44 |
5 |
36 |
|
13 |
|
46 |
•2 |
|
38 |
|
19 |
|
48 |
1 |
|
По выборке |
строим |
гистограмму частот |
наблюдений. |
|||
Например, |
для выборки, |
близкой к нормально |
распределен |
ной генеральной совокупности, вместо того, чтобы приводить значения всех наблюдений (длительностей времени) и их количество, достаточно привести три величины — выбороч
ное среднее х, выборочную дисперсию з 2(х) и число наблю дений п.
Эти три величины дают всю необходимую информацию, содержащуюся в выборке. Они позволяют оценивать не только интересующие нас параметры — среднее и диспер сию, но и доверительные границы, задаваемые размером вы борки, то есть числом наблюдений.
Итак, в общем случае, если ИТР или служащему пред приятия необходимо представить информацию о распределе нии случайной величины через несколько описывающих ее параметров или определить форму интересующего распреде ления, то для этого достаточно вычислить на основе имею щихся статистических данных следующие показатели.
П
1.Точку, вокруг которой группируется распределен
Известны три различных способа определения этой точки:
а) наиболее распространенный способ определения це ра распределения является вычисление математического ожидания случайной величины, которое равно
М (х) = J xf(x)dx
—00
для непрерывной и случайной величины и
М (х )= 2iх , Р, (х, ),
если х — дискретная случайная величина с распределени ем P(xi).
Эмпирический центр распределения, обозначенный через х, вычисляется как
п
2Xj
—i = l
где Xi(i = l, 2, ...n) — значения результатов наблюдений;
б) другой характеристикой центра распределения яв ется срединная точка (медиана). Для плотности распреде ления непрерывной случайной величины f (х) медианой яв ляется такая точка А, что
Уf(x)dx — 0,5.
—00
Другими словами, медиана равна такому значению слу чайной величины, которая делит пополам площадь, распо ложенную под кривой плотности распределения. При опре делении медианы дискретной случайной величины интеграл заменяется суммой значений случайной величины.
Медиана, в отличие от математического ожидания, яв ляется удобной характеристикой центра распределения слу чайных величин, распределение которых не является симмет ричным. Она к тому же не так чувствительна к небольшому количеству крайних значений.
72
Для определения медианы по эмпирическим, данным их Еначале следует упорядочить по величине; При этом, если п нечетное число, то медиана равна
то есть значению П - упорядоченного наблюдения. Если
же п четное число, то медиана равна среднему значению*
между |
и -g- -f 1, то есть |
Ме = х ( т + ( т + 1}) ;
в) третья характеристика центра распределения — мо да. Для дискретной случайной величины модой является значение случайной Величины, имеющей наибольшую веро ятность. Мода непрерывной случайной величины равна зна чению, соответствующему максимуму плотности распределе-
.ния, если, конечно, максимум один.
По эмпирическим наблюдениям мода находится как ре зультат наблюдений, который встречается наиболее часто. Если же данные группируются по интервалам частот одина ковой длины, то мода при этом берется как центральная точ ка частотного интервала, содержащего наибольшее число наблюдений, то есть
М0 = X {fli max}-
2. Показателем рассеяния наблюдений относительно среднегоявления является дисперсия з2, которая представ ляет собой математическое ожидание квадрата разности случайной величины и ее математическим ожиданием
D(x) = Mf х — M(x)J*.
Квадратный корень из дисперсии называют средним квадратичным отклонением и обозначают символом з. Он’ предназначен для тех же целей, что и дисперсия.
73
Эмпирической формулой для определения дисперсии яв ляется
2 ( х , - X)2
1=1
где х — эмпирическое математическое ожидание, или выбо рочное среднее.
Известно, что при нормальном распределении случайной
величины в интервале х ± |
з заключено 68,3% ее |
значений, |
а в интервалах х ± 2з и |
х ± Зз соответственно |
95,5% и |
99,7%. |
|
|
Указанные пределы значений случайной величины часто бывает целесообразно определять не только для нормально го распределения, но и для других распределений случайных величин.
Теорема Чебышева, согласно которой для любого рас пределения с конечным математическим ожиданием и дне-
персиеи как минимум |
• Ч |
ч |
100% значений случайной |
|
|
величины находится в интервале х ± кз часто, с достаточной степенью точности позволяет осуществлять редуцирование информации о случайной величине на основе ее статистичес ких данных.
3. Асимметрия или показатель оценки симметричнос распределения случайной величины удобно использовать для унимодальных (одновременных) распределений. Она соот ветствует третьему моменту относительно среднего и опреде ляется по эмпирическим данным с использованием выраже ния
m |
(Xt ~ х): |
|
i=l |
||
|
При Шз<0 имеет место левосторонняя отрицательная асимметрия (хвост распределения слева). Если же пгз>0, то распределение правостороннее. Для симметричного распре деления т 3=0. Сигнал об изменении знака асимметрии рас пределения, полученный от какого-либо производственного
74
объекта, может вызвать необходимость в срочном анализе причин, обуславливающих его.
4. Эксцесс или четвертый момент относительно среднего связан с островершинностью распределения. По эмпиричес ким данным он определяется до формуле
В производственной практике этот показатель удобно использовать когда, например, необходимо установить, как устойчиво появление' наиболее благоприятствующих призна ков какой-либо производственной ситуации.
5. Квантили, представляющие собой такие значения слу чайных величин, ниже которых располагается часть функции распределения.
Определение квантилей для дискретной случайной вели чины производится суммированием аналогично интегриро ванию. При этом обычно точного решения получить невоз можно.
Примером квантилей может быть м'едиана. Но в произ водственной практике интерес' часто могут представлять точки, далеко отстоящие от среднего значения, такие как А (0,01). Квантили, выраженные в процентах, называют процентилями.
Способы определения показателей распределения как дискретных, так и непрерывных случайных в'еличип при за ранее известных законах их распределения изложены во многих работах по математической статистике. Их можно найти для следующих распределений: нормального, Гаммараспределения, Бетта-распределения, логарифмически нор мального, Коши, Релея, Вейбула, равномерного, треугольно го, параболического, биноминального, гипергеометрического, геометрического, Паскаля и Пауссоновского.
■ В принципе круг процессов, имеющих случайный харак тер, учитывая требуемую точность, всегда может быть опи сан одним из приведенных распределений.
При рассмотрении показателей, с помощью которых можно рационально свертывать производственно-экономиче скую информацию, обращает на себя внимание простота рас
75
четных алгоритмов. Благодаря этому для свертывания ин формации могут быть применены сравнительно простые вы числительные устройства, которые можно располагать в не посредственной близости от управляемых объектов. Редуци рованная информация частично может преобразовываться в управляющих ЭВМ и использоваться в оперативном управ лении, а частично транзитом через управляющую машину по телетайпным или другим каналам связи передаваться в кус товой вычислительный центр.
Сжатие информации с учетом количества • информации сообщений основной своей областью применения имеет про цесс оперативного управления предприятием или совокуп ностью предприятий. Так, например, в оперативном анализе часто используется такой показатель, как процент выполне ния плана за определенный отрезок времени (смену, сутки, неделю, декаду, месяц). Этот показатель необходим для то го, чтобы определить момент, когда следует вмешиваться в процесс производства. Исходя из плана и анализа динамики
производства |
можно выделить |
некоторый |
интервал |
значе |
ний процента |
выполнения плана, вероятность достижения |
|||
которых в последующий период |
наиболее |
велика, а |
также |
интервал значений с наименьшими вероятностями. Интерва лы уровня выполнения плана можно рассматривать как воз можные исходы. В табл. 4 приведены реальные, вероятности
исходов различных интервалов |
выполнения |
плана по суткам |
в течение месяца и соответствующее каждой |
из вероятностей |
|
количество информации, содержащееся в сообщении. |
||
Количество информации |
определено по Шеннону. Как |
известно, количество информации зависит от числа возмож ных исходов и вероятности каждого из них. При меньшей вероятности исхода получаем большее количество информа ции, узнав о наступлении интересующего события.
Расчетная формула для определения количества инфор мации имеет вид
1 = — log Pi ,
где Pi — вероятность 1-го исхода.
По данным таблицы видно, что сообщения, относящиеся к различным интервалам, в значительной мере неравнове роятны и содержат неодинаковое количество информации.
76
Так, сообщения, относящиеся к четвертому интервалу, со держат примерно в 16 раз меньше информации, чем сообще ния, относящиеся к седьмому интервалу, или в 7,5 раза меньше, чем сообщения, относящиеся ко всем шести интер валам.
Другими словами, значительные отклонения процесса функционирования от планового режима, требующие опера тивного вмешательства управляющего органа, как правило, маловероятны, но сообщения о них содержат значительно большее количество информации. Напротив, незначительные отклонения, не выходящие за пределы допустимых значений, весьма вероятны, но обычно не требуют вмешательства в процесс производства. Зная предварительно допустимые пре делы невмешательства в процесс, которые для каждого предприятия хотя и конкретные, но легко определимые, и используя приведенный метод определения' количества ин формации, можно получить рациональную схему представ ления данных.
Так, для условий приведенного в табл. 4 примера исклю чение сообщений, относящихся к четвертому интервалу, поз воляет сократить поток регистрируемых, передаваемых и пе рерабатываемых показателей на 75% от общего числа пока зателей данной совокупности. При этом потеря полезной информации совсем незначительна — 0,41 бит. Такая потеря вполне допустима для практики.
|
|
|
|
Таблица 4 |
|
Нол ер |
Процент |
|
Количество информации |
||
выполне |
Вероятность |
||||
интервала |
в сообщении |
||||
ния |
плана |
|
|||
|
|
|
|||
1 |
до |
90 |
0,02 |
5,62 |
|
2 |
90—94 |
0,02 |
5,62 |
||
3 |
95—99 |
0,10 |
3,32 |
||
4 |
100— 104 |
0,75 |
0,41 |
||
5 |
105— 109 |
0,08 |
3,64 |
||
6 |
110—119. |
0,02 |
5,62 |
||
7 |
120 и |
более |
0,01 |
6,64 |
|
Всего |
|
|
1,00 |
32,87 |
77