Файл: Диалектическое единство данных и методов в информационном процессе (Информация и информационное общество).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 13.03.2024

Просмотров: 19

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

7. Точность – степень близости получаемой информации к реальному состоянию объекта.

8. Достоверность – свойство отражать реально существующие объекты с необходимой точностью.

9. Устойчивость – способность реагировать на изменения исходных данных без нарушения требуемой точности.

Таким образом, информация представляет сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

2. Единство данных и методов в информационном процессе

  1. Динамический характер информации.

Говорить об информации можно только в момент протекания информационного процесса. Информация находится в виде данных. В процессе работы механизма преобразования данных в новое знание. Информация не является статичным объектом.

  1. Требование адекватности методов.

Соответствие механизма преобразования данных ценности возможной информации (ценность книги не определяется ее весом, информационный потенциал письма не измеряется цветом бумаги и пр.).

  1. Диалектический характер взаимодействия данных и методов.

Данные объективны (результат регистрации объективно существующих сигналов, вызванных в материальных телах или полях). Методы субъективны (алгоритмы строят люди, т.е. субъекты) Таким образом, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

Понятие объективности информации относительно. В ходе информационного процесса степень объективности информации всегда понижается.

Формы представления информации изменялись с эволюцией человека. В истории развития цивилизации произошло несколько информационных революций - преобразований общественных отношений из-за кардинальных изменений в сфере обработки информации, что способствовало качественным изменениям человеческого общества:

1) изобретение письменности - усовершенствовалась передача знаний от поколения к поколениям

2) (середина 16 века) изобретение книгопечатания - радикально изменило индустриальное общество, культуру, организацию деятельности

3) (конец 19 в.) обусловлена изобретением электричества - появился телеграф, телефон, радио


4) (70-е годы) изобретение микропроцессорной технологии и появление персонального компьютера.

2.1. Извлечение информации

Источниками информации могут являться данные, знания, документы. Источниками данных в любой предметной области являются объекты и их свойства, процессы и функции, выполняемые этими объектами или для них.

В процессе извлечения информации можно выделить следующие фазы:

  • накопление - системное или бессистемное (стихийное) накопление информации в рамках предметной области;
  • структурирование - выделение основных понятии, выработка структуры представления информации, обладающей максимальной наглядностью, простотой изменения и дополнения; формализация - представление структурированной информации в форматах машинной обработки, т. е. на языках описания данных и знаний;
  • обслуживание - корректировка формализованных данных и знаний (добавление, обновление), удаление устаревшей информации, фильтрация данных и знаний для поиска информации, необходимой пользователям. При извлечении информации важное место занимают различные формы и методы исследования данных:
  • нахождение ассоциаций, связанных с привязкой к какому-либо событию;
  • нахождение последовательностей событий во времени;
  • нахождение скрытых закономерностей по наборам данных путем определения причинно-следственных связей между значениями определенных косвенных параметров исследуемого объекта (ситуации, процесса);
  • оценка влияния (важности) параметров на события и ситуации;
  • классифицирование (распознавание), осуществляемое путем поиска критериев, по которым можно было бы относить объект (события, ситуации, процессы) к той или иной классификационной категории;
  • кластеризация, основанная на группировании объектов по каким-либо признакам;
  • прогнозирование событии и ситуации.

Развитие методов и средств извлечения информации направлено на стандартизацию и унификацию. Характерным примером является создание и внедрение технологий Data Mining и Text Mining.

Data Mining - это направление в информационных технологиях, которое связано с автоматизированным извлечением знаний (неявным образом присутствующих в обрабатываемой информации) и базируется на интеллектуальном анализе данных.

Text Mining является разновидностью Data Mining, ориентированной на обработку текстовой информации и широко применяемой для мониторинга ресурсов Internet. Задача Text Mining - проанализировать не синтаксис, а семантику значения текстов, выбрать из него наиболее значимую информацию.


2.2. Виды и способы передачи информации

По способу передачи и восприятия различают следующие виды информации:

  • визуальную – передаваемую видимыми образами (в том числе знаками, символами),
  • аудиальную – звуками, тактиальную – ощущениями,
  • органолептическую – запахами и вкусом,
  • машинную – воспринимаемую и выдаваемую техническими средствами.

Знаковая форма предполагает использование какого-либо языка. Языки делятся на:

  • естественные (разговорные)
  • формальные. Формальные языки чаще всего относятся к специальной области человеческой деятельности (математический, азбука Морзе, язык флажков на флоте, «пляшущие человечки» при шифровке и т.п.). Так или иначе, любая знаковая форма представления информации предполагает наличие некоторого конечного набора знаков из которых конструируются сообщения, который образует алфавит некоторого языка. Последовательность символов алфавита, кодирующая состояние источника и воспринимаемая адресатом как сообщение, как информация, образует слово на этом языке.

Таблица 1

Виды, способы передачи и средства представления информации[5]

Виды информации

Способы передачи информации

Средства представления информации

Символьная (знаковая)

Устная

Письменная

Язык – знаковая система для представления информации (естественный;

Формальный)

Образная

Эмоции

Ощущения (перечислить)

Органы чувств

Примером формализованного представления информации, с определенными правилами по ее переработке может служить математическая логика, которая изучает логические связи и отношения, лежащие в основе дедуктивного (логического) вывода. Язык логики положен в основу некоторых информационных систем и языков программирования, для которых обработка информации возможна с помощью технических устройств. Математическая логика с развитием техники оказалась в тесной взаимосвязи с вопросами конструирования и программирования вычислительной техники.

Свойства информации тесно связаны со своим носителем. Любой носитель можно характеризовать параметры разрешающей способности (количеством данных, записанных в принятой для носителе единице измерения) и динамическим диапазоном


При передаче и переработке информации важно сигналами какой природы отображается информация, т.е. каким кодом она задана. При кодировании информации дискретными сигналами используется конечное множество символов (алфавит), поэтому их (сигналы) принято кодировать буквами алфавита того или иного естественного языка или цифрами той или иной системы счисления. Таким образом, дискретная информация отождествляется с алфавитно-цифровой. Простейшим алфавитом, которым удобно пользоваться при «электронном счете» на электронном вычислительном устройстве является алфавит, состоящий из двух состояний: «есть электрический сигнал» и «нет электрического сигнала» (это упрощенное представление, правильнее говорить о силе сигнала), для удобства, эти состояния принято обозначать соответственно цифрами 1 и 0. Таким образом, алфавитом первой ЭВМ стали две цифры 0 и 1, такая система счисления называется двоичной[6].

Со временем, человек поставил задачу переложить на ЭВМ не только функции счета, но и задачи, связанные с хранением, обработкой информации различного вида. В этой связи встал вопрос о представлении текстовой, графической, звуковой информации в памяти компьютера, о выборе алфавита (кодов), с помощью которого можно было закодировать все виды используемой ЭВМ информации.

При кодировании более длинных сообщений, требуется больше разрядов. В восьми двоичных разрядах умещается 256 целых чисел –достаточно для того, чтобы дать уникальное восьмибитовое обозначение каждой заглавной, каждой строчной букве английского и родного алфавитов, цифр, служебным символам. Отсюда выбор в качестве единицы измерения объема информации – восьмибитовое число - байт.

2.3. Измерение информации

Решение проблемы измерения количества информации, объема информационного сообщения неоднозначно. Как человек вообще что-либо измеряет? При измерении расстояния и массы человек использует, принятый в качестве единицы измерения, эталон длинны (метр) и эталон массы (1 кг) соответственно.

Для человека важны разные свойства информации, что должно отражаться при ее измерении. Для измерения информации используют два параметра: количество информации и объем данных. Эти параметры имеют разные выражения и смысловое значение.

Объем данных в сообщении измеряется количеством разрядов, требуемых для его кодирования. В различных системах счисления один разряд имеет различный вес и, соответственно, меняется единица измерения данных. В двоичной системе счисления единица измерения – двоичный разряд, который назвали бит.


Количество информации связано с понятиями полезности информации и степенью новизны, что, в свою очередь, связано с уровнем подготовки приемника информации. Так, сообщение: «в нашей галактике несколько солнечных систем» для ученика 1 класса совершенно непонятно, для ученика 5 класса содержит новую информацию и понятно, а для ученика 10 класса понятно, но никакой новой информации не несет.

Различные подходы к измерению информации:

  1. Вероятностный подход к измерению информации.
  2. Определение степени сложности кодирования
  3. Определение объема информации при алфавитно-цифровом представлении информации, при котором длина символьного сообщения сравнивается со словом минимальной длины, т.е., состоящим из одного символа.. Если мы конструируем сообщение, используя двузначный алфавит из двух цифр 0 и 1, то любая из этих цифр становится эталонной единицей количества информации. Величину, способную принимать лишь два различных значения (0 1), называют бит (binary digit- двоичный знак) Таким образом, бит –минимальная единица количества информации. Более крупные единицы измерения информации: килобайт, мегабайт, гигабайт и т.д., они получаются путем умножения основной единицы на 210, таким образом,

210 байт = 1024 байт = 1 Кбайт;

220 байт = 1048576 байт = 1 Мбайт;

230 байт = 1073741824 байт = 1 Гбайт;

240 байт = 1099511627776 байт = 1 Тбайт.

Иногда используют такую единицу измерения информации как «слово». Слово состоит из 16 бит, т.е. 2 байт. 216 =65536, поэтому, 16-ти разрядным словом можно выразить натуральные числа от 0 до 65535, либо целые от –32768 до 32767.

Таблица 2

Примеры единиц измерения информации

Мера информации

Единицы измерения

Примеры

(для компьютерной области)

Синтаксическая

- вероятностный подход (Шенона)

- компьютерный подход

Степень уменьшения неопределенности

Единицы представления информации

Вероятность события

Бит, байт, Кбайт и т.д.

Семантическая

Тезаурус (совокупность сведений, которыми располагает пользователь или система)

Пакет прикладных программ, компьютерные сети, экспертные системы, системы искусственного интеллекта

Прагматическая

Ценность использования

Емкость памяти, производительность компьютера, скорость передачи данных и т.д.

Информационная технология - процесс, использующий совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления.