Файл: Лекція 13 Розпізнавання образів.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.05.2024

Просмотров: 40

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Предмет розпізнавання образів об'єднує ряд наукових дисциплін; їх зв'язує пошук рішення загальної задачі - виділити елементи, що належать конкретному класу, серед безлічі розмитих елементів, що відносяться до декількох класів.

Під класом образів розуміється деяка категорія, ряд властивостей, загальних для всіх її елементів.

Розпізнавання образів (об'єктів, сигналів, ситуацій, явищ або процесів) - задача ідентифікації об'єкту або визначення яких-небудь його властивостей по його зображенню (оптичне розпізнавання) або аудіозапису (акустичне розпізнавання) і іншим характеристикам.

Одним з базових є поняття множини, що не має конкретного формулювання. В комп'ютері множина представляється набором однотипних елементів, що не повторюються. Слово не "повторюються" означає, що якийсь елемент в множині або є, або його там ні. Універсальна множина включає всі можливі для вирішуваної задачі елементи, порожнє не містить жодного.

Образ - класифікаційне угрупування в системі класифікації, об'єднуюче (виділяюча) певну групу об'єктів по деякій ознаці. Образи володіють характерною властивістю, що виявляється в тому, що ознайомлення з кінцевим числом явищ з однієї і тієї ж множини дає можливість взнавати скільки завгодно велике число його представників. Образи володіють характерними об'єктивними властивостями в тому значенні, що різні люди, що навчаються на різному матеріалі наглядів, переважно однаково і незалежно один від одного класифікують одні і ті ж об'єкти. В класичній постановці задачі розпізнавання універсальна множина розбивається на частини-образи. Кожне відображення якого-небудь об'єкту на сприймаючі органи системи, що розпізнає, незалежно від його положення щодо цих органів, прийнято називати зображенням об'єкту, а безліч таких зображень, з'єднана якими-небудь загальними властивостями, є образами (більш детально можна ознайомитися на сайті http://www.codenet.ru).

Методика віднесення елемента до якого-небудь образу називається вирішальним правилом.

Ще одне важливе поняття - метрика, спосіб визначення відстані між елементами універсальної множини. Чим менше ця відстань, тим більше схожими є об'єкти (символи, звуки і ін.) - те, що ми розпізнаємо. Звичайно елементи задаються у вигляді набору чисел, а метрика - у вигляді функції. Від вибору представлення образів і реалізації метрики залежить ефективність програми, один алгоритм розпізнавання з різними метриками помилятиметься з різною частотою.


Навчанням називають процес вироблення в деякій системі тієї або іншої реакції на групи зовнішніх ідентичних сигналів шляхом багатократної дії на систему зовнішнього коректування. Таке зовнішнє коректування в навчанні прийнято називати "заохоченнями" і "покараннями". Механізм генерації цього коректування практично повністю визначає алгоритм навчання. Самонавчання відрізняється від навчання тим, що тут додаткова інформація про вірність реакції систему не повідомляється.

Адаптація - це процес зміни параметрів і структури системи, а можливо - і управляючих дій, на основі поточної інформації з метою досягнення певного стану системи при початковій невизначеності і умовах роботи, що змінюються.

Навчання - це процес, в результаті якого система поступово придбаває здатність відповідати потрібними реакціями на визначені сукупності зовнішніх дій, а адаптація - це підстроювання параметрів і структури системи з метою досягнення необхідної якості управління в умовах безперервних змін зовнішніх умов.

Приклади задач розпізнавання образів:

  • розпізнавання букв;

  • розпізнавання штрих-кодів;

  • розпізнавання автомобільних номерів;

  • розпізнавання осіб і інших біометричних даних;

  • розпізнавання мови.

Деякі задачі розпізнавання такі, що людина навряд чи в змозі вирішувати їх. Прикладом задач такого роду служить виділення з безлічі морських сигналів і шумів тону підводного човна за допомогою аналізу підводних звукових сигналів. Очевидне, але зовсім вже "нехитре" рішення задачі розпізнавання полягає у вживанні до окремих пред'явлених образів ряду простих тестів для виділення ознак кожного класу. Сукупність цих тестів повинна розрізняти всі допустимі образи з різних класів. Розглянемо, наприклад, наступні чотири китайські ієрогліфи:

Ці прості символи можна розпізнати за допомогою тестів, перевіряючих наявність вертикальної риски, горизонтальної риски, окремої крапки, відкритої верхньої частини, відкритої нижньої частини і послідовності крапок, підрахувавши потім кількості і послідовності рисок.

Як другий приклад розглянемо наступні п'ять англійських букв: C O I N 8

Ці букви можна класифікувати, застосувавши тести на наявність таких ознак, як замкнута крива, вигин, подвійний вигин, вертикальний відрізок, короткий відрізок. На мал. 13.1 приведена функціональна блоксхема, що ілюструє описаний підхід до розпізнавання образів.


Мал. 13.1 - Блок-схема простої логічної (питання- відповідь) процедури класифікації ознак;

Якщо слідувати такому інтуїтивному підходу, то побудова автоматичної системи розпізнавання образів може показатися досить простою задачею. Не існує, проте, загальної теорії, що дозволяє визначити, які зі всієї безлічі мислимих тестів слід застосувати до пред'явлених образів.

Дуже обмежена кількість або недбалий вибір тестів не дадуть можливості одержати характеристики пред'явлених для розпізнавання образів, достатні для віднесення їх до відповідних класів. Дуже багато тестів, з другого боку, необгрунтовано ускладнять обчислення, здійснювані в процесі подальшого аналізу. Відсутнє яке-небудь загальне правило для отримання якихось орієнтирів, сприяючих визначенню набору таких тестів. Подібний підхід надмірно залежить від досвіду і технічної інтуїції розробника і тому часто не дає задовільного рішення задач розпізнавання образів, що зустрічаються в практичній діяльності.

Мал. 13.2 - Ієрархія відносин між чинами і класами образів;

Ретельне вивчення задач, що виникають в процесі розпізнавання образів, дозволяє прийти до більш ефективних підходів. Між чинами і класами образів існує якесь ієрархічне впорядкування. Так, на схемі, приведеній на мал. 13.2, буквено-цифрові символи і китайські ієрогліфи є чинами, а символи відповідають класу образів. Букви алфавітів і цифри є чинами, якщо буквено-цифрові символи розглядаються як клас образів. Друкарські і рукописні зображення, наприклад, букви А є чинами букви англійського алфавіту А, яка представляє в цьому випадку клас образів. Багато інформаційних систем потребують пристрою для розпізнавання друкарських букв і цифр, набраних різними шрифтами, і рукописних букв і цифр, написаних різними почерками.

Зупинимося на задачі розпізнавання письмових знаків. Конкретна буква або цифра незалежно від того, як вона надрукована або написана, володіє рядом загальних ознак, які використовуються як засоби її ідентифікації. Букви і цифри ідентифікуються і класифікуються згідно відзначеним у них таким ознакам. Отже, основні функції системи розпізнавання образів полягають у виявленні і виділенні загальних ознак образів, що описують об'єкти, що належать до одного і того ж класу образів, розпізнаванні цього образу в будь-якій іншій ситуації і віднесенні його до одного із заданих класів.



Методи розпізнавання образів

В цілому, можна виділити три методи розпізнавання образів: Метод перебору. В цьому випадку проводиться порівняння з базою даних, де для кожного виду об'єктів представлені всілякі модифікації відображення. Наприклад, для оптичного розпізнавання образів можна застосувати метод перебору виду об'єкту під різними кутами, масштабами, зсувами, деформаціями і т.д. Для букв потрібно перебирати шрифт, властивості шрифту і т.д. У разі розпізнавання звукових образів, відповідно, відбувається порівняння з деякими відомими шаблонами (наприклад, слово, вимовлене декількома людьми).

  • Другий підхід - проводиться більш глибокий аналіз характеристик образу. У разі оптичного розпізнавання це може бути визначення різних геометричних характеристик. Звуковий зразок в цьому випадку піддається частотному, амплітудному аналізу і т.д.

  • Наступний метод - використання штучних нейронних мереж (ШНС). Цей метод вимагає або великої кількості прикладів задачі розпізнавання при навчанні, або спеціальної структури нейронної мережі, що враховує специфіку даної задачі. Проте, його відрізняє більш висока ефективність і продуктивність.

3. Загальна характеристика задач розпізнавання образів і їх типи

Загальна структура системи розпізнавання і етапи в процесі її розробки показані на мал. 1.

(Мал. 1. Структура системи розпізнавання)

Задачі розпізнавання мають наступні характерні риси.

Це інформаційні задачі, що складаються з двох етапів:

- перетворення початкових даних до вигляду, зручного для розпізнавання;

- власне розпізнавання (вказівка приналежності об'єкту певному класу).

В цих задачах можна вводити поняття аналогії або подібності об'єктів і формулювати правила, на підставі яких об'єкт зараховується в один і той же клас або в різні класи. В цих задачах можна оперувати набором прецедентів-прикладів, класифікація яких відома і які у вигляді формалізованих описів можуть бути пред'явлені алгоритму розпізнавання для настройки на задачу в процесі навчання.

Для цих задач важко будувати формальні теорії і застосовувати класичні математичні методи (часто неприступна інформація для точної математичної моделі або виграш від використовування моделі і математичних методів несумірний з витратами).