Файл: Булах Е.Г. Автоматизированная система интерпретации гравитационных аномалий (метод минимизации).pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 28.07.2024

Просмотров: 106

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

объединяются

под общим

названием — знакоопределенные формы.

Если квадратичная форма (І.5а) принимает

и положительные,

и

отрицательные

значения,

то ома

называется

знакопеременной.

Если в (1.5а) форма имеет значения

одного

знака, но в каких-то

точках принимает нулевые значения, то такая

квадратичная

форма

называется квазизнакоопределенной.

 

точке Ма

(р<°>, pf>

 

Теперь обратимся к самой теореме. Пусть

в

 

pjj>>) возможен экстремум функции F =

F

и

рг,

 

pN). Рас­

смотрим в этой точке второй дифференциал

C12F/M0-

О н

может быть

записан выражением (1.5). Если (1.5) в точке М0

представляет со­

бой знакоопределенную

квадратичную форму,

то

функция

F

=

=F (рг, рг, PN) в точке М0 имеет локальный экстремум. При

этом, если d2F

< ; 0, то функция в

точке

М0

достигает максимума,

а если d?F >• 0, то — минимума.

Когда второй дифференциал пред­

ставляет собой

знакопеременную

форму,

то

в этой точке функция

не имеет экстремума. При квазизнакоопределенной форме второго дифференциала функция может иметь экстремум или не иметь его. Для выяснения этого вопроса необходимы дополнительные исследо­ вания.

Критерий

знакоопределенности

квадратичной

формы

установ­

лен Сильвестром и называется его именем.

 

 

 

 

 

 

 

Квадратичная

форма

 

(І.5а)

 

характеризуется

симметричной

матрицей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гапа12

 

. . .

a1N

 

 

 

 

 

 

Определители

 

 

 

 

 

 

 

 

 

 

 

UNN

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А-1 — а

Л

 

=

а11 а12

 

Л 3

=

%1 й 1 2 а 1 3

 

 

 

 

2

и2і 0-22

 

^21

^22

^28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^31

^82

^88

 

 

 

 

 

 

 

 

 

 

 

аa21

 

Cl\N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a12

a22

 

CloN

 

 

 

 

 

 

называются главными

минорами

 

матрицы

А.

 

 

 

 

 

Д л я

того,

чтобы

квадратичная

 

форма (І.5а)

была

положительно

определенной,

необходимо

и

достаточно

выполнение

неравенства

 

 

Д х Х ) ,

Л 2

> 0 ,

Л 3

> 0

 

 

 

 

 

AN>0.

 

 

Д л я того, чтобы квадратичная

форма была отрицательно

определен­

ной, необходимо

и

 

достаточно,

чтобы

знаки

главных

миноров

Â-y, А%,

AN чередовались,

причем

АуК^О.

 

 

 

 

 

Рассмотренный

метод

является

классическим.

Д л я

его реали­

зации

необходимо

найти

решение

системы

 

(1.4).

При

решении

13


гравиметрических задач — это система трансцендентных уравнений. В общем виде она не решается. В каждом конкретном случае она

решается

приближенными

численными методами.

 

К минимизации функционала (1.3) можно подойти иначе. На

параметры

р\

могут

быть

наложены

некоторые ограничения

вида

 

Ф< (Pi. Р2 .

• • • .

Pu) < 0."

t=l,2,

.

, п.

(1.7)

Системой соотношений (1.7) определяется область D. Задача

со­

стоит в том, чтобы среди точек области D

найти

такую точку

Р*,

для которой

достигается

 

 

 

 

 

 

 

F

(Р*) =

min F (Р),

 

PQD.

 

 

Сформулированная так задача относится к классу задач нелиней­

ного программирования.

В самом

общем виде — это

задача функ­

ционального

программирования.

В зависимости от

вида

функции

F и области

D,

которая

определяется

неравенствами (1.7), задача

может упрощаться и сводиться к задачам, методы решения

которых

изучены.

В

частности,

если

функция

(1.2) выпуклая и

гладкая,

а неравенства (1.7) определяют выпуклую область D, то поставлен­

ная задача сводится к выпуклому

программированию.

 

Понятие

выпуклости

функции

является очень важным. Д л я вы­

пуклых функций

установлены

теоремы о критериях единственности

обратной

задачи.

Рассмотрим

некоторые формулировки и

теоремы

о выпуклых функциях. Здесь они приводятся без доказательства. Более подробное изложение этого вопроса можно найти в [13, 27].

 

Пусть в N-мерном пространстве заданы две точки

Р ( 1 > и Р&).

 

От­

резком Р(1)рі2\

соединяющим

эти

точки,

называется

множество

точек

Р =

Рт

+

t {Р(2)

— Рт),

где

t — любое

число

из

сегмента

[0,

1]

( 0 < f <

1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Множество Р называется выпуклым, если

вместе с любыми

дву­

мя его точками Р ( " и Р^

этому

множеству

принадлежат

все

точки

отрезка

PwPi2).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть

в N-мерном пространстве

задана

функция

F

(Р),

Р

=

=

{Рі> Рг>

•••> Рлг}. F

(Р)

выпуклая

функция

на

множестве

Р,

если

для

любых

двух

точек

F(i)

и

Р&

выполняется

условие

 

 

 

 

F

0)

+

/ {Р{2)

Р ( 1 ) ))

< F (P( l ) ) - f

 

 

 

 

 

 

 

 

 

 

 

+

t [F (Р{2)) -

F (P(l))].

 

 

 

 

 

(1.8)

Если в (1.8) строго справедлив знак неравенства, то говорят о стро­ гой выпуклости.

Очень важной является теорема, которая устанавливает крите­ рий выпуклости. Пусть функция F (Р), заданная на выпуклом мно­ жестве Р, дважды дифференцируема. Если во всех точках этого множества второй дифференциал d2F представляет собой положи­ тельно определенную форму, то F (Р) является выпуклой функцией

14


на множестве Р. Таким образом, на основании исследования второ­ го дифференциала делается вывод о выпуклости функции.

Почему же так важно установить выпуклость минимизируемой функции? Дело в единственности минимума. Это утверждает сле­

дующая теорема.

 

F (Р),

 

Дифференцируемая

строго выпуклая функция

заданная

на выпуклом множестве Р, может иметь локальный

минимум лишь

в одной точке этого множества.

 

 

Конечно, в самом

общем виде функционал (1.3)

может

оказать­

ся не выпуклым, так как обратные задачи относятся

к классу некор­

ректных и ие имеют единственного решения. Однако, накладывая ограничения на форму элементарного тела и закрепляя некоторые его параметры, мы всегда можем добиться того, что решение задачи не будет выходить из одного выбранного класса. Этот своеобразный регуляризатор обеспечивает единственность решения задачи.

В методах решения задач нелинейного программирования выде­ ляются два основных направления. Одно из них объединяет методы детерминированного поиска решения. Строятся различные много­ шаговые поиски решения. На каждом шаге выбирается направле­ ние поиска, причем используются различные локальные свойства минимизируемой функции (например, градиент этой функции). Второе направление объединяет методы случайного поиска. Каж­ дое направление имеет и сильные и слабые стороны.

Детерминированные методы имеют сложные алгоритмы. Если ми­ нимизируемая функция имеет локальные или граничные минимумы, то сходимость результатов расчета к глобальному (главному) ми­

нимуму, как правило, не

гарантируется. Д л я

поиска

глобального

минимума требуется опробование

начальных точек поиска.

В методах

случайного

поиска

алгоритмы

довольно простые,

но они требуют

частого вычисления целевой функции.

 

При минимизации (1.2) или (1.3) следует иметь в виду их отно­ сительную громоздкость. Производные от функций вычисляются почти без дополнительных затрат времени — при вычислении самой функции. Однако не эти особенности являются решающими при выборе метода минимизации. Следует учитывать, что выбор началь­ ного приближения, который сделан квалифицированным специали­ стом с учетом знания геологических особенностей района исследова­ ния, позволяет получить решение задачи в одном заранее выбран­ ном классе. Последнее и явилось решающим фактором при выборе

метода

минимизации. Д л я

минимизации (1.2)

или

(1.3) исполь­

зуем

градиентный метод

скорейшего спуска.

Пусть

вектор Р =

={Ръ Рг, •••> PN) обращает (1.2) или (1.3) в минимум. Тогда во всех

других соседних точках, которые характеризуются векторами Р^, функционал

F (P ( f c ) )> F (Р).

Отыскание точки Р заключается в следующем. Пусть известно на­ чальное приближение Р{0) = [pf\ р1^, р$]. Построим

15


вектор grad F (P( 0 ) ) =

{ F P L ,

 

F ' P N ) .

Известно,

что в

направ

вектора-градиента

функция F (Р) будет

возрастать, значит,

в про­

тивоположном направлении эта же функция будет убывать.

Через

точку Р{0)

в направлении вектора-градиента

проведем

прямую

 

 

Р

= РТ

% grad F (РТ).

К,

 

 

 

(1.9)

Придавая

различные

значения

коэффициенту

мы

будем

полу­

чать различные точки

на прямой

(рис. 2). Если

X > • 0, то точки Р

будут находиться

в области

убывания

функции

F (Р).

Значение

 

 

 

минимизируемой функции в любой точ­

 

 

 

ке

на данной

прямой

можно

записать

 

 

 

так:

 

 

 

 

 

 

 

 

MeM=-lgradF(pM)

Р и с . 2. Отыскание точки вдоль вектора - градиента .

F = F (РФ) — Х gvad F

Ф))),

или

F = F (À).

Найдем такое значение К = Ä,0, при ко­ тором F 0) = min. Д л я этого нужно решить уравнение

Таким образом, определена точка на прямой (1.9)

p(i) = p ( 0 ) _ ^ g r a d / 7 ( j P ( o , )

)

в которой F (РТ) принимает минимальное из возможных значений.

Теперь за начальное приближение принимаем

точку Р ( 1 > и опре­

деляем новую точку Р ( 2 ) . Все вычисления сводятся к последующему определению составляющих вектора. Расчеты производятся по фор­ мулам

p t + 1 ^ p P ~ X K ( F P X

ntk+l)

(І . П)

Pi

р Г" = Р$]

-ЫК„)ь

где к — 1, 2, . . . — номер итерации. Предварительно необходимо вычислить коэффициент K K . Если при составлении и решении урав­ нения (1.10) возникают трудности, то можно воспользоваться при­ ближенным значением Х К , определенным по методу Ньютона. В от­ личие от точного, приближенное значение коэффициента обозначим

 

 

F k

(1.12)

Большой

интерес

представляет

значение функции F =

F K O I L

при котором

процесс

минимизации

может быть закончен.

Будем

16


считать, что погрешность в вычислении функции определяется толь­ ко погрешностью наблюдений, а все вычисления производятся зна­ чительно точнее. В этом случае погрешность можно заменить диф­ ференциалом функции

 

п

 

 

 

 

 

 

A F = 2 2

яабл

{ХІ, Ус) — Утеор {XLT yt)\ ДК„абл.

 

Допустим далее, что разность наблюденной и вычисленной

анома­

лий в конце

счета не превысит

погрешности

наблюдений.

Тогда

 

 

 

 

 

n

 

 

 

FV.OH =

AF

=

2 2 (АѴнабл)3,

 

 

ИЛИ

 

 

 

 

 

 

 

 

 

F K

0 H

=

2,1 (АУнабл)2.

 

(1.13)

Необходимо

отметить,

что все это справедливо в том случае, если

аппроксимирующими телами можно точно описать возмущающие

геологические массы. Практически равенство (1.1) не аппроксими­

рует абсолютно точно наблюденную функцию,

и минимум функции

(1.2)

оказывается

отличным

от нуля. Если значение

погрешности

поля

А У н а б л

выбрано

малым,

то может

получиться

F M

I N

> A F =

=

F

K O I L .

В этом

случае

необходимо

минимизировать

функцию

(1.2) до возможно меньшего значения. Можно ожидать, что получив

монотонную

убывающую последовательность

{F*®},

мы

не

достиг­

нем

F

K M , причем

F I

K ) будет

мало

отличаться

от

F ( K

+ 1

) .

Целесообраз­

но

предусмотреть

остановку

вычислений 'по критерию

относитель­

ной

разности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

І ^ - ^ І

= Д .

 

 

 

 

( І Л 4 )

Величина А может быть определена из модельных исследований или устанавливается в процессе опробования конкретных практических задач.

§ 2. ДРУГИЕ ВАРИАНТЫ З А Д А Ч И

Могут быть и другие подходы к сопоставлению наблюденной и теоретически вычисленной функции. Рассмотрим некоторые из них.

I . Составим функционал

п

 

 

 

F = S

I Унабл (*,, Уд Vjeop {X[, tft) |.

(1.15)

i = l

 

 

 

Последнее выражение

может быть записано

несколько

иначе.

В (1.15) входит п слагаемых, каждое из которых

берется по

абсо­

лютному значению. Эти слагаемые разделим на две группы. В пер­

вую включим те, где [ У н а б л іг г//) —

У т е о Р г , уі)] > О,

во

вто­

рую — остальные. Число слагаемых,

которые оказались

в первой

2 2-1445

Г о с . п у б л и ч н а я

é 17

и * у ч н о - т э х н и .ѳ • к а я * б и б л и о т е к а С С О Р

Э К З Е М П Л Я Р Ч И Т А Л Ь Н О Г О 3 * " *