Файл: Брандин, В. Н. Основы экспериментальной космической баллистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 218

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

оценок. Однако критерий (5.1.4) неудобен в вычислительном от­ ношении, так как вводит в расчеты не всюду дифференцируемую

функцию. Критерий

(5.1.5)

в вычислительном отношении явля­

ется более удобным.

 

 

 

Если совокупность дискретных моментов измерений обозна­

чить вектором t = \txt2 ...

tj\f

и ввести в рассмотрение вектор

u\q,

t) = \ u T{q, l{)

■■■ : u r(q, tN)\r,

то связь между вектором ошибок измерений h и вектором оцени­ ваемых параметров q на основании выражений (5.1.1) и (5.1.2) запишется в виде

h = z — u(q,t).

(5.1.6)

Подставив выражение (5.1.6) в выражения (5.1.4) и (5.1.5), получим следующие развернутые формы критериев качества ре­ шения поставленной задачи:

a{q) = \ z - u [ q , t ) \ '

(5.1.7)

г

 

И

 

a (q)--=[z — u(q, t)]T[z — u(q, t)\.

(5.1.8)

Метод обработки результатов измерений по

минимуму кри­

терия (5.1.7) в литературе иногда называют методом наимень­ ших модулей. Вычислительная процедура минимизации критерия (5.1.7) может быть построена на базе алгоритмов линейного про­ граммирования.

Метод обработки «результатов измерений по минимуму крите­ рия (5.1.8) получил название метода наименьших квадратов.

Условия минимума критерия (5.1.8) могут быть получены анали­ тически.

Параметры q) (/=1, ..., г) в формулах (5Л.7) и (5.1.8) явля­ ются уже варьируемыми величинами в отличие от действитель­ ных значений этих величин, которыми они являлись по смыслу

в формуле (5.1.1). Однако

пока мы не будем вводить отличи­

тельного индекса, так как

смысл величин легко уяснить по той

математической операции,

в которой они участвуют.

Условимся производную от скаляра а по вектору b записы­ вать в виде матрицы-столбца, а производную от вектора а — по

вектору b в виде прямоугольной матрицы,

столбцами которой

являются производные

от элементов аь вектора а по вектору Ь.

В соответствии с этим правиломиз

(5.1.8)

получим

da

п du (q, t)

г

,

. ,

где производная от вектора и по вектору q представляет собой прямоугольную /"ХшУ-матрицу.

134


Отсюда необходимые условия экстремума критерия (5.1.8) запишутся в виде матричного уравнения

0. (5.1.9)

Уравнение (5.1.9) представляет собой чистему г уравнений с

г неизвестными qj (/=1, ..., г). Однако если матрица —— со- dq

держит линейно зависимые строки, то легко видеть, что среди этих уравнений будут эквивалентные. В этом случае система уравнений (5.1.9) будет неопределенной. Отсюда следует, что необходимым условием существования определенного решения системы (5.1.9) является условие равенства г ранга функцио­ нальной матрицы частных производных от измеряемых функций по оцениваемым параметрам. Так'как в общем случае (5.1.9) представляет собой систему нелинейных уравнений, то и при соблюдении указанного условия может быть несколько решений. Число решений можно сократить в соответствии с достаточным условием минимума

a{q) — va\na{q).

(5.1.10)

{<?}

 

Ошибки измерений могут быть неравноточными по времени или по физической природе измеряемых функций. Если веса из­ мерений, введенные в предыдущей главе для характеристики различной степени разброса ошибок относительно их математи­ ческих ожиданий, известны по условиям опыта, то их необходи­ мо учесть при составлении критерия качества.

Пусть задана диагональная весовая матрица ошибок измере­ ний Р. Тогда в качестве критерия оптимальности, обеспечиваю­ щего равномерную близость ошибок измерений к нулю в их со­ вокупности, следует взять критерий

m N

 

ЛтP h = ^ p M l

(5.1.11)

v=l

Метод определения оценок неизвестных параметров по мини­ муму критерия (5.1.11) в литературе, иногда называют методом взвешенных наименьших квадратов.

Легко видеть, что система уравнений для определения оценок неизвестных параметров qs (/=1, ..., г) в этом случае запишется в виде

du

' L p fg - t tfa r, f)] = 0.

(5.1.12)

dq

Этой системе присущи те же особенности, которые были от­ мечены для системы (5.1.9). Если измеряемая вектор-функция является линейной по отношению к оцениваемому вектору, то


(5.1.9) и (5.1.12) представляют собой системы линейных алгебра­ ических уравнений. В этом частном случае обработка измерений по методу наименьших квадратов обладает достаточно простой вычислительной схемой.

Метод наименьших квадратов допускает различные модифи­ кации, расширяющие область его использования при более слож­ ных условиях опыта.

Метод наименьших квадратов требует для своего использо­ вания минимальной информации об ошибках измерений, а имен­ но, необходимы только сведения о математическом ожидании ошибок. Однако оптимальность оценок, получаемых по методу наименьших квадратов, остается неясным вопросом, так как для выяснения оптимальности оценок необходима более полная ин­ формация о статистических свойствах ошибок измерений.

§ 5.2. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ

Метод максимального правдоподобия разработан Р. Фише­ ром в начале XX столетия, примерно через сто лет после появле­ ния метода наименьших квадратов. С появлением метода макси­ мального правдоподобия метод наименьших квадратов получил полное теоретико-вероятностное обоснование. Этот метод также широко используется для обработки измерительной информации, получаемой в процессе проведения космического эксперимента.

.Рассмотрим опять основную зависимость (5.1.1):

y = u{q, t).

Пусть в результате дискретных по бремени измерений имеет­ ся система условных уравнений

z i = u {q ,ti)-\-hi (/=1 , . .. , TV),

(5.2.1)

такая же, как (5.1.2). Предположим, что на этот раз имеется более полная информация о векторе ошибок измерений

А=Цл1!А2

задаваемая функцией плотности его вероятностей p{h), опреде­ ленной с точностью, быть может, до конечного числа параметров. Символически это предположение запишем в следующем виде:

А*6/>(А). (5.2.2)

Необходимо в условиях заданной модели измерений

(5.2.1) (5.2.2) оптимальным образом определить оценки qj не­ известных параметров. Воспользовавшись соотношением (5.1.6), представляющим собой матричную запись уравнений (5.2.1), за­ пишем плотность вероятностей ошибок измерений в виде

p{h) = p{z — u\q, t)).

136

Следует заметить, что при функциональном преобразовании случайных величин необходимо плотность вероятностей умно­ жить на модуль Якобиана преобразования. В данном случае это будет единица, так как преобразование тождественное.

Функция плотности вероятностей ошибок измерений, записан­ ная с учетом полученных измерений и содержащая в явном виде вектор оцениваемых параметров, в математической статистике называется функцией правдоподобия и имеет самостоятельное обозначение

L i e , q ) = p ( z — u{q,t))

(5.2.3)

Функция L {z, q) сохраняет все свойства плотности вероят­ ностей по отношению к выборке г . Вектор оцениваемых пара­ метров q является для этой функции вектором параметров рас­ пределения. Очевидно, необходимо так определить вектор q параметров распределения, чтобы соответствующая ему выбор­ ка измерений ? была наиболее вероятной.

Метод обработки результатов измерений с соблюдением ус­ ловия

L (г, <7)=max L(z; q)

' '

(5.2.4)

\ч)

 

 

называется методом максимального правдоподобия.

макси­

Критерием качества решения задачи здесь

является

мальная величина плотности вероятности ошибок измерений, в то время как в предыдущем параграфе критерием, была мини­ мальная величина» суммы квадратов ошибок. В критерии макси­ мального правдоподобия учитываются не столько совокупные свойства ошибок измерений, сколько конкретные свойства каж­ дой ошибки в отдельности и свойства их взаимной зависимости. Необходимые условия экстремума функции (5.2.3) записывают­ ся в виде матричного уравнения

^ - = 0 .

(5.2.5)

dq

 

Таким образом, имеется система г уравнений с г неизвест­ ными qj (/=1, ..., г), которые обычно называются уравнениями правдоподобия. Уравнения (5.2.5), несмотря на более короткую форму записи, обычно сложнее уравнений (5.1.9). Неизвестные параметры qj входят в уравнения (5.2.5) в результате довольно сложной суперпозиции измеряемой вектор-функции и функции плотности вероятностей, а не таким простым способом, как это видно из уравнений (5.1.9).

Если система частных производных —(у"=1, . .. , г ) ли- dq)

нейно зависима между собой, то система уравнений (5.2.5) будет неопределенной. Неопределенность системы уравнений здесь за­

137


висит не только от измеряемой вектор-функции, но и от функции плотности вероятностей.

Среди решений уравнений (5.2.5) находятся оценки макси­ мального правдоподобия. Оценки должны удовлетворять доста­ точному условию максимума функции правдоподобия, т. е. ус­ ловию (5.2.4). Сами оценки являются случайными величинами. Если оценки имеют приближенно нормальное распределение, то их оптимальность в достаточной-мере определяется вектором ма­ тематических ожиданий и корреляционной матрицей

Оценки, для которых

т - = д,

(5.2.6)

называются несмещенными.

Потенциальную точность несмещенных оценок в статистике принято характеризовать информационной матрицей Фишера

F = M

rf2 In L

(5.2.7)

 

dqdq

элементами которой являются математические ожидания вторых

частных производных от логарифмической функции правдопо­ добия:

f * ? = M

Э2 1n L

~[

д<Ь д<1$

J’

 

Имеет место следующее утверждение. Для любого набора 'несмещенных оценок с корреляционной матрицей В~ выполняет­ ся неравенство

аТР ~1а,

(5.2.8)

где а — произвольный вектор размерности г. Оценки, которым соответствует знак равенства в выражении (5.2.8), носят назва­ ние. совместно-эффективных оценок. Им соответствует наимень­ ший корреляционный эллипсоид, характеризующий рассеивание оценок. Однако оценки максимального правдоподобия получа­ ются несмещенными только при некоторых требованиях, налага­ емых на функцию правдоподобия.

Заметим, что мы рассмотрели метод максимального правдо­ подобия безотносительно к виду закона распределения ошибок измерений. А теперь рассмотрим случай, когда вектор ошибок измерений h принадлежит к распределению с нормальным зако­ ном, имеющим нулевой вектор математических ожиданий и диа­ гональную корреляционную матрицу aV 3-1. Для этого случая плотность вероятностей вектора h запишется в виде

_ ик

з_

/>(й)=(2яз§) 2

| Я | 2 ехр ( ----- —l V P h

 

I. К

138


Отсюда получаем функцию правдоподобия

m N

1

 

L{z; <7)= (2ято) 2

| P I 2 exp

, t)]c P[z — u(q,t)

 

 

I

Исследуем функцию правдоподобия на максимум. Посколь­ ку функция L(z, q) всюду не отрицательна, то для нее сущест­ вует логарифм, а поскольку логарифм — функция монотонная, то максимум логарифмической функции находится в той же точ­ ке, что и максимум самой функции. Поэтому исследование на максимум функции L(z, q ) можно провести с ее логарифмом:

In\L (г; q)=

In (2яа§)+ ± 1 п \ Р \ -

 

----- —l [z — u(q, t)\TP \ z — u{q, *)].

(5.2.9)

2°о

 

 

Пз выражения (5.2.9) видно, что независимо от значения дис­ персии эталонного измерения о2о максимум In L (z, q) дости­ гается при таком выборе вектора q, которому соответствует минимум положительно определенной формы:

a(q) = [z— u(q, t)]TP[z — u(q, t)].

а

(5.2.10)

Приравнивая к нулю производную от выражения (5.2.10) по вектору<?, получим матричное уравнение правдоподобия

— -(<у: П P[z — u(q, f)] = 0.

(5.2.11)

dq

 

Уравнение (5.2.11) совпадает с уравнением (5.1.12). Пз это­ го факта следует, что метод наименьших квадратов является частным случаем метода максимального правдоподобия. А имен­ но, в случае несмещенных и независимых ошибок измерений, подчиняющихся нормальному распределению, комбинирующих с измеряемыми параметрами аддитивным способом, метод мак­ симального правдоподобия предписывает те же требования, что и метод наименьших квадратов. Отсюда также следует, что толь­ ко в этом случае оценки по методу наименьших квадратов явля­ ются оптимальными в смысле метода максимального правдопо­ добия.

Определив вектор оцениваемых параметров q , можно найти оценку вектора ошибок по формуле

h = z — u(qvt).

(5.2.12)

Подставив (5.2.12) в (5.2.9), получим

InL{z\ q)= --^у-1п(2яо§) + - l l n |P | -----

139