Файл: Сирл, С. Матричная алгебра в экономике.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 153

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г Л А В А

ЛИНЕЙНЫЕ МОДЕЛИ

1. ВВЕДЕНИЕ

Несомненный интерес в регрессионном анализе вызывает особый вид переменных х, известных как фиктивные переменные. Фиктивные, переменные применяются в регрессионных моделях для указания на присутствие или отсутствие различных признаков. Их значение всегда равно нулю или единице. Метод их применения известен как регрес­ сия на фиктивные переменные или как анализ линейных моделей. Введение фиктивных переменных, как мы увидим, приводит к тому, что матрица Х'Х становится вырожденной и в связи с этим уравнение

X'ХЬ = Х'у из главы X не может быть решено с помощью (Х'Х)-1. Общепринятый метод получения решения заключается в применении обобщенной обратной матрицы, рассмотренной в главе VII. Простой пример послужит здесь введением в общие идеи метода.

Пример. Мы воспользуемся уменьшенной моделью, рассмотрен­ ной Хендерсоном, Xиндом и Брауном [3] в докладе,о влиянии на про­ дажу яблок различных стратегий рекламы, использованных в рек­ ламной кампании в пункте сбыта. В одном городе было шесть мага­ зинов, охваченных этой кампанией, три из которых в своих рекламах

делали

упор на

пользу яблок, два других — на целебные свойства их

и один

магазин

не выбрал никакого специального направления. Дан­

ные о сбыте в шести магазинах приведены в табл.

1.

 

 

 

Таблица

1

Сбыт яблок в шести магазинах,

 

применяющих различную стратегию

 

 

 

рекламы

 

 

Упор

на

У пор

на ц ел еб ­

О тсу т стви е

по л ьзу

яблок

ные

свойства

стр ат еги и

 

яблок

 

 

 

 

 

101

 

84

3 2

 

105

 

8 8

 

94

 

 

3 0 0

 

172

3 2

 

Обозначим показатели сбыта /-го магазина, избравшего i-ю стра­ тегию рекламы как уц\ i принимает соответственно значения 1, 2 и 3


для рекламы с упором на пользу яблок, на целебные свойства их и для рекламы без специального направления; / = 1, 2, пр, tii — число наблюдений при осуществлении /-й стратегии. Задача заклю­ чается в оценивании влияния стратегии рекламы на сбыт. Для того

чтобы

выполнить это, предположим, что наблюдения y tj

представ­

ляют

собой суммы, состоящие

из трех слагаемых:

 

 

У Н

Р ®г “Ь @ i j i

( 1 )

где р — средний размер сбыта, исчисленный для всей совокупности; а, — эффект г'-й стратегии; etj — член, характеризующий случайную ошибку, свойственную наблюдению уц.

Предположим, что etj независимо распределены и имеют нулевое математическое ожидание, т. е. Е (eiy-) = 0. Тогда Е (yi}) = р + а*. Кроме того, предположим, что каждая величина вц имеет одну и ту жё дисперсию о, так что ковариационная матрица, характеризующая вектор элементов е, равна о2/. Такая модель, очевидно, линейна, поскольку она основывается на предположении о том, что уц пред­ ставляет собой простую сумму трех компонент р, ссг и вц. Часто модели такого типа называют одномерной классификационной моделью, так как имеется только одна классификационная шкала, а именно избран­ ные направления рекламы. Эти три направления будем называть тремя классами.

Проблема заключается в оценивании членов р и а, а также диспер­ сии ошибки а2. Ни р, ни а не могут быть удовлетворительно оценены; можно получить лишь их линейную функцию. Однако это не должно вызывать беспокойство, поскольку число линейных функций, которые можно оценить, велико и обычно включает функции, представляю­ щие интерес, а именно разности между классами, такие, как а х — ац2. Иногда, однако, эти разности нельзя удовлетворительно оценить в свя­ зи с небольшим объемом данных. Во всех случаях возникает необ­ ходимость в методе, с помощью которого выясняется, какая функция может быть оценена удовлетворительно, а какая не может. Это обес­ печивается подходом, который излагается далее.

Для вывода метода оценки запишем шесть наблюдений в виде урав­

нения (1) модели:

 

 

 

 

 

101 =

у 1г =

р -f

а 1 +

е11;

105

=

у 12 =

р +

а х

е12;

94

=

у 1з =

р +

<хг +

е13;

84 =

у 21 =

р +

а 2 +

^2i>

88 =

у 22 =

р +

а 2 +

е22;

32 =

у эх =

р +

а 3 +

е31.

ю Зак. 425

289


Эти уравнения легко записать в матричной форме как

~ 101

Уи

' 1 1 0 0 “

 

O i

105

1/12

1 1 0

0

Е

^12

94

Ю з

1 1 0 0

а х

_L е)3

84

1/21

1 0

1 0

а 2

1

621

88

Угг

1 0

 

1 0

 

 

32 _

_ 0 3 1 _

1 0 о L

 

_ 6 з 1 _

или

как

У — ХЬ е,

(3)

 

 

где

у — вектор

наблюдений; X — матрица, состоящая из 0 и

1;

b' =

[pax а 2 а з1 — вектор параметров, которые должны быть оцене­

ны;

е — вектор

ошибок.

 

Заметим,

что уравнение (3) имеет точно такой же вид, что и (6)

в параграфе

2 главы X. В обоих случаях у и е представляют собой со­

ответственно наблюдения и ошибки, а b есть вектор параметров, чьи

оценки желательно

получить. Кроме того, свойства е те же самые:

Е (е) = 0, так что

Е (у) = ХЬ и Е {ее') = о2/. Единственное раз­

личие заключается в форме X: в регрессии — это матрица наблюде­

ний переменных х,

тогда как в (3) элементы матрицы — нули или

единицы в зависимости от наличия определенного члена модели в каж­ дом наблюдении y tj. Что касается применения принципа наименьших квадратов для оценивания элементов вектора Ъ, то между уравнением (3), приведенным здесь, и уравнением (6) из параграфе 2 главы X нет различия. Следовательно, способ наименьших квадратов, рассмотрен­

ный в главе X, дает Ь, удовлетворяющие нормальные уравнения:

Х ’ХЬ = Х'у.

(4)

В обычном регрессионном анализе решение относительно Ь получают как

В = {Х'Ху^Х 'у,

причем Х 'Х — невырожденная матрица и, следовательно, имеется обратная к ней матрица. Однако, как мы покажем далее, Х 'Х не имеет обратной матрицы. Тем не менее для получения решения с успехом могут быть применены методы определения обобщенной обратной матрицы.

2. НОРМАЛЬНЫЕ УРАВНЕНИЯ И ИХ РЕШЕНИЯ

Найдем решение нормальных уравнений (4). Отметим, что для матрицы X, состоящей из нулей и единиц, произведение

6 3 2 1

Х 'Х

3 3 0 1

2 0 2 0

1 0 0 1

290


представляет собой вырожденную матрицу (ее первая строка равна сумме трех других строк). Это общий случай. В анализируемой ли­ нейной модели общего характера, которая здесь обсуждается, Х'Х —■ почти неизменно вырожденная матрица. В соответствии с этим ее ранг,

скажем г, меньше ее порядка и Ь не

может быть получено как

(Х'Х)-1 Х'у.

Решение достигается с помощью

обобщенной обратной

к Х'Х матрицы.

 

матрица, такая, что

Пусть G

есть обобщенная обратная к Х'Х

X'XGX'X =

Х'Х. Предположим здесь,

что только G удовлетворяет

этому уравнению вне зависимости от того, определена ли она с помощью метода, рассмотренного в параграфе 3 главы VII, или с помощью ка­ кого-либо другого метода. Кроме того, определим, что Я = GX'X. На основе этих определений, опираясь на теорему 2 из раздела а па­ раграфа 4 главы VII, можно сразу решить нормальные уравнения (4) следующим образом:

Ь — GX'y — /) z,

(5)

где г — произвольная величина. Это означает, что не существует

единственного решения для Ь, поскольку по своей природе Х'Х — вы­ рожденная матрица. Неоднозначность решения нормальных уравнений обсуждается во многих работах. При этом обычно речь идет о том, что для уравнений типа (4) привлечение так называемой удобной связи, или очевидного ограничения (например, а 1 + а 2 + а 3 = 0), дает возможность получить единственное решение. На самом деле, только для отдельных частных случаев это ограничение удобно, а для общего случая нет удобных или очевидных ограничений, которые позволяют получать решения. О решении с помощью введения дополнительных уравнений такого характера («условий», «связей» или «ограничений») написано очень много, почти любой учебник по планированию экспе­ риментов ссылается на них, поэтому мы не останавливаемся на этой проблеме. Здесь мы рассматриваем решение, представленное в (15), полученное с помощью обобщенной обратной матрицы. Проверим

теперь свойства элементов вектора Ь, полученного таким путем.

3. СВОЙСТВА РЕШЕНИЯ

а) ДОПУЩЕНИЯ

Как и для уравнений (13) и (14) из главы X, мы предполагаем, что Е (е) = 0 и var (е) = о2/ есть ковариационная матрица ненаблюдае­ мых случайных ошибок.

б) МАТЕМАТИЧЕСКИЕ ОЖИДАНИЯ И ДИСПЕРСИИ

Определим математические ожидания членов уравнения (5):

Е (b) = GX'E (у) + (Я — I) Е (г) = GX'Xb +

(Я — /) 2.

Поскольку Я = GX'X, то

 

Е (6) = Я6 + (Я — /) 2,

(6)

10*

291


что отличается от b даже в том случае, если г представлено нулевым вектором. Однако, как будет показано, это обстоятельство не создает затруднений

Для того чтобы найти ковариационную матрицу для Ь, заметим, что

Ъ — Е (b) = GX'y НЪ = GX' (у — ХЬ) = GX'e,

это следует из (5) и (6). Отсюда

var {b) -- E[S — E (Ь)] [Ь Е (b)Y = Е (GX'ee’XG') -

= GX'E {ее') XG' СХ'оЧХС - GX'XG'o2.

(7)

В особом случае, когда G определяется с помощью метода, предложен­ ного в главе VII, G является симметрической и GX'XG — G. Таким

образом (7) сокращается до var (b) = Ga2. Эти условия относительно G не будут общими для всех обобщенных, обратных к Х 'Х матриц, следовательно, (7) должно рассматриваться как общее выражение для

var (6). Однако это обстоятельство не ограничивает полезности такого подхода.

в) НЕКОТОРЫЕ МАТРИЧНЫЕ РЕЗУЛЬТАТЫ

Далее мы в основном будем пользоваться матричными результатами, которые вытекают из определения G, именно:

X'XGX'X = Х 'Х .

Транспонирование этого выражения дает

X'XG'X'X = Х'Х ,

откуда видно, что G — также обобщенная обратная к Х 'Х матрица. Более того (см. упражнение 13 главы VII), GX' есть обобщенная обрат­ ная к X матрица и, следовательно,

 

XGX'X = V, т. е. ХН = X

(8)

и XGX' является единственным для всех G.

(9)

Кроме того, транспонирование (8) дает

 

 

X'XG'X' - X'.

(10)

Этот результат также означает, что

 

 

(XGX')2 =

XGX'

(11)

и

(/ — XGX')2 =

(/ — XGX'),

(12)

т. е. что XGX' и (/ — XGX') идемпотентны (см. раздел б параграфа 3 главы VII). Заметим, что эти результаты, справедливые для любой обобщенной обратной к Х'Х матрицы G, справедливы и для G', посколь­ ку она также является обобщенной обратной к Х'Х матрицей.

292