Файл: Сирл, С. Матричная алгебра в экономике.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 158

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

щается в таблице дисперсионного анализа. В табл. 3 показаны два варианта схем дисперсионного анализа — для модели без свободного члена и для модели со свободным членом. Хотя вывод показателей этих таблиц начинался с расчета SSE, a SSR определялся как SST —

— SSE, вычисления более удобно основывать на SSR, определяя SSE как SST — SSR. Такой подход вызван легкостью расчета SSR, как это показано в (37).

 

 

 

 

 

 

Т а б л и ц а 3

 

Дисперсионный анализ при k независимых

переменных

 

 

М одель без свободного

М одель со

свободным членом

И сточник

вариации

 

члена

 

 

D . F .

 

 

 

 

 

D . F .

(сумма кв ад р ато в

|

сумма

квадратов

Регрессии

на k

k

SSR = b ' X ’y

k

SSR =

b' (X'y nyw)

х-ов

 

n — k

SSE = SST — SSR

n k — 1

SSE = SST SSR

Ошибка

 

Итого

 

n

SST = y ' y

n-— 1

SST = y ' y — ny2

Вспомним нормальные уравнения, на которых основывались оценки

Ъв (7)

и (23);

 

Х'ХЬ' — Х'у для модели без свободного члена (38)

и

(Х'Х nww') 8' = Х'у nyw для модели со сво­

 

бодным членом.

Величина SSR в (37), таким образом, есть сумма произведений 8 с пра­ выми сторонами уравнений, на основе которых определяется Ь, отсюда каждое выражение (37) легко подсчитывается. В связи с этим в табл. 3 SSK определяется так, как это показано в (37), и SSE — как SST — —SSR. Величину R2 можно определить для обеих моделей на основе табл. 2 и 3 как

R 2

SSR

(39)

SST

 

 

Следовательно, коэффициент детерминации

R2 представляет собой

долю общей суммы квадратов, которая учитывается подобранной

регрессией (для модели со

свободным членом, исключая влияние

средней). Кроме того,

поскольку из (21) и (30) следует

 

 

SSE

для

модели без свободного члена

 

 

о2 = ----

 

и

пk

 

.

(40)

 

 

-

SSE

для

модели со свободным членом,

 

а2 =

----------

 

п—k 1

то из табл. 2 и 3 видно, что для обеих моделей

 

ko2

(41)

 

2 7 7


Часть табл. 3, относящаяся к модели без свободного члена, основная, она представляет собой исходную позицию для разработки ана­ логичной части таблицы, относящейся к модели со свободным членом. Соответствующие обобщения рассматриваются в разделе д параграфа 4. В связи с тем, что наиболее часто применяется модель со свободным членом, дальнейшее обсуждение ограничивается Только этой моделью.

Пример (продолжение). Вернемся к анализу ранее рассмотренного примера, полагая, что модель со свободным членом имеет 2 независи­ мые переменные. Для расчета табл. 3 необходимо определить

SS1R .

V (X ' у пут) -

 

 

81 _

 

113

47

6

3 041

112

112

159

112

 

 

6

 

и

SST //'//. nif1 1 123— — — — .

Отсюда

 

6

6

177

3041

263

SSE = SST —SSR

IT

112

112 ’

 

как это и было получено ранее в (34). Таким образом, для данного примера получим следующие результаты (см. табл. 4). По формулам (39), (40) и (41), взяв данные табл. 4, получим

/— — 0,92;

11 2 / 6

/ (6—2 — 1) = — - 0,78.

112/

336

Т а б л и ц а 4

Дисперсионный анализ (модель со свободным членом)

И сточник вариации D . F . Сумма квадратов

Регрессия

2

 

SSR =

3041/112

Ошибки

3

 

SSE =

263/112

Итого

5

 

SST =

117/6

р

_ 3 041

 

/ 2 (263) __ 3 (3 041) _

j 7

3

 

112

/

336 ~~ 2 (263)

 

F -статистики имеют распределения с двумя и тремя степенями свобо­ ды; табличное значение этих статйстик при 5%-ном уровне равно 9,55. Отсюда, поскольку 17,3 >■ 9,55, мы можем заключить, что при 5%-ком уровне существенности гипотеза о том, что Ьг = Ь2 = 0 должна быть отвергнута.

2 7 8


в ) П О Д М Н О Ж Е С Т В А П ЕРЕМ ЕН Н Ы Х

Предположим, что подмножество, состоящее из р переменных х, представляет вторичный интерес по сравнению с остальными k р переменными. Тогда у нас может возникнуть намерение проверить, вносят ли эти р переменных существенный вклад в регрессию помимо k р переменных. Для того чтобы осуществить это, мы подбираем две модели: сумму квадратов регрессии назовем SSRft для первой, содержащей k переменных х, и SSRfe_p для второй модели с k р переменными х. Тогда для испытания того, являются ли р пере­ менных среди всех k переменных существенными для регрессии, подсчитаем

р _ ( f l - A - l ) ( S S R ft- S S R ft-p)

 

,42ч

р (SST — SSR/j)

^ >

Этот критерий имеет f -распределение с р и п k — 1 степенями сво­ боды. Расчет F может быть обобщен и представлен в таблице диспер­ сионного анализа (см. табл. 5).

 

 

 

 

Т а б л и ц а 5

 

Дисперсионный анализ для модели со свободным членом:

 

 

(испытание р из k переменных)

 

И с т о ч н и к в а р и а ц и и

D . F .

С у м м а к в а д р а т о в

Регрессия

на

k р, пере­

k p

SSR^_р

менных

 

 

 

 

Регрессия

на р

переменных

Р

SSRa—SSR^_p

Ошибка

 

 

п k 1

SST —SSRft

 

Итого

 

п 1

SST

Расчет трех требующихся для анализа величин осуществляется следующим образом: обычным путем определяются SST = у'у пуг

и SSRfe = Ь'Х'у. Третья величина SSRp определяется косвенно как. разность'SSRh — SSRft_p (см. вторую строку табл. 5). Рассмот­ рим теперь р переменных х, чья существенность испытывается. Пусть соответствующие им коэффициенты b состоят из р последних элемен­

тов вектора Ь. Теперь разобьем Ь следующим образом:

b ' - r r [ b k ^ p

b p ] , .

где bp представляют собой исследуемые оценки. Кроме того, разобьем

обратную матрицу (Х'Х)-1 соответственно разбиению Ь. Для упроще­ ния записи при выполнении этой операции введем символ Т вместо (Х 'Х )-1 и получим2

Tl

rr

T

r p

 

(X' Х)-1 = Т

 

1

 

 

 

 

 

T

p r

T

p p

J

x

 

2 79



где г = k — р, а подписные индексы подматриц Т указывают на раз­ меры последних; помимо этого примем ТРт= (ТгР)'. Тогда для запол­ нения табл. 5 получим следующий результат1:2

SSRft-S S R к- р = Ь'рТ-р1Ьр.

(43)

Это выражение легко вычисляется: мы уже получили Ьр как часть Ь, а на основе (Х'Х)~Л получаем Трр и находим обратную к ней мат­ рицу2. Такой путь требует значительно меньше усилий, чем непосредст­ венное получение SSR, поскольку в последнем случае требуется определить обратную матрицу порядка k — р, тогда как выражение (43) требует найти обратную матрицу только порядка р X р. Когда k существенно выше р (а это обычно так и бывает), то косвенный метод имеет явное преимущество. Особенно это проявляется тогда, когда же­ лательно испытать несколько различных подмножеств из р перемен­ ных х. Кроме того, хотя здесь рассматривалось р последних перемен­ ных в последовательности х ъ х 2, ..., xh, описанный подход применим

к любым р переменным: возьмем коэффициенты вектора Ь, относящие­

ся к р переменным, и назовем их вектором Ьр. В матрице (Х ’Х)~г выделим подматрицу р X р, соответствующую этим же переменным. Назовем ее Т рр и определим обратную к ней матрицу Трр1. Тогда для

этих Ьр и Трр применимо выражение (43).

Пример (продолжение). Предположим, что в нашем примере, содер­ жащем две переменные х, нам необходимо испытать существенность введения первой переменной при наличии второй переменной.

Тогда k = 2 и р = l,,SSRft — сумма квадратов регрессии, определен- -

ной по двум переменным. Ее значение показано в табл. 4; SSR*. = •

Для получения SSRfe — SSRfe_p с помощью (43) нам необходимо найти Ьр — коэффициент регрессии для первой переменной. На основе

(33)

находим

 

Ьр =

Трр

является

ведущим элементом матрицы

(Х 'ХУ 1, где

Х 'Х — матрица

скорректированных сумм квадратов и

произведений. Отсюда по (31)

определим Трр =

161

таким образом,

уу^ и,

по

(43) находим

 

 

 

 

 

 

 

SSRft- S S R ft_p =

133 / ни

- 1

Ш _

1332

'

 

 

 

 

 

112 [112

 

TTi

иг-i6i

Подстановка

в

(42) SST — SSRft = 263 (по данным табл. 4) и п = 6

дают

 

 

 

 

 

 

 

 

 

 

 

р

(6—2— 1) 1332

112

 

 

 

 

 

1,3 ^

1-112-161

 

263 ’

 

 

 

1Это доказано

Сирлом

(см. [10, с. 246]).

 

 

 

 

 

23десь мы используем часть обратной к X ’X матрицы.

 

2 8 0