Файл: Сирл, С. Матричная алгебра в экономике.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 161

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

щие отношение к свободному члену, могут быть получены непосредст­

венно, а не как часть вектора Ь. Таким образом, записав модель со свободным членом как у = Х*Ь* + е, мы определим X* и Ь* в (10)

через X и Ь. Выражение оценок Ь* = (Х*'Х*)-1 Х*'у через X и использование Ъ = (Х'Х)-1 Х'у приводят к непосредственному опре­ делению свободного члена Ь0и, что более важно, к определению вектора

Ъ, независимого от свободного члена. Эти результаты важны, посколь­ ку они представляют собой подходы, используемые в большинстве программ регрессионного анализа, реализуемых на ЭВМ.

Здесь мы просто констатируем эти результаты; что касается выводов, то их можно сделать, выполнив упражнение 11. Прежде всего опреде­

лим у как среднюю арифметическую на блюдений у и введем вектор средних наблюдений w:

Можно показать, что-

w'

•= [хг х г

... xh\.

 

(22)

 

 

 

 

 

 

Ь - - ( Х ' Х nww')~x(X 'y nyw);

(23)

 

var (b) = ( X 'X nww')-1о2;

 

(24)

 

 

cov (b, у ) = 0;

 

(25)

 

 

b0— у хю'Ъ\

 

(26)

var

(b0) =

+

w' (X'X nww')-1

о2;

(27)

cov

(b0,

b) =

— (X 'X

nww')-1

wo2\

(28)

SSE = y'y — b*’ X*' у =■--у ’у ny2 — b' (X ’y — nyw).

(29)

Особенно важны выражения (23),

(24) и (29). Исходя из существа

вектора w, определенного в (22), следует, что nww' есть матрица, чьи элементы представляют собой поправочные коэффициенты для сумм квадратов и произведений переменных х, которые являются элементами матрицы Х'Х . Отсюда Х 'Х nww' есть матрица скорректированных сумм квадратов и произведений переменных х. Аналогично этому Х'у

nyw есть вектор скорректированных произведений переменных хи у. Таким образом, (23) и (24) представляют собой точно такие же формы,

чтоб = (X' X)"1 Х'у и var (b) = (Х'Х)-1 ст2, полученные в (7) и (17). Отличие заключается лишь в применении скорректированных сумм квадратов и произведений вместо нескорректированных этих величин. Аналогично этому (29) — точно такая же форма, что и SSE = у'у

Ь'Х'у в (18), в которой использованы скорректированные величины.

Следовательно, записанные

в символах

формы b = (Х'Х)-1 Х'у,

var (b) = (Х'Х)-1 о2 и SSE =

у ' у Ь'Х'у

применимы как для моде­

ли со свободным членом,

так и для модели без него.

В обоих случаях

они дают оценки (и их

ковариационную

матрицу)

коэффициентов

' 272


регрессии, а также сумму квадратов ошибок SSE. В случае, если нет свободного члена, Х 'Х .и Х'у представляют собой нескорректи­ рованные суммы квадратов и произведений, тогда как при наличйи свободного члена они будут скорректированными суммами.

Оценивая с помощью (18) или (29) о2 для модели со свободным чле­ ном, мы должны внести поправку в уравнение (21), которое применимо для модели без свободного члена. Модель о свободным членом можно представить, введя искусственную переменную x i0 в (8), как модель без свободного члена с k + 1 переменной. Следовательно, для модели со свободным членом, определяя SSE с помощью (18) или (29), можно записать

а2

SSE

(30)

 

п k 1

 

Пример (продолжение). В (12) Ь* было найдено непосредственно

как (Х*'Х*)-1 Х *’у. Теперь определим элементы Ь0 и b этого вектора с помощью только что рассмотренных формул. Для имеющихся данных получим

2 # i ^ 8 1 ;

2

Mi = !3;

2*22^19;

I У\ -1123;

2 * п = 3 5 ;

\Д?2 = 87;

Ц Уг Хп = 189;

Z x n xi2=--54;

% угх12=--283.

Следовательно, w’ = [хг

х2]=

[ 13

 

191»

 

 

 

 

 

6

 

6

 

 

 

 

 

3 5 -

132

 

 

54

13-

(Х'Х—nww')~1 =

■V

6

 

 

 

6

 

 

13 •

19

 

87— 192

 

54

 

 

 

 

 

 

6

 

 

6

1^ 1

с

—1

 

 

161

77 ~

I

 

 

 

 

 

-С-

 

 

 

 

|

 

 

 

 

 

112

112

6

 

 

=

 

 

77

161

 

 

 

 

77

41

6

6

 

 

 

 

 

112

112

 

_

 

189 — 13-81 ~

“ 81

 

 

 

 

 

6

 

6

у nyw =

 

283 —

19-81

159

 

 

 

6

 

L 6

 

 

 

 

 

 

 

Из соотношений (23), (31) и (32) следует, что

161

_

77

81

~

133“

112

 

112

 

 

6

 

 

112

Ь =

 

41

 

 

159

 

 

47

77

 

 

 

 

 

112

 

112

 

_

е

_

 

112

(31)

(32)

(33)

273


и и з (2 6 ) и (3 3 ) — ч т о

 

 

 

133

 

81

_13_

J9

112

1075

6

6

6

47

- 112

 

 

 

112

 

Эти значения корреспондируют значению Ь*, полученному в (12). Аналогично на основе (27) и (31) имеем

var(b0

■13

19

1

6 г _ 6

6

112

 

"161 — 77'

77 41J

- 13 “

6 129

19 тт^

6

и с помощью (28) и (31) получим

cov (b0, b) =

161

—77

-7 7

41

112

' 13

 

 

105_

6

о

=

112

19

а 2

37

 

 

6

 

 

112

Применение (24) и (31) дает

 

 

var(b)=

161

— 77

-7 7

41

112

Эти результаты полностью совпадают с выражением

var (b*) =

(А*' А*)-1 а 2,

аналогичным (17), в которое введено

(А*'А*)-1, как это показано

в (И).

Наконец, из (29) при условии (33) и (32) следует, что

SSE

1,123 —

812

133

А7_

6

159

 

 

6

112

112

 

 

 

 

 

 

6

 

177

3 041

_ 263

 

(3 4 )

 

6

112

112’

 

 

274


и, таким образом, на основе (30) получим

263 . „

263

( 3 5 )

(>- —'— / 3 - ■— .

112

336

 

4. КРИТЕРИИ СУЩЕСТВЕННОСТИ

До сих пор единственное допущение, которое было сделано относи­ тельно члена модели, характеризующего ошибку, заключалось в том, что они случайные и имеют некоторое распределение с Е (е) = 0 и Е (ее') = о2/; допущение о точной форме распределения принято не было. Если правдоподобно полагать, что это распределение нормаль­ ное, т. е. что ошибки нормально распределены, имеют нулевую среднюю и ковариационную матрицу а2/, то можно осуществить проверку суще­ ственности, тесно связанную с регрессионным анализом.

а) АДЕКВАТНОСТЬ МОДЕЛИ

Уравнения (6), (13) и (14) образуют вместе модель, которую мы рас­ сматривали до сих пор. Можно задать следующий вопрос, получая

оценки Ь на основе (7) или (23) и (26): насколько адекватна эта модель самим данным? Поскольку оценки Ь дают возможность оценить (или

предсказать) значения зависимой переменной, а именно у = ХЬ, то на этот вопрос можно ответить с помощью статистики, измеряющей взаимосвязь между наблюдениями переменных у и предсказанными их значениями. Коэффициент корреляции, иногда называемый коэфг

фициентом

множественной корреляции,

обозначается символом R)

В практике

чаще пользуются квадратом

коэффициента корреляции

R2, называемым коэффициентом детерминации. Он измеряетдолю общей дисперсии значений у, которая объясняется подобранной мо­ делью.

Так как R есть мера взаимосвязи, то коэффициент детерминации R 2 всегда находится между нулем и единицей. Чем ближе он к единице, тем лучше модель объясняет данные. Ддя испытания существенности модели может быть применено испытание, основанное на величине S2 и

свойствах Е-распределения1.

Выражения для нахождения R 2 и Е-ста-

тистики

показаны

в табл.

2 (см. стр. 276).

 

Выражение для

R2

в модели без свободного члена получено путем

записи

R 2 как — ^

у) ,

замены у на

ХЬ = X (Х'Х)-1 Х'у и

 

(У’у) (у'у)

упражнение 8).

Вывод Е 2 для модели со

упрощения результата

(см.

свободным членом содержится в параграфе 9.10 книги Сирла [10J. Величины Е, показанные в табл. 2, имеют Е-распределение с ука­ занными там же числами степеней свободы (D. F.). Они и представ­

ляют собой критерии адекватности изучаемых моделей.

'См., например, [2, с. 109].

2 7 5


Т а б л и ц а 2

R 2 и F для регрессионной модели с п наборами наблюдений и k независимыми переменными х

С т ат и ст и к а

М одель без свободного

члена

 

Коэффициент мно­ жественной кор­ реляции R

Сумма квадратов ошибок SSE

Коэффициент де­ терминации Rа

К-статистика

Число степеней свободы F

? = ЪУгУ1

~ Y ' Z y ? ( l y * )

SSE = у ' у Ъ ' Х ' у

[уравн. (18)]

г ( n - k ) R * t ~ k ( l - R 2)

( k , n k)

М одель со свободным членом

2 (t/г y) (yt—y)

R =

У ш - уГ Ы уг-У?\

SSE = y ' y — n y 2 b ' ( x ' y n y w j

[уравн. (29)]

SSE

£2= 1— ;----- =T

y ' y — ny *

( n - k - l ) R * k(l-RZ)

( k , n k —1)

б) ДИСПЕРСИОННЫЙ АНАЛИЗ

Расчет F-критериев обычно обобщается в таблице дисперсионного анализа.

Сумма квадратов наблюденных значений у есть у'у, а скорректиро­

ванная сумма квадратов равна у'у пу2. С этими обозначениями со­ ответственно запишем общую сумму квадратов (SST*) для двух видов модели:

SST = у'у для модели без свободного члена

(36)

иSST = у'у пу2 для модели со свободным членом.

TenepbSSF= 2 (yt—г/,)2 есть сумма квадратов отклонений наблю­ денных у от их предсказанных значений. Поэтому разность между

SST и SSE, а именно SSR**

SSR = SST — SSE

представляет собой ту часть SST, которая относится к подобной регрес­ сии. Применяя (36) для SST и величину SSE, показанную в табл, 2, находим

SSR = Ь'Х'у для модели без свободного члена

(37)

и SSR=fr' (Х'уnyw) для модели со свободным членом. Величина SSR обычно называется суммой квадратов, объясняемой регрессией. Эта сумма относится ко всей модели без свободного члена; в модели со свободным членом она связывается с регрессией на пере­ менные х (исключая влияние средней).

Расчленение таким путем SST на две части (SSR и SSE) — ос­ новной процесс 'дисперсионного анализа. Обычно этот процесс обоб­

* SST — total sum of squares. — Прим, перев.

**SSR— sum of squares due to regression.— Прим, перев.

2 7 6