|
|
|
Т а б л и ц а 4 |
|
Дисперсионный |
анализ |
И сточник |
вариации |
D . F . |
Сумма квадр ато в |
Подобранная |
модель |
2 |
3 480 |
Ошибка |
|
3 |
70 |
Итого |
5 |
3 550 |
На основе (16), (27) и (28) получим
|
Я2 |
3 |
480 |
0,98; |
|
|
3 |
550 |
|
|
|
|
|
|
3 480 |
|
— = 74,57. |
(31) |
|
2(70/3) |
|
7 |
|
Критическое значение К2,з при 5%-ном уровне существенности рав но 9,55, так что нулевая гипотеза о том, что данная модель не содержит информации, должна быть отвергнута при данном уровне существен
ности. Как показано |
в |
табл. 2, |
функция |
а х — а 2 оцениваема, и, |
следовательно, |
проверяемая гипотеза имеет вид а х — а 2 = |
0. |
Выра |
зим это как Q'b = 0, |
где Q' — вектор, |
имеющий ранг s = |
1; |
Q' |
= |
[0 1—1 |
1]. |
Находим, |
|
5 |
Q'b — 14 и, следовательно, |
что Q'GQ = g, |
на |
основе |
(30) |
определяем, что |
статистика |
для проверки |
гипотезы |
а х = а 2 есть |
|
|
|
|
|
|
|
|
|
|
|
р = |
14 (5/6)~1t4 |
= 1 176/5 _ |
0 0 8 |
|
|
|
|
|
|
1 |
(70/3) |
70/3 |
|
|
|
|
при одной и трех степенях свободы. При 5%-ном уровне существен ности критическое значение F 1S = 10,13; таким образом, гипотеза а х — а 2 = 0 н е может быть отвергнута при данном уровне сущест венности.
Другую представляющую интерес гипотезу можно представить следующим образом: а 1 = а 2 — а 3. Это условие можно записать в уравнение (29) в виде Q'b = 0, и на этой основе по формуле (30) подсчитывается К-критерий, как это показано далее. По (20) и (29) имеем
0 |
1 |
—1 |
0~ |
0 |
- 14 |
100 |
0 |
1 |
0 —1_ |
86 |
68 |
|
|
|
|
32 |
|
и
|
0 0 |
0 |
О' |
|
|
|
|
|
О 1 1 О 0 |
1 |
0 |
О |
0 |
0 |
5 |
1 |
Q'GQ |
3 |
1 |
1 |
6 |
3 |
О 1 О —1 0 |
|
|
|
|
|
|
0 |
1 0 — 1 |
0 |
1 |
4 |
|
|
|
2 |
1 |
0 - 1 |
|
3 |
3 |
|
0 |
0 |
0 |
|
|
|
|
Отсюда при
{Q'GQ)-1
уравнение (30) дает
£
F2,« -[14 081
3
1
3
4 |
1 |
|
3 |
~ 3 |
ТГ |
1 |
и |
т — |
5 |
0 |
3 |
6 |
|
522
74,57.
7
Получено то |
же самое значение, что и- в (31), поскольку гипотеза |
а г — а 2 = а |
3 идентична гипотезе отсутствия модели (помимо модели, |
равной средней). |
6. СВОДКА РАСЧЕТОВ ПО ЛИНЕЙНОЙ МОДЕЛИ
В предыдущих параграфах было показано, что алгебра линейных моделей, так же как и линейных регрессий, может быть представлена с помощью матричных выражений, полностью пригодных для того, чтобы быть запрограммированными. Далее перечисляются формулы для определения допускающих оценивание функций, их оценки, дис персии оценок и соответствующие формулы дисперсионного анализа. Символом b обозначают вектор параметров модели.
Данные
п — число наблюдений;
у— вектор наблюдений;
у— среднее значение наблюдения;
X — матрица |
коэффициентов в модели; |
г — ранг матрицы X. |
|
Оценивание |
Х 'Х — матрица |
коэффициентов нормальных уравнений Х ’ХЬ = |
=Х'У,
Х'у — вектор сумм (правых сторон) нормальных уравнений;
G — любая обобщенная обратная к Х 'Х мат рица, удовлетворяющая X'XGX'X
-Л'Л;
ИGX'X.
|
|
|
|
|
w’ — вектор |
произвольных |
элементов; |
q'b = w'Hb — оцениваемая функция; |
|
q'b = w 'G X 'y — оценка |
оцениваемой функции; |
var (q'b) —q'Gqo2 — дисперсия оценки; |
|
сov (q(b, q'^b) =q[Gq2c> — ковариация оценок двух функций; |
SSE —у'у —Ь'Х'у — сумма |
квадратов |
ошибок; |
o2 = SSE/(n—г) — оценка |
дисперсии |
ошибки. |
Проверка существенности |
|
|
SST = у ’у — иг/2 — общая |
(скорректированная) сумма |
квадратов; |
|
|
|
SSM ==Ь'Х’у - т / = ' — сумма |
квадратов |
линейной модели; |
— y'XGX'y—пу2 |
квадратов |
ошибок; |
SSE = SST — SSM — сумма |
R 2 = SSM/SST — коэффициент |
детерминации; |
Fr_l n^r — SSMl(r — 1) о2 -— Е-статистика |
полной модели; |
Q'b = т — проверяемая |
гипотеза |
относительно |
s линейно-независимых оцениваемых функций;
Fs<n_r = [(Q'b— т)’ (Q'GQ)~1(Q'b — m)]lso2 —Е-статистика для гипо тезы Q'b — т, где Q' имеет ранг s.
7.ЗАКЛЮЧЕНИЕ
Вданной главе был приведен пример простейшего типа линейной модели, однако полученные здесь общие результаты в целом распро страняются на все линейные модели. Наиболее часто встречается та кой тип линейных моделей, который базируется на данных обследо вания, где обычно содержится множество группировок (а не одна, как в нашей иллюстрации) и где взаимодействие между группами, принадлежащими к разным группировкам, можно также учесть. Например, с помощью изложенного здесь метода линейных моделей
можно было бы проанализировать данные обследования рынка, в ко тором покупатели сгруппированы по возрасту, полу, уровню образо вания и получаемому доходу. Сирл [8] рассмотрел еще несколько слу чаев и привел пример модели, которая охватывает как обычные рег рессионные, так и фиктивные переменные. В этой и во всех других ситуациях, где анализируются данные, которые можно сгруппировать различными путями, непосредственно применимы рассмотренные здесь концепции и процедуры, а именно концепции и методы, которые относятся к выбору функций, допускающих оценки, к их оценкам и
к проверке гипотез. Во множестве работ эта проблема излагается с большой подробностью, например в работах Кемпторна [4], Андерсо на [1], Шеффе [7] и Грейбилла [2]. Однако ни один из них в явном виде не воспользовался обобщенной обратной матрицей. Дальней шее рассмотрение этого подхода можно найти у Рао [6] и Сирла [8]. О том, как эти методы связаны с ковариационным анализом в эконо мике, обсуждается в работе Лина и Уайта [5].
Упражнения
|
|
|
|
|
|
|
|
1. |
Проверьте гипотезу оц — |
а 3 для примера, |
приведенного в параграфе 4, |
если эта гипотеза проверяема. |
|
|
Х 'Х матрица, |
2. |
Покажите, |
что |
XG X', |
где G — обобщенная обратная к |
всегда симметрическая, |
даже, |
если G не является симметрической. |
3. |
Покажите, |
что |
если q'b |
есть оценимая |
функция, то |
уравнение (18) |
var (q'b) --- q'Gqa2 будет единственным для любой матрицы G независимо от того, симметрическая она или нет.
4. Рассмотрите следующую таблицу, элементы которой характеризуют
сбыт трех видов продукции при двух стратегиях |
рекламы: |
|
|
|
К оличество ( ш т . ) |
|
|
с тр атеги я 1 |
с т р ат е ги я 2 |
ИТО ГО |
Продукт 1 |
Уи |
Ун |
|
У1- |
Продукт 2 |
Ун |
У 2 |
|
Уг- |
Продукт 3 |
У3 1 |
У32 |
|
Уз- |
Итого |
У-1 |
У-2 |
|
у. . |
а) Напишите уравнение линейной модели для этой ситуации. |
б) Пусть наблюдения выражены в матричной форме у = |
ХЬ + е. |
Дайте развернутую запись для X и Ъ и получите Х 'у и Х 'Х . |
в) Получите |
симметрическую |
обобщенную |
обратную к |
Х 'Х матрицу G |
и рассчитайте Н — GX'X. |
|
|
|
г) Найдите общую систему оценимых функций. |
|
5. Продолжение упражнения |
4: |
|
|
а) определите в общем виде единственные, несмещенные оценки, которые |
были получены в |
требовании 2 упражнения 4; |
|
|
б) допустим, необходимо проверить гипотезу о том, что нет существенной разницы между сбытом продукта 1 и сбытом продукта 2. Проверяема ли такая гипотеза (иными словами, можете ли вы найти допускающую оценку функции, представляющую эту гипотезу)?
в) сколько имеется линейно-независимых допускающих оценку функций? Почему?
6 . Подходы регрессионного анализа и регрессии, использующей фиктивные переменные, можно скомбинировать. Рассмотрите следующие данные:
С тр атеги я |
П р о д у к т |
J |
Сбыт У ц |
Сбыт в п р еды ду |
рекламы |
|
щем го д у Х ц |
|
|
|
1 |
1 |
|
8 |
1 |
1 |
2 |
|
3 |
2 |
1 |
3 |
|
7 |
1 |
2 |
1 |
|
5 |
3 |
2 |
2 |
|
4 |
2 |
а) Напишите выражения для X и 6 уравнения у = ХЬ + е с помощью мо дели у и = р, + а г + Рл:г;- + <?,;•
б) Получите симметрическую обобщенную обратную к А'Л' матрицу и под считайте Н — GX' X.
в) Найдите общую систему оценимых функций. 7. Продолжение упражнения 6 :
а) определите систему единственных несмещенных оценок функций, полу ченных в требовании в упражнения 6 ;
б) |
какова оценка а х — ос2? |
в) |
найдите дисперсию этой оценки; |
г ) |
подсчитайте обычную оценку G. |
8 . |
Если G симметрическая обобщенная обратная к Х 'Х матрица, удовлет |
воряющая первые два из четырех условий Пенроуза (см. параграф 3 главы VII), и если
а = GX’y ; s = (у — Ха)' (у — Ха)
и
b = а — GQ (Q'GQ)-12345678(Q'a — т),
покажите, что:
а) s = у'у — а'Х'у,
б) Q'b = т.
ЛИ Т Е Р А Т У Р А
1.A n d e r s o n Т. W. (1958). Introduction to Multivariate Statistical Ana
lysis. Wiley, New York. (Имеется русский перевод: |
А н д е р с о н Т. |
Введение |
в многомерный |
статистический |
анализ. |
М., Физматгиз, 1963.) |
|
|
|
2. |
G г а у b i 1 1 |
F. |
А. |
(1961). An |
Introduction to Linear Statistical Models. |
Vol. I, McGraw-Hill, New York. |
|
F. |
and |
B r o w n S . |
E. |
(1961). |
3. |
H e n d e r s o n |
|
P. |
L., H i n d J. |
Sales effects of two campaign themes. Journal |
of, |
Advertising |
Research, 1, |
2— 11. |
4. |
K e m p t h o r n e |
O. |
|
(1952). Design and Analysis of. Experiments. Wiley, |
New York. |
Chi — Yuan and |
W h i t e |
W. |
L. |
(1968). Four procedures for tes |
5. |
L i n |
ting linear hypotheses. Industrial Management |
Review (M. I. T.), 10, 13—30. |
6 . |
R а о |
C. |
R. |
(1965). Linear Statistical Inference and its Applications. Wiley, |
New |
York. |
(Имеется |
русский перевод: P а о С. |
P. |
Линейные |
статистические |
модели и их применение. М., «Наука», |
1968.) |
of |
Variance. |
Wiley, |
New York. |
7. |
S c h e f f e |
Н. |
(1959). |
The Analysis |
(Имеется русский |
перевод: |
Ш е ф ф е |
Г. |
Дисперсионный |
анализ. |
М., Фи |
зматгиз, 1963.) |
|
|
R. |
(1966). Matrix Algebra for the Biological |
Sciences. Wiley, |
8 . S е а г 1 е S. |
New York. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|