|
|
|
|
|
|
|
|
|
Т а б л и ц а |
2 |
|
|
|
Примеры функций, |
допускающих оценивание, |
и оценки |
|
|
|
|
|
|
|
|
этих функций |
|
|
|
|
|
|
Зн ачение W |
|
Ф ункц и я |
|
|
О ценка |
|
|
Пример |
|
|
|
|
(tw, + |
+ И13)ц + |
w t y t • - f |
w 2y 2 • + |
• = |
|
|
|
W t |
W 2 |
w a |
+ w 1a 1 + и'га2 + созОз |
= |
lOOt^i + 86ш 2 -j- 3 2 w 3 |
|
1 |
1 |
|
— 1 |
0 |
|
а 1 — а 2 |
|
У 1 - — У г - = Н |
|
|
2 |
0 |
|
1 |
- 1 |
|
а 2 — а 3 |
|
У 2 - — У з - = 54 |
|
|
3 |
1 |
|
1 |
1 |
1 |
|
{ y i - |
+ У 2 - + У з - ) _ ур 2 |
3 |
" |
3 |
3 |
р + - 3 - ( a j + c s j - f a g ) |
|
|
3 |
|
3 |
|
|
|
|
|
|
Последняя строка таблицы показывает, почему «удобным» ограниче
нием должно быть а ] + |
а 2 + |
а 3 = 0. Однако это условие не обязатель |
но ни для выяснения |
того, |
какая функция параметров допускает |
оценивание, ни для получения самих оценок. Здесь она дает возмож ность получить оценку р, но только в одной частной и ограниченной ситуации, а именно ситуации, при которой имеет смысл определить а так, что их сумма равна нулю. Будет или нет это определение прием лемым — зависит от конкретных условий. Однако, если даже это ог раничение и приемлемо, оно будет полезным в процессе оценки только тогда, когда оно включено в функцию, как это только что было про демонстрировано. Другими словами, оно мало помогает. (Представляет
ся, ч т о б |
нашем |
примере нет оправдания для |
предположения о том, |
что а г + |
а 2 + |
а 3 равно нулю или другой |
постоянной величине.) |
Наконец, дисперсия оценки любой допускающей оценку функции равна в соответствии с (18) следующему:
var (q'b) — q'Gqo2.
Например, для конкретной величины q', заданной (26), получим
5. ПРОВЕРКА СУЩЕСТВЕННОСТИ
а) ДИСПЕРСИОННЫЙ АНАЛИЗ
Воспользуемся полученной ранее суммой квадратов ошибок
SSE = у'у - Ь’Х'у,
как это показано в (14). Предположим, что она вычитается из общей скорректированной1 суммы квадратов
SST = у'у — пу2,
Скорректированной относительно средней, т. е. измеренной как отклонение от средней (см. раздел б параграфа 4 главы X).
как это было сделано при исследовании регрессии. Тогда получим
SSM = SST — SSE = Ъ'Х'у — пуа.
Эта величина может быть охарактеризована как сумма квадратов, аналогичная SSR в регрессионном анализе, зависящая от подоб ранной модели. Такое деление SST на две части может быть обоб щено в таблице дисперсионного анализа так же, как это было выпол нено в параграфе 4 главы X1. На основе табл. 3 находим
что представляет собой коэффициент детерминации подобранной мо дели; это корреспондирует с уравнением (39) из главы X. Подобным же образом получим уравнение, соответствующее (41) из той же главы:
|
FГ - 1 , 71—Г |
SSM |
(28) |
|
(г— 1)ста |
|
|
Т а б л и ц а 3 |
|
|
|
Дисперсионный анализ подобранной линейной модели |
И с т о ч н и к в а р и а ц и и |
D.F. |
|
С у м м а к в а д р а т о в |
Подобранная модель |
г — 1 |
|
SSM = Ъ'Х'у —пу* |
Ошибка |
п — г |
|
SSE = SST— SSM |
Итого |
п — 1 |
|
SST = у ' у - п у * |
Для проверки существенности модели в целом значение F, получен ное по (28), может быть сравнимо с табличным значением F при г — 1 и п — г степенях свободы при условии, что принято предположение о нормальном распределении ошибки.
б) ПРОВЕРКА ОБЩИХ ЛИНЕЙНЫХ ГИПОТЕЗ
Рассмотрим теперь проверку линейной гипотезы. Последняя за ключается в предположении о том, что линейная функция равна не которой выбранной постоянной. Обсуждение должно ограничиться линейной гипотезой, относящейся к функциям, допускающим оценку, поскольку только они могут быть испытаны. Таким образом, в нашем примере функция а х — а 2 допускает оценку, и гипотеза о том, что
|
|
|
|
|
|
|
1Имеется лишь одно небольшое |
различие между |
этой |
таблицей и второй |
частью табл. 3 из параграфа 4 главы X. Так, число степеней свободы, относящих |
ся к SSE, там равно п — к — 1, а |
здесь, |
в табл. 3, |
оно |
составляет п — г, |
где г — ранг матрицы X. В действительности |
это |
тот |
же случай, который пред |
ставлен в табл. 3 из параграфа 4 главы |
X, поскольку там ранг матрицы X мо |
дели со свободным членом, а именно |
матрицы |
X*, |
равен |
к + 1 (см. также |
табл. 4 на стр. 302). Поэтому здесь нет расхождения: |
г — 1 |
соответствует к. |
а х— а 2 равно некоторой постоянной, скажем т0, может быть испы тана; однако не может быть проверена гипотеза о том, что р. = 0.
В общем линейная гипотеза q'b — т0, где тп выбрано и q'b до пускает оценку, проверяется путем улучшения модели у = ХЬ + е с учетом данной гипотезы. В связи с этим модель у = ХЬ + е обычно называют полной моделью, а исправления, сделанные с учетом гипо тезы, дают так называемую приведенную модель, поскольку последняя представляет собой полную модель, измененную за счет условий, ко торые содержат гипотезы. Так, если условие q'b = т 0приводит к тому, что b трансформируется в Ь*, то приведенную модель можно было бы записать как у = Х*Ь*-}-е, где X*— форма X, соответствующая Ъ*. В примере, рассматриваемом в данной главе, Ъ' = [р а х а 2 а 3]. Для испытания гипотезы а 1 =---- а 2, т. е. а г — а 2 = 0 (последнее можно испытать, поскольку а х — а 2 допускает оценку) величина Ь*' составит [р а х а 3]. Матрицы X и X* имеют вид
|
1 |
1 |
0 |
( Г |
|
|
_ 1 |
1 |
0 |
|
1 |
1 |
0 |
0 |
|
|
1 |
1 |
0 |
|
1 |
1 |
0 |
0 |
; |
X * - |
1 |
1 |
0 |
|
1 |
0 |
1 |
0 |
1 |
1 |
0 |
|
|
|
|
1 |
0 |
1 |
0 |
|
|
1 |
1 |
0 |
|
J |
0 |
0 |
1_ |
|
|
_1 |
0 |
1_ |
На основе одного уравнения q'b — т0 не может быть проверено много гипотез, требуется несколько таких уравнений. Обычно они мыслятся в векторной форме Q'b = т, где строки Q'b— линейно-не зависимые функции, которые можно оценивать. Таким образом полу чим Q'H=Q', и если Q' имеет s строк, то ранг матрицы Q' равен s. На пример, гипотеза а х == а 2 = а 3 может быть представлена в форме
Q'b = т как
Гипотеза Q'b ~ т известна как общая линейная гипотеза. Проверка этой гипотезы требует получения суммы квадратов, связанной с по добранной полной моделью, и суммы квадратов, определяемой подоб ранной приведенной моделью. Первая из них, исходя из (14), равна:
SSM = |
Ь'Х'у — пу2 = y'XGX'y — /гг/2, гдеб — обобщенная обратная |
к Х 'Х |
матрица, и поскольку эта сумма относится к полной модели, |
обозначим ее как |
|
|
SSMn0BH0{-, модели |
у XGX у |
пу . |
зоо |
|
|
По |
аналогии |
сумма |
квадратов |
подобранной приведенной модели |
у = |
Х*Ь* + |
е (полученной на основе полной модели при применении |
к ней гипотезы Q'b = |
т) равна: |
|
|
SSMп р и в е д е н н о й м о д е л и |
y'X*G*X*'y — пу2, |
где G* — обобщенная обратная к Х*'Х* матрица. Зная разность между |
этими двумя |
выражениями, можно получить |
|
F».n- r - { SSMполной модели |
-SSMприведенной модели)/so2, |
где |
s — ранг |
матрицы |
Q' и о2 = |
SSE/(n — г). Сравнение с таблич |
ным значением ^-распределения при числе степеней свободы, равном s и п — г, дает возможность осуществить проверку гипотезы.
Числитель выражения для Е может быть подсчитан как y'XGX'y —
— y'X*G*X*'y. Для того чтобы выполнить это, потребуется найти X*G*X*' для каждой проверяемой гипотезы .Однако поскольку в обеих моделях SSM + SSE = SST, то выражение для F может быть так же представлено в следующем виде:
F , п ~ г = (SSEприведенной модели' -SSEполной модели,)/so2
а на основе этого может быть выведена расчетная формула, которая устраняет необходимость определения X*. Эта формула содержит
Ь, а также Q' и т, что представляет собой спецификацию гипотезы. Ее относительно легко рассчитать. Она приводится в следующей теоре ме, которая делает возможным проверить гипотезы прямым путем,
коль скоро получено Ь.
Теорема. При подборе линейной модели у = Xb -f- е сумма квад ратов, находящаяся в числителе Е-критерия и взятая для испытания общей линейной гипотезы Q'b =^т, причем Q' состоит из s линейно
независимых строк, равна (Q'b — т)' |
X (Q’GQ)_1 |
(Q'b — т), где |
b = GX'y есть решение нормальных уравнений X'Xb |
— Х'у, a G — |
обобщенная обратная к Х 'Х матрица. |
|
|
гипотезы |
Эта теорема означает, что Е-критерий для проверки |
Q'b = т может быть подсчитан как |
|
|
|
Fs, п-т = KQ'b — m)' (Q'GQ)-1 |
(Q'b — m)]/so2. |
(30) |
Если Q'b — оценка функции Q'b полной модели, то очевидно, что величину Е легко получить, поскольку b = GX'y подсчитано.
Пример (продолжение). |
На основе базовых данных получим щ 2— |
5042 |
42 336; и при |
условии, что у'у = 45 886 (см. (21)), |
= —g— = |
SST = 45 886—42 336 = 3 550. |
При SSE = |
70 (см. (22)) строим таблицу дисперсионного анализа. |