Квадрат оценки множественного коэффициента корреляции можно подсчитать по формуле
|
|
|
|
п |
|
|
~2 i=i |
m{Yi-Y)*- |
t=l |
2 |
WiiYi-Yi? |
|
Ря = -2 |
|
|
|
|
та |
|
|
|
|
|
i=i |
|
|
(Yt-Y)* |
|
|
2 wt |
|
|
|
n |
|
|
|
|
|
= |
#2 м ^ -- |
л= 2 ^ - I > ^ ^ - I ) , 0 < й < 1 . |
(5.3.21) |
|
W,-?)» <y-y>Tw(y-y> |
|
|
i=i |
|
|
|
|
|
Так как уравнение |
регрессии с q параметрами |
дает точную |
подгонку для q наблюдений, следует проявлять некоторую осто
рожность при интерпретации |
р%, учитывая |
остаточные |
степени |
свободы модели. Тем не менее |
величина |
р л |
находит |
применение |
как одно число, которое служит мерой подгонки в целом |
уравне |
ния регрессии. В работе [7] приведены |
таблицы, |
помогающие |
оценить доверительный интервалдля р я - |
|
|
|
|
Пусть помимо непосредственного использования р л при построе нии модели вычисляется величина
РЯ,І = 1 - ^ , |
(5.3.22) |
a i i L t i |
|
где ati — і-й диагональный элемент матрицы aw == x T wx, а сн — і-й элемент матрицы cw = ( x T w x ) _ 1 . Если величина р„> { оказы вается большой (приближается к единице), это означает, что пере менная xt, возможно, если не обязательно, не является значимой компонентой модели.
Сопоставим ря, І для |
переменных из |
примеров 5.1.1 и 5.2.1 (на |
пример, для х2). |
|
|
|
Пример 5.1.1 |
|
|
|
|
1 |
! = о |
|
|
8,00-0,125 |
|
Пример 5.2.1: |
|
|
|
Л |
* |
А П О |
|
7,52-103-8,00-10-3 |
и ' э о - |
Эти результаты обосновывают заключение, что переменная х2 вносит вклад в модель примера 5.1.1 и не вносит значимого вклада в модель примера 5.2.1.
Линейные |
модели с несколькими |
переменными |
357 |
Пример 5.3.1. Дисперсионный анализ
Чтобы проиллюстрировать трудности интерпретации резуль татов дисперсионного анализа, когда независимые переменные не являются ортогональными, используем результаты Гормена
|
|
|
1,0 |
|
|
|
|
|
|
3,8 |
3.5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
УУ |
|
|
|
|
|
|
|
0,5 |
|
|
|
|
у |
|
|
!£ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
|
|
|
|
УУ |
|
|
|
|
|
|
|
|
|
-0,0 |
-0,1 |
-1,9 |
|
/ У |
|
|
|
|
|
|
|
|
|
|
-1,0 |
-ТА.-1.8 |
|
|
™і |
r"z |
|
|
|
|
|
|
|
|
-2А-0,6 |
|
|
|
|
|
|
|
|
|
|
|
I |
' |
|
I |
1 |
1 |
|
I |
1 |
|
|
|
|
|
|
-1ß |
-0,5 |
0,0 |
Oß |
1,0 |
|
|
|
|
|
|
|
|
|
|
|
xi |
|
|
|
|
|
|
Ф и г . |
П.5.3.1a. Имитированные данные |
для модели Yt |
— |
1 -\-хц |
+ |
х^ + е$ |
|
|
|
|
(значения |
отклика |
подчеркнуты). |
|
|
|
и Томена [8], которые имитировали |
экспериментальные |
данные |
для |
модели |
|
Yt |
= 1 + Хц + Хі2 + |
|
|
|
|
|
|
|
|
|
8 І , |
|
|
|
|
где |
e; |
— нормальное |
случайное |
отклонение |
с |
% {е,} = О |
и Var {ег } = |
1. Были взяты четыре набора имитированных наблю |
дений в |
точках |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
XÙ |
- |
1 |
- 1 |
|
|
1 1 |
|
|
|
|
|
|
|
|
х2: |
- 1 |
- 1 / 2 |
1/2 |
1 |
|
|
|
|
Отклики У г |
показаны на фиг. П.5.3.1а. Отметим, что хх |
= х2 = 0. |
Были выбраны четыре модели и оценивание их |
коэффициентов |
привело к следующим оценкам соответствующих уравнений регрессии:
У щ |
= |
0,94 |
+ |
0,85*! + 1,55а;2, |
У „ |
= |
0,94 |
+ |
З.ОІАГІ |
Уі |
= |
0,94 |
+ |
2,57х2 , |
Коэффициенты bt, за исключением b0 — Y, в первых трех уравне ниях отличаются друг от друга, так как для уравнений лишь с одной независимой переменной они дают смещенные оценки соот ветствующих параметров ß2-.
|
|
|
|
|
|
Таблица |
П.б.ЗЛа |
|
|
|
Число |
Сумма |
Оценка |
Оценка |
|
|
Модель |
квадратов |
множественного |
|
|
степеней |
остатков |
среднего |
коэффициента |
|
|
|
свободы V |
*мин |
квадрата |
корреляции |
|
|
|
|
|
I I I |
(хі |
и х2) |
13 |
10,07 |
0,775 |
|
0,87 |
I I |
(а*) |
|
14 |
12,48 |
0,89 |
|
0,84 |
1 |
(*2) |
|
14 |
11,23 |
0,80 |
|
0,85 |
I V |
(только свобод |
15 |
77,28 |
5,15 |
|
— |
|
ный |
член) |
|
|
|
|
|
В табл. П.5.3.1а представлены результаты дисперсионного ана лиза, которые показывают, что первые три модели лучше, чем модель IV , однако различить между собой модели I , I I и I I I невозможно.
Дисперсия si равнялась
„а |
4,29 |
+ 1,71 + 0,69 + 2,43 _ А n |
R |
Ье |
.— |
£7д |
— и » • О , |
|
что меньше, чем а | = 1. |
Однако для а = 0,05 |
значения Fi_a для |
(13, 12), (14, 12) и (15, 12) степеней |
свободы из табл. В.4 равны |
соответственно: 2,66, 2,63 и 2,62. Таким образом, каждая модель, за исключением модели I V (так как 5,15 > 2,62), может счи таться подходящей. Согласно F- или f-критериям, гипотеза о том, что каждый коэффициент в моделях I , I I и I I I равен нулю, отвер
гается. Исключение х± |
или хг |
из полной модели дает |
следующие |
отношения |
дисперсий: |
|
|
|
|
|
Источник рассеяния |
|
si |
|
Оценка s i r . |
i |
*0.9б f 1 ' 1 2 ) |
|
|
i |
|
|
|
|
|
|
|
Исключается |
хі |
12,48-10,07 |
0,76 |
3,17 |
4,67 |
|
1 |
|
|
|
|
|
|
|
|
Исключается |
х2 |
11,23—10,07 |
0,76 |
1,53 |
4,67 |
|
1 |
|
|
|
|
|
|
|
|
і^-критерий указывает, что при исключении х^ или хг из полной модели не получается значимого уменьшения суммы квадратов
Линейные |
модели с несколькими |
переменными |
359 |
Если рассматривать влияние обеих переменных г , и і 2 в урав нении регрессии, то полную модель следует сохранить. Если
|
1.0 |
|
0,10 |
|
|
|
|
|
•0,10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,08- |
|
|
У |
У |
-/0,08 |
|
|
|
|
0,5 Ь |
|
°>0 7 " |
|
&у |
7^0,07 |
|
|
|
|
|
|
У |
|
|
|
|
|
|
|
|
0,06•< |
|
ъу |
' |
|
|
'0,06 |
|
|
|
|
|
|
|
|
|
|
|
|
Х2 |
0,0 h |
0,056- |
У—Т |
|
|
|
0,056 |
|
|
|
|
|
|
0,06" |
|
У |
У. |
|
|
-0,06 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-0,5 |
0,07»-^- |
У—^ |
|
|
|
- 0,07 |
-\ |
|
|
|
|
0,08//- |
|
|
|
|
|
-0,08 |
|
|
|
|
-1,0 |
|
0,10ч |
|
|
|
|
|
-0,10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-1,0 |
-0,5 |
0,0 |
0,5 |
|
1,0 |
|
|
|
|
|
|
|
|
*1 |
|
|
|
|
|
|
Ф и г . П.5.3.16. Сравнение Ѵаг {У} для |
У ц = |
|
Ь0 + Ьгх2 |
и |
У ш = |
ь 0 + |
|
|
|
- f |
biXi |
-f- Ь 2 х 2 |
[8]. |
|
|
|
|
|
|
интересоваться лишь величиной Y, то удовлетворительными |
будут |
сокращенные |
модели |
(I или I I ) . Однако |
|
при таком |
упрощении |
*2 0,0 Ь-
Ф и г. П . 5 . 3 . 1в . Математическое ожидание смещения |
дл я У = Ь0 + Ь2х2, |
когда истинное уравнение имеет вид ц = 1 - j - |
х^ -f- х2 [8]. |
существует некоторая опасность, как показано на фиг. П.5.3.16, ибо дисперсия У", предсказанная, например, моделью I I , ока-