Файл: Методические указания к проведению практических занятий по разделу Элементы теории корреляции дисциплины Основы системного анализа и математической статистики..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.03.2024
Просмотров: 8
Скачиваний: 0
8
yx y rв y (x x).
x
Аналогично можно получить уравнение линейной регрессии X наY :
|
|
|
|
r |
x |
(y |
|
). |
x |
|
x |
y |
|||||
|
|
|||||||
|
x |
|
|
в |
|
|
|
|
|
|
|
|
|
y |
|
|
|
На практике совместное распределение СВ(X ,Y ) зачастую неизвестно, а известны только результаты наблюдений, поэтому в полученных уравнениях заменяем x и y их несмещенными оценками :
Sx2 |
1 |
|
n |
(xi |
|
)2 |
|
1 |
|
n |
xi2 |
n |
|
( |
|
)2 , |
|||||||
x |
x |
||||||||||||||||||||||
|
|
n 1 |
|||||||||||||||||||||
|
|
n 1 i 1 |
|
|
|
|
|
|
n 1 i 1 |
|
|
|
|
|
|
|
|||||||
Sy2 |
|
1 |
|
n |
(yi |
|
)2 |
|
1 |
|
n |
yi2 |
|
n |
|
( |
|
)2 . |
|||||
|
|
y |
y |
||||||||||||||||||||
|
|
|
|
|
|
n 1 |
|||||||||||||||||
|
|
n 1i 1 |
|
|
|
|
|
|
n 1i 1 |
|
|
|
|
|
|
|
Получим эмпирические функции линейной регрессии в виде:
|
|
|
|
|
|
|
r |
S y |
(x |
|
|
), |
|||||
|
y |
|
y |
x |
|||||||||||||
|
|
|
|||||||||||||||
|
|
|
x |
|
|
|
|
|
в Sx |
||||||||
|
|
|
|
|
r |
|
|
S x |
(y |
|
). |
||||||
x |
|
|
x |
|
|
y |
|||||||||||
|
|
|
|
|
|||||||||||||
|
y |
|
|
|
|
|
в |
|
|
S y |
Уравнения линейной регрессии получены в предположении, что все измерения встречаются по одному разу.
2.3. Корреляционная таблица
При большом числе наблюдений одно и то же значение СВX может повторяться nx раз, а СВ Y −n y раз. Одна и та же пара чисел (x, y) может наблюдаться n xy раз. Поэтому данные наблюдений группируют, подсчитывая частоты nx , n y , n xy . Все данные записывают в корреляционную таблицу.
Пример 3.
Дана таблица распределения 100 заводов по производственным средствам X (тыс. ден. ед.) и по суточной выработке Y (т).
9
Известно, что между X и Y существует линейная корреляционная зависимость. Требуется: найти уравнение прямой регрессии Y на X и коэффициент корреляции.
В первой строке таблицы указаны наблюдаемые значения признака Y , а в первом столбце – наблюдаемые значения признака X . На пересечении строк и столбцов указаны частоты n xy наблюдаемых пар значений признаков.
Прочерк означает, что соответствующая пара чисел не наблюдалась.
Впоследнем столбце указаны суммы частот каждой строки, в последней строке – суммы частот каждого столбца.
Вклетке, расположенной в правом нижнем углу, помещена сумма всех частот (общее число всех наблюдений n 100 ).
|
|
|
|
|
|
|
|
Таблица 4 |
|
|
|
|
|
|
|
|
|
|
|
Y |
4,5 |
6,0 |
7,5 |
9,0 |
10,5 |
12,0 |
13,5 |
15 |
nx |
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
60 |
2 |
4 |
3 |
10 |
4 |
— |
— |
— |
23 |
|
|
|
|
|
|
|
|
|
|
90 |
— |
— |
6 |
14 |
5 |
— |
— |
— |
25 |
|
|
|
|
|
|
|
|
|
|
120 |
— |
— |
— |
— |
17 |
5 |
4 |
— |
26 |
|
|
|
|
|
|
|
|
|
|
150 |
— |
— |
— |
— |
— |
8 |
3 |
2 |
13 |
|
|
|
|
|
|
|
|
|
|
180 |
— |
— |
— |
— |
— |
4 |
3 |
1 |
8 |
|
|
|
|
|
|
|
|
|
|
210 |
— |
— |
— |
— |
— |
2 |
1 |
2 |
5 |
|
|
|
|
|
|
|
|
|
|
n y |
2 |
4 |
9 |
24 |
26 |
19 |
11 |
5 |
100 |
Решение:
Очевидно, nx ny 100.
x 60 23 90 25 120 26 150 13 180 8 210 5 111,90, 100
|
4,5 2 6,0 4 7,5 9 9,0 24 10,5 26 12,0 19 13,5 11 15 5 |
10,41, |
||||||||
y |
||||||||||
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
602 23 902 |
25 1202 |
26 1502 |
13 1802 |
8 2102 |
5 |
|
|
x |
2 |
|
14319, |
|
||||||
|
|
|
100 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
4,52 |
2 6,02 4 7,52 9 9,02 24 10,52 26 12,0 |
2 19 |
|
||
y |
2 |
|
|
|||||
|
|
|
|
100 |
|
|||
|
|
|
|
|
|
|
|
|
|
13,52 |
11 15 |
2 5 |
113,67, |
|
|
||
|
|
|
100 |
|
|
|
||
|
|
|
|
|
|
|
|
nxy xy [(60 4,5 2) (60 6,0 4) (60 7,5 3) (60 9,0 10)
(60 10,5 4)] [(90 7,5 6) (90 9,0 14) (90 10,5 5)] [(120 10,5 17)
(120 12,0 5) (120 13,5 4)] [(150 12,0 8) (150 13,5 3) (150 15 2)]
[(180 12,0 4) (180 13,5 3) (180 15 1)] [(210 12,0 2) (210 13,5 1)
(210 15 2)] 124245,
|
|
|
|
|
|
n xy |
|
xy |
|
|
124245 |
1242,45, |
|
|
|
|
|
|
||||||||||||||||||
|
xy |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
100 |
|
|
|
100 |
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
S x2 |
|
1 |
|
|
n xi2 |
|
|
n |
( |
|
|
)2 |
1 |
|
1431900 |
100 |
(111,90)2 1815,55, |
||||||||||||||||||
|
|
|
x |
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n 1 |
99 |
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
n 1 i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
99 |
|
|
|||||||||||
|
S x |
|
|
|
1815,55 42,61, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
S y2 |
|
|
1 |
|
|
n yi2 |
|
|
n |
( |
|
)2 |
|
1 |
|
11367 |
100 (10,41)2 5,36, |
||||||||||||||||||
|
|
y |
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n 1 |
99 |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n 1 i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
99 |
|
|
||||||||||||
|
S y |
|
|
|
5,36 2,32. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
Коэффициент корреляции: |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1242,45 111,90 10,41 |
|
|
|||||||||||||||||
r |
|
|
|
xy |
x |
y |
|
|
|
|
0,79 |
|||||||||||||||||||||||||
|
|
|
x y |
|
|
|
14319 (111,90)2 |
113,67 (10,41)2 |
||||||||||||||||||||||||||||
|
в |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
Так как |
|
rв близок к единице, |
то производственные средства и суточная |
||||||||||||||||||||||||||||
выработка находятся в тесной корреляционной зависимости. |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
Уравнение регрессии Y наX : |
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
r |
|
S y |
(x |
|
|
), |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
y |
|
|
|
y |
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
Sx |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
x |
|
|
|
|
в |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
10,41 |
0,79 |
|
2,32 |
|
|
(x 111,90), |
|
|
|
||||||||||||||||||||||||
|
yx |
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
42,61 |
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
0,04x 5,93. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
yx |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Из уравнения следует, что с увеличением производственных средств на 1 тыс. ден. ед. суточная выработка увеличится на 0,04 т.
11
2.4. Нелинейная корреляция
Если на основании наблюдаемых значений (xi , yi )СВ(X ,Y )можно
предположить, что зависимость yi |
от |
|
xi квадратичная , то применение МНК |
|||||||||||
|
n |
|
|
|
n |
|
|
bxi |
c) yi )2 |
|
||||
F(a,b,c) (Yi |
yi )2 ((axi2 |
min. |
||||||||||||
|
i 1 |
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
дает возможность найти неизвестные параметры |
a,b,c . |
|
||||||||||||
Система уравнений относительно a,b, |
c имеет вид: |
|
|
|
|
|||||||||
F(a,b,c) |
n |
|
2 |
|
|
|
|
2 |
|
|
||||
|
a |
|
2 (axi |
bxi c yi )xi |
|
0, |
|
|||||||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
||
F(a,b,c) |
|
|
2 |
|
|
|
|
|
|
|
|
|||
|
n |
|
bxi c yi )xi |
|
|
|
||||||||
|
b |
|
2 (axi |
|
0, |
|
||||||||
|
|
i 1 |
|
2 |
|
|
|
|
|
|
|
|
||
F(a,b,c) |
n |
|
bxi c yi ) 0. |
|
||||||||||
|
c |
|
2 (axi |
|
||||||||||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
||
|
|
n |
4 |
n |
3 |
|
n |
2 |
|
n |
2 |
, |
|
|
|
a xi |
b xi |
c xi |
xi yi |
|
|
||||||||
|
|
i 1 |
|
i 1 |
|
|
i 1 |
|
i 1 |
|
|
|
|
|
|
|
n |
|
n |
|
|
n |
|
|
n |
xi , |
|
|
|
|
a xi3 |
b xi2 c xi |
yi |
|
|
|
||||||||
|
i 1 |
|
i 1 |
|
|
i 1 |
|
i 1 |
|
|
|
|
||
|
|
n |
|
n |
|
|
|
n |
|
|
|
|
|
|
|
a xi2 |
b xi |
nc yi . |
|
|
|
|
|||||||
|
|
i 1 |
|
i 1 |
|
|
|
i 1 |
|
|
|
|
|
|
Если наблюдается |
нелинейная |
зависимость |
yi |
|
от |
xi , то обычно |
используют методы линеаризации, т. е. переходят к условным переменным, где зависимость от параметров становится линейной, а затем применяют МНК.
Пример 4.
На основании наблюдаемых значений (xi , yi ) выдвинута гипотеза, что
зависимость y |
i |
от |
x |
имеет вид: y ae bx . Найти неизвестные коэффициенты a |
|
|
i |
|
|
и b. |
|
|
|
|
Решение:
Прологарифмируем обе части равенства:
ln y ln aebx ,
ln y ln a bx ln e