Файл: Методические указания к проведению практических занятий по разделу Элементы теории корреляции дисциплины Основы системного анализа и математической статистики..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.03.2024

Просмотров: 8

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

8

yx y rв y (x x).

x

Аналогично можно получить уравнение линейной регрессии X наY :

 

 

 

 

r

x

(y

 

).

x

 

x

y

 

 

 

x

 

 

в

 

 

 

 

 

 

 

 

y

 

 

 

На практике совместное распределение СВ(X ,Y ) зачастую неизвестно, а известны только результаты наблюдений, поэтому в полученных уравнениях заменяем x и y их несмещенными оценками :

Sx2

1

 

n

(xi

 

)2

 

1

 

n

xi2

n

 

(

 

)2 ,

x

x

 

 

n 1

 

 

n 1 i 1

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

 

 

Sy2

 

1

 

n

(yi

 

)2

 

1

 

n

yi2

 

n

 

(

 

)2 .

 

 

y

y

 

 

 

 

 

 

n 1

 

 

n 1i 1

 

 

 

 

 

 

n 1i 1

 

 

 

 

 

 

 

Получим эмпирические функции линейной регрессии в виде:

 

 

 

 

 

 

 

r

S y

(x

 

 

),

 

y

 

y

x

 

 

 

 

 

 

x

 

 

 

 

 

в Sx

 

 

 

 

 

r

 

 

S x

(y

 

).

x

 

 

x

 

 

y

 

 

 

 

 

 

y

 

 

 

 

 

в

 

 

S y

Уравнения линейной регрессии получены в предположении, что все измерения встречаются по одному разу.

2.3. Корреляционная таблица

При большом числе наблюдений одно и то же значение СВX может повторяться nx раз, а СВ Y n y раз. Одна и та же пара чисел (x, y) может наблюдаться n xy раз. Поэтому данные наблюдений группируют, подсчитывая частоты nx , n y , n xy . Все данные записывают в корреляционную таблицу.

Пример 3.

Дана таблица распределения 100 заводов по производственным средствам X (тыс. ден. ед.) и по суточной выработке Y (т).


9

Известно, что между X и Y существует линейная корреляционная зависимость. Требуется: найти уравнение прямой регрессии Y на X и коэффициент корреляции.

В первой строке таблицы указаны наблюдаемые значения признака Y , а в первом столбце – наблюдаемые значения признака X . На пересечении строк и столбцов указаны частоты n xy наблюдаемых пар значений признаков.

Прочерк означает, что соответствующая пара чисел не наблюдалась.

Впоследнем столбце указаны суммы частот каждой строки, в последней строке – суммы частот каждого столбца.

Вклетке, расположенной в правом нижнем углу, помещена сумма всех частот (общее число всех наблюдений n 100 ).

 

 

 

 

 

 

 

 

Таблица 4

 

 

 

 

 

 

 

 

 

 

Y

4,5

6,0

7,5

9,0

10,5

12,0

13,5

15

nx

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

60

2

4

3

10

4

23

 

 

 

 

 

 

 

 

 

 

90

6

14

5

25

 

 

 

 

 

 

 

 

 

 

120

17

5

4

26

 

 

 

 

 

 

 

 

 

 

150

8

3

2

13

 

 

 

 

 

 

 

 

 

 

180

4

3

1

8

 

 

 

 

 

 

 

 

 

 

210

2

1

2

5

 

 

 

 

 

 

 

 

 

 

n y

2

4

9

24

26

19

11

5

100

Решение:

Очевидно, nx ny 100.

x 60 23 90 25 120 26 150 13 180 8 210 5 111,90, 100

 

4,5 2 6,0 4 7,5 9 9,0 24 10,5 26 12,0 19 13,5 11 15 5

10,41,

y

 

 

 

 

 

100

 

 

 

 

 

 

 

 

602 23 902

25 1202

26 1502

13 1802

8 2102

5

 

 

x

2

 

14319,

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

 

 

 

 

10

 

 

 

 

 

4,52

2 6,02 4 7,52 9 9,02 24 10,52 26 12,0

2 19

 

y

2

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

13,52

11 15

2 5

113,67,

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

nxy xy [(60 4,5 2) (60 6,0 4) (60 7,5 3) (60 9,0 10)

(60 10,5 4)] [(90 7,5 6) (90 9,0 14) (90 10,5 5)] [(120 10,5 17)

(120 12,0 5) (120 13,5 4)] [(150 12,0 8) (150 13,5 3) (150 15 2)]

[(180 12,0 4) (180 13,5 3) (180 15 1)] [(210 12,0 2) (210 13,5 1)

(210 15 2)] 124245,

 

 

 

 

 

 

n xy

 

xy

 

 

124245

1242,45,

 

 

 

 

 

 

 

xy

 

 

 

 

 

 

 

 

 

100

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S x2

 

1

 

 

n xi2

 

 

n

(

 

 

)2

1

 

1431900

100

(111,90)2 1815,55,

 

 

 

x

 

 

 

 

 

 

 

n 1

99

 

 

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99

 

 

 

S x

 

 

 

1815,55 42,61,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S y2

 

 

1

 

 

n yi2

 

 

n

(

 

)2

 

1

 

11367

100 (10,41)2 5,36,

 

 

y

 

 

 

 

 

 

 

 

n 1

99

 

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99

 

 

 

S y

 

 

 

5,36 2,32.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент корреляции:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1242,45 111,90 10,41

 

 

r

 

 

 

xy

x

y

 

 

 

 

0,79

 

 

 

x y

 

 

 

14319 (111,90)2

113,67 (10,41)2

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как

 

rв близок к единице,

то производственные средства и суточная

выработка находятся в тесной корреляционной зависимости.

 

 

 

 

 

Уравнение регрессии Y наX :

 

 

 

 

 

 

 

 

 

 

 

r

 

S y

(x

 

 

),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

y

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10,41

0,79

 

2,32

 

 

(x 111,90),

 

 

 

 

yx

 

 

 

 

 

 

 

 

 

42,61

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,04x 5,93.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из уравнения следует, что с увеличением производственных средств на 1 тыс. ден. ед. суточная выработка увеличится на 0,04 т.



11

2.4. Нелинейная корреляция

Если на основании наблюдаемых значений (xi , yi )СВ(X ,Y )можно

предположить, что зависимость yi

от

 

xi квадратичная , то применение МНК

 

n

 

 

 

n

 

 

bxi

c) yi )2

 

F(a,b,c) (Yi

yi )2 ((axi2

min.

 

i 1

 

 

 

i 1

 

 

 

 

 

 

 

 

 

дает возможность найти неизвестные параметры

a,b,c .

 

Система уравнений относительно a,b,

c имеет вид:

 

 

 

 

F(a,b,c)

n

 

2

 

 

 

 

2

 

 

 

a

 

2 (axi

bxi c yi )xi

 

0,

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

F(a,b,c)

 

 

2

 

 

 

 

 

 

 

 

 

n

 

bxi c yi )xi

 

 

 

 

b

 

2 (axi

 

0,

 

 

 

i 1

 

2

 

 

 

 

 

 

 

 

F(a,b,c)

n

 

bxi c yi ) 0.

 

 

c

 

2 (axi

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

n

4

n

3

 

n

2

 

n

2

,

 

 

 

a xi

b xi

c xi

xi yi

 

 

 

 

i 1

 

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

n

 

n

 

 

n

 

 

n

xi ,

 

 

 

 

a xi3

b xi2 c xi

yi

 

 

 

 

i 1

 

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

n

 

n

 

 

 

n

 

 

 

 

 

 

 

a xi2

b xi

nc yi .

 

 

 

 

 

 

i 1

 

i 1

 

 

 

i 1

 

 

 

 

 

Если наблюдается

нелинейная

зависимость

yi

 

от

xi , то обычно

используют методы линеаризации, т. е. переходят к условным переменным, где зависимость от параметров становится линейной, а затем применяют МНК.

Пример 4.

На основании наблюдаемых значений (xi , yi ) выдвинута гипотеза, что

зависимость y

i

от

x

имеет вид: y ae bx . Найти неизвестные коэффициенты a

 

 

i

 

и b.

 

 

 

 

Решение:

Прологарифмируем обе части равенства:

ln y ln aebx ,

ln y ln a bx ln e