Файл: Парная линейная регрессия.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.02.2024

Просмотров: 15

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тема: Парная линейная регрессия

Лабораторная №1



Имеются исходные данные (10 наблюдений):

Объем производства, млн. руб.

17

14

26

27

27

35

18

22

49

12

Численность рабочих, чел.

32

33

42

51

60

64

35

40

80

20,5



Необходимо определить, какой из заданных показателей является зависимой переменной, а какой – независимой. Построить поле корреляции. Найти точечные и интервальные оценки параметров модели . Оценить значимость коэффициентов регрессии, используя t-критерий Стьюдента и доверительные интервалы истинных значений параметров. Верифицировать полученную модель, используя дисперсионный анализ в регрессии и элементы теории корреляции. Интерпретировать полученные результаты. Сделать прогноз на основе модели.

Решение: 1 способ (ручной)


1 этап: Спецификация модели.
Определим, какой из заданных показателей будет зависимой переменной, а какой независимой. Так как труд является одним из факторов производства (экономическая теория), то численность работников обозначим в качестве независимой переменной , а объем производства – .

Чтобы определить характер зависимости, построим поле корреляции:


Следующим шагом наносим на поле корреляции прямую
:


Из графика видно, что точки распределены практически однородно относительно прямой, поэтому можно сказать, что условие гомоскедастичности выполняется.
2 этап: Построение модели.
Найдем оценки параметров модели помощью метода наименьших квадратов (МНК). Оценки параметров модели находятся из условия:

.

Тогда:

,

,

,

.

Построим вспомогательную таблицу для расчетов:

№ наблюдения













1

32

17

-7,7

-13,75

189,063

105,875

2

33

14

-10,7

-12,75

162,563

136,425

3

42

26

1,3

-3,75

14,0625

-4,875

4

51

27

2,3

5,25

27,5625

12,075

5

60

27

2,3

14,25

203,063

32,775

6

64

35

10,3

18,25

333,063

187,975

7

35

18

-6,7

-10,75

115,563

72,025

8

40

22

-2,7

-5,75

33,0625

15,525

9

80

49

24,3

34,25

1173,06

832,275

10

20,5

12

-12,7

-25,25

637,563

320,675

Итого

457,5

247

0

0

2888,625

1710,75



,

,

,

.

Коэффициенты совпадают с уравнением на диаграмме.

При этом уравнение модели напишем в виде: .

Для анализа полученной модели рассчитываем теоретические значения объясняемой переменной: .

Также найдем значение остатков: и минимальное значение остаточной суммы квадратов . Для этого составим вспомогательную таблицу:


№ наблюдения









1

17

16,5567

0,4433

0,1965

2

14

17,1489

-3,1489

9,9156

3

26

22,4791

3,5209

12,3967

4

27

27,8092

-0,8092

0,6548

5

27

33,1394

-6,1394

37,6922

6

35

35,5083

-0,5083

0,2584

7

18

18,3335

-0,3335

0,1112

8

22

21,2946

0,7054

0,4976

9

49

44,9841

4,0159

16,1275

10

12

9,7460

2,254

5,0805

Итого

247

247

0

82,9309



Остаточная сумма квадратов:

Вычислим несмещенные оценки дисперсий оценок:

,

.

Несмещенная оценка дисперсии ошибок наблюдений:

.

Для расчетов составим вспомогательную таблицу:

№ наблюдения





1

32

1024

2

33

1089

3

42

1764

4

51

2601

5

60

3600

6

64

4096

7

35

1225

8

40

1600

9

80

6400

10

20,5

420,25

Итого

457,5

23819,25

Таким образом, получаем:

,

.

.

3 этап: Оценка значимости коэффициентов регрессии
Оценка значимости коэффициентов регрессии при доверительной вероятности с помощью:

а) доверительных интервалов истинных значений параметров.

Для нахождения интервальных оценок полученных коэффициентов регрессии предварительно вычислим квантиль распределения Стьюдента:

.


,

.

Доверительный интервал для параметра :

,

.


Доверительный интервал для параметра :

,

.

Как мы видим, доверительный интервал для коэффициента регрессии не содержит нулевых значений, значит, коэффициент считается статистически значимым, доверительный интервал для параметра содержит 0, соответственно, он считается незначимым.
б) t-критерий Стьюдента

Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику .

– наблюдаемое или экспериментальное значение t-статистики.

Критическая область двухсторонняя:



Гипотеза отвергается с вероятностью 0,95, следовательно, принимается гипотеза , так как , т. е. . Это означает, что параметр незначим.

Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику