Файл: Задача 1 в базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительский свойствах и ценах.doc

ВУЗ: Не указан

Категория: Решение задач

Дисциплина: Не указана

Добавлен: 18.10.2024

Просмотров: 11

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.




Вариант 1
Задача 1
В базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительский свойствах и ценах.

Для анализа зависимости цены автомобиля Y от его возраста Х1 и мощности двигателя Х2 из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице1.


номер

цена

возраст

мощность

1

8,3

6

88

2

17,9

3

160

3

11,2

5

105

4

17,2

4

165

5

9,4

5,5

88

6

15,9

4

145

7

6,8

7

95

8

10,8

6

124

9

15,6

5

165

10

13,8

3,5

112

11

15,3

3

120

12

14,4

4,5

145

13

15,6

3,5

140

14

10,6

7

145

15

11,2

5,5

120

16

13,4

4,5

132




  1. Парные зависимости

    1. Построить поля рассеяния для цены Y и возраста автомобиля Х1, а также для цены Y и мощности двигателя Х2. На основе их визуального анализа выдвинуть гипотезы о виде статистической зависимости Y от Х1 и Y от Х2 и записать их математически.


Построим поля рассеяния:



Рис. 1. Поле рассеяния для цены Y и возраста автомобиля Х1



Рис. 2 Поле рассеяния для цены Y и мощности двигателя Х2
На основе визуального анализа построенных полей рассеяния можно выдвинуть гипотезу о линейной зависимости цены от возраста Х1 и мощности двигателя Х2.

Математически данные зависимости запишутся в виде:

y = α0+ α1x1 +

и y = β0+ β1x1 + , где и - случайные переменные.
1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии:

y = α0+ α1x1, y = β0+ β1x1.

Составим вспомогательную таблицу для

= α0+ α1x1: (таблица 2)

i

yi

xi1

xi12

yi xi1

yi2

1

8,3

6

36

49,8

68,89

2

17,9

3

9

53,7

320,41

3

11,2

5

25

56

125,44

4

17,2

4

16

68,8

295,84

5

9,4

5,5

30,25

51,7

88,36

6

15,9

4

16

63,6

252,81

7

6,8

7

49

47,6

46,24

8

10,8

6

36

64,8

116,64

9

15,6

5

25

78

243,36

10

13,8

3,5

12,25

48,3

190,44

11

15,3

3

9

45,9

234,09

12

14,4

4,5

20,25

64,8

207,36

13

15,6

3,5

12,25

54,6

243,36

14

10,6

7

49

74,2

112,36

15

11,2

5,5

30,25

61,6

125,44

16

13,4

4,5

20,25

60,3

179,56

Σ

207,4

77

395,5

943,7

2850,6



т.к. n=16, то = =12,9625

= = 4,8125

тогда


таким образом, получаем уравнение регрессии:

Составим таблицу для = β0+ β1x1: (таблица 3)


i

yi

xi2

xi22

yi xi2

yi2

1

8,3

88

7744

730,4

68,89

2

17,9

160

25600

2864

320,41

3

11,2

105

11025

1176

125,44

4

17,2

165

27225

2838

295,84

5

9,4

88

7744

827,2

88,36

6

15,9

145

21025

2305,5

252,81

7

6,8

95

9025

646

46,24

8

10,8

124

15376

1339,2

116,64

9

15,6

165

27225

2574

243,36

10

13,8

112

12544

1545,6

190,44

11

15,3

120

14400

1836

234,09

12

14,4

145

21025

2088

207,36

13

15,6

140

19600

2184

243,36

14

10,6

145

21025

1537

112,36

15

11,2

120

14400

1344

125,44

16

13,4

132

17424

1768,8

179,56

сумма

207,4

2049

272407

27603,7

2850,6



т.к. n=16, то = =12,9625

= = 128,0625

тогда


таким образом, получаем уравнение регрессии:


1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

Найдем коэффициент парной корреляции для = α0+ α1x1:



проверим, существенно ли отличается найденный коэффициент корреляции от нуля. Найдем:



Сравним с квантилем распределения Стьюдента

Т.к. 6,18489 >1,761, то коэффициент корреляции существенно отличается от нуля и существует сильная линейная зависимость между y и
Найдем коэффициент парной корреляции для = β0+ β1x2:



проверим, существенно ли отличается найденный коэффициент корреляции от нуля. Найдем:



Сравним с квантилем распределения Стьюдента

Т.к. 5б34355 >1,761, то коэффициент корреляции существенно отличается от нуля и существует сильная линейная зависимость между y и