Файл: Контрольная работа вариант 2 по дисциплине статистика эб фамилия Богдарина Имя Ульяна Отчество Дмитриевна.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.02.2024
Просмотров: 8
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Федеральное государственное автономное образовательное
учреждение высшего образования
«Национальный исследовательский Нижегородский государственный
университет им. Н.И. Лобачевского»
Институт экономики и предпринимательства
Дата поступления контрольной работы:
Дата проверки:
Оценка:
Подпись преподавателя:
КОНТРОЛЬНАЯ РАБОТА
Вариант 2 по дисциплине статистика - ЭБ
Фамилия: Богдарина
Имя: Ульяна
Отчество: Дмитриевна
Группа: 1621Б3РТ1
№ зачетной книжки: 21160110
ФИО преподавателя: Матвеев Виктор Александрович
Нижний Новгород, 2023 г.
Контрольные задания 8.
1. Задача: Определить линейный коэффициент корреляции и построить уравнение регрессии, используя следующие статистические данные по промышленным предприятиям:
Оборотные средства, млн. р. | 120 | 171 | 150 | 178 | 222 | 271 | 254 | 278 | 300 | 352 |
Выпуск продукции, млн. р. | 10,9 | 7,8 | 13,1 | 12,4 | 13,4 | 17,1 | 23,1 | 23,5 | 29,6 | 33,1 |
Решение
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a·n + b·∑x = ∑y
a·∑x + b·∑x2 = ∑y·x
Для расчета параметров регрессии построим расчетную таблицу.
x | y | x2 | y2 | x*y |
120 | 10.9 | 14400 | 118.81 | 1308 |
171 | 7.8 | 29241 | 60.84 | 1333.8 |
150 | 13.1 | 22500 | 171.61 | 1965 |
178 | 12.4 | 31684 | 153.76 | 2207.2 |
222 | 13.4 | 49284 | 179.56 | 2974.8 |
271 | 17.1 | 73441 | 292.41 | 4634.1 |
254 | 23.1 | 64516 | 533.61 | 5867.4 |
278 | 23.5 | 77284 | 552.25 | 6533 |
300 | 29.6 | 90000 | 876.16 | 8880 |
352 | 33.1 | 123904 | 1095.61 | 11651.2 |
2296 | 184 | 576254 | 4034.62 | 47354.5 |
Для наших данных система уравнений имеет вид:
10a + 2296·b = 184 (1)
2296·a + 576254·b = 47354.5 (2)
Умножим уравнение (1) системы на (-229.6), получим систему и решим её методом алгебраического сложения.
-2296a -527161.6 b = -42246.4
2296*a + 576254*b = 47354.5
2296*a -2296*a + 49092.4*b = 5108.1
49092.4*b = 5108.1
Откуда b = 0.1041
Теперь найдем коэффициент «a» из уравнения (1):
10a + 2296*b = 184
10a + 2296*0.1041 = 184
10a = -54.9
a = -5.49
Получаем эмпирические коэффициенты регрессии: b = 0.1041,
a = -5.49
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.1041 x -5.49
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение:
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
a = = 18.4 - 0.1041·229.6 = -5.49
Ковариация.
cov(x,y) = = 4735.45 - 229.6·18.4 = 510.81
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными).
Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
Таким образом, связь между признаком Y и фактором X весьма высокая и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Линейное уравнение регрессии имеет вид y = 0.104 x -5.49
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b = 0.104 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В нашей задаче с увеличением на 1 единицу y повышается в среднем на 0.104.
Коэффициент a = -5.49 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
2. Задача: Определить ранговые коэффициенты корреляции по следующим статическим данным:
Банк | Собственный капитал, тыс. руб. | Активы, млн р. |
А | 10,8 | 28 |
Б | 16,3 | 30 |
В | 10,4 | 38 |
Г | 14,9 | 33 |
Д | 9,7 | 41 |
Е | 9,0 | 46 |
Ж | 7,7 | 44 |
З | 6,9 | 49 |
И | 5,7 | 52 |
К | 5,2 | 50 |
Решение
-
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку Y и фактору X.
X | Y | ранг X, dx | ранг Y, dy |
10.8 | 28 | 8 | 1 |
16.3 | 30 | 10 | 2 |
10.4 | 38 | 7 | 4 |
14.9 | 33 | 9 | 3 |
9.7 | 41 | 6 | 5 |
9 | 46 | 5 | 7 |
7.7 | 44 | 4 | 6 |
6.9 | 49 | 3 | 8 |
5.7 | 52 | 2 | 10 |
5.2 | 50 | 1 | 9 |
Матрица рангов.
ранг X, dx | ранг Y, dy | (dx - dy)2 |
8 | 0 | 64 |
10 | 0 | 100 |
7 | 0 | 49 |
9 | 0 | 81 |
6 | 0 | 36 |
5 | 0 | 25 |
4 | 0 | 16 |
3 | 0 | 9 |
2 | 0 | 4 |
1 | 0 | 1 |
55 | 0 | 385 |
Жирным шрифтом в таблице выделены суммы по каждому столбцу.
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена:
Связь между признаком Y и фактором X сильная и обратная.
-
Коэффициент Кендэла.
В общем случае расчет τ (точнее Р или Q) даже для N порядка 10 оказывается громоздким. Упростим.
Упорядочим данные по X.
В ряду Y справа от 9 расположено 1 рангов, превосходящих 9, следовательно, 9 породит в Р слагаемое 1.
Справа от 10 стоят 0 ранга, превосходящих 10, т.е. в Р войдет 0 и т.д.
X | Y | ранг X, dx | ранг Y, dy | P | Q |
5.2 | 50 | 1 | 9 | 1 | 8 |
5.7 | 52 | 2 | 10 | 0 | 8 |
6.9 | 49 | 3 | 8 | 0 | 7 |
7.7 | 44 | 4 | 6 | 1 | 5 |
9 | 46 | 5 | 7 | 0 | 5 |
9.7 | 41 | 6 | 5 | 0 | 4 |
10.4 | 38 | 7 | 4 | 0 | 3 |
10.8 | 28 | 8 | 1 | 2 | 0 |
14.9 | 33 | 9 | 3 | 0 | 1 |
16.3 | 30 | 10 | 2 | 0 | 0 |
| | | | 4 | 41 |
По упрощенным формулам:
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Кендалла при конкурирующей гипотезе Н1: τ ≠ 0. Надо вычислить критическую точку:
где n - объем выборки; zkp - критическая точка двусторонней критической области, которую находят по таблице функции Лапласа по равенству Ф (zkp)= (1 — α) /2.
Если |τ|
Найдем критическую точку zkp:
Ф (zkp) = (1 - α) /2 = (1 - 0.05) /2 = 0.475
По таблице Лапласа находим zkp = 1.96
Найдем критическую точку:
Так как τ > Tkp — отвергаем нулевую гипотезу; ранговая корреляционная связь между оценками по двум тестам значимая.