ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.05.2024
Просмотров: 34
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
4) После того, как будут заполнены все аргументы функции, нажать комбинацию клавиш
Результаты расчета параметров регрессионной модели:
| | | - оценки параметров модели |
| | | - стандартные ошибки оценок параметров |
коэффициент детерминации - | | | - стандартная ошибка случайного возмущения |
значение F-статистики - | | | - число степеней свободы |
регрессионная сумма квадратов - | | | - сумма квадратов остатков (ошибок) |
14. Смысл выходной статистической информации функции ЛИНЕЙН.
Функция ЛИНЕЙН специально создана для оценки параметров линейной регрессии, а также для вывода регрессионной статистики. Функция может быть использована как для парной регрессии (прогнозируемая переменная Y зависит от одной контролируемой переменной Х), так и для множественной регрессии (Y зависит от нескольких Х).
Рассмотрим результаты вычислений функции ЛИНЕЙН для парной регрессии:
| |
| |
| |
| |
| |
Где
, — оценки параметров модели;
, — стандартные ошибки оценок параметров;
— стандартная ошибка случайного возмущения;
— коэффициент детерминации, используемый для определения качества модели, чем лучше качество
спецификации, тем значение ближе к 1, чем хуже — тем ближе к 0;
— значение статистики, имеющей распределение Фишера и используемой для проверки статистической значимости коэффициента детерминации;
— число степеней свободы ( , — объем выборки, — число параметров модели);
— сумма квадратов остатков (ошибок);
— сумма квадратов центрированных по выборочным данным оценок значений эндогенной переменной.
15. Несмещённая оценка дисперсии возмущений регрессионной модели.
Несмещенной оценкой дисперсии возмущений множественной регрессии является оценка
Для доказательства несмещенности данной оценки покажем, что
C учетом
Так как дисперсии остатков , t =1,2,..,n, являются диагональными элементами автоковариационной матрицы вектора остатков, следовательно, сумма дисперсий – это ее след(следом квадратной матрицы называется сумма ее диагональных элементов):
След матрицы N равен:
Таким образом, оценка
Является несмещенной оценкой дисперсии возмущений:
Обозначения:
= M – автоковариациоонная матрица вектора остатков
16. Доверительные интервалы параметров парной регрессионной модели.
Дробь Стьюдента –нормированная ошибка оценки:
распределение Стьюдента, где ( ошибка оценки и
(n-2) – число степеней свободы является параметром распределения Стьюдента. Доверительная вероятность:
, где а- уровень значимости
или
Таким образом, границы доверительного интервала параметра b равны:
Аналогично определяются границы доверительного интервала параметра а:
17. Проверка значимости оценок параметров линейной регрессионной модели.
При проверке качества спецификации парной регрессии наиболее важной является задача установления наличия линейной зависимости между эндогенной переменной и регрессором модели. С этой целью проверяется значимость оценки параметров α и β. В процедуре проверки значимости оценки параметра парной регрессии используется дробь Стьюдента:
,которая при истинности гипотезы H0:β = 0, против конкурирующей H1: β 0, принимает вид: ,и, при выполнении условий Гаусса—Маркова (относительно случайных возмущений), имеет t-распределение с числом степеней свободы n-2. Аналогично формируется t-статистика для проверки гипотезы H0 значимости параметра α, однако параметр β в парной регрессии имеет более важную роль, так как его значимость соответствует значимости регрессора и наличию линейной связи между переменными модели.
Алгоритм проверки значимости параметра β выполняется в следующей последовательности:
1) оценка параметров парной регрессии;
2) оценка дисперсии возмущений ;
3) оценка ско оценки параметра β;
4) выбор значения tкр (по заданному уровню значимости α и числу степеней свободы (n - 2) из таблиц распределения Стьюдента);
5) проверка неравенства , при H0: β=0.
Если данное неравенство выполняется, то регрессор признается незначимым, если не выполняется, то гипотеза H0: β=0 отвергается и регрессор признается значимым, т. е. между эндогенной переменной и регрессором присутствует линейная зависимость.
18. Интервальная оценка значения зависимой переменной регрессионной модели.
Для построения интервальной оценки эндогенной переменной на интервале прогнозирования применяется процедура трансформации дроби Стьюдента
(1)
в интервальную оценку:
, (2)
где Yp ˆ — прогноз значения эндогенной переменной для момента t = p n ,
Yp— истинное значение эндогенной переменной на момент t = p ,
— стандартная ошибка прогноза, — оценка дисперсии ошибки прогноза
(3)
*- diag — диагональный элемент матрицы.
Интервальная оценка (2) эндогенной переменной на интервале прогнозирования используется для проверки адекватности эконометрической модели 18 (проверки соответствия результатов прогнозирования, полученных по модели, выборочным данным).
19. Алгоритм проверки адекватности модели.
Алгоритм проверки адекватности модели состоит из следующих шагов:
1) результаты наблюдений разделяют на две части: обучающую (90-95% наблюдений) и контролирующую выборки (оставшиеся наблюдения);
2) по обучающей выборке выполняется оценка параметров модели методом наименьших квадратов;
3) по оцененной модели строится прогноз значений эндогенной переменной из контролирующей выборки и доверительные интервалы для их истинных значений;
4) выполняется проверка: если значения эндогенной переменной из контролирующей выборки накрываются доверительным интервалом — модель признается адекватной, в противном случае, подлежит доработке.
20. Коэффициент детерминации регрессионной модели.
Квадрат коэффициента корреляции выборки, как правило, обозначается и называется коэффициентом детерминации.
Коэффициент детерминации оценивает долю дисперсии (изменчивости) Y, которая объясняется с помощью X в простой линейной регрессионной модели.
Итак, пусть мы наблюдаем значения Xi и соответствующие значения Yi , например, доза лекарственного препарата, назначенного пациенту и эффект, доля примеси в меди и проводимость и тд.
Выборочный коэффициент корреляции вычисляется по формуле:
21. Нецентрированный коэффициент детерминации регрессионной модели.
Коэффициент детерминации рассматривают, как правило, в качестве основного показателя, отражающего меру качества регрессионной модели, описывающей связь между зависимой и независимыми переменными модели. Коэффициент детерминации показывает, какая доля вариации объясняемой переменной y учтена в модели и обусловлена влиянием на нее факторов, включенных в модель:
где – значения наблюдаемой переменной, – среднее значение по наблюдаемым данным, – модельные значения, построенные по оцененным параметрам.
В случае, когда значение константы задается вручную, коэффициент детерминации рассчитывается по следующей формуле:
где – фиксированное значение константы.
В случае линейной регрессии с константой справедлива следующая формула:
Заметим, что данная формула справедлива только для модели с константой, в общем случае используется предыдущая формула.
Чем ближе к 1, тем выше качество модели.
При равенстве коэффициента единице линия регрессии точно соответствует всем наблюдениям.
Равенство коэффициента нулю означает, что выбранные факторы не улучшают качество предсказания по сравнению с тривиальным предсказанием .
Достаточно качественной можно признать модель с коэффициентом детерминации выше 0,8.
Недостатком коэффициента детерминации является то, что он увеличивается при добавлении новых объясняющих переменных
, что необязательно означает улучшение качества регрессионной модели. По этой причине, для устранения этого недостатка, на практике чаще используется скорректированный коэффициент детерминации.
Коэффициент детерминации можно получить из функции ЛИНЕЙН:
22. Скорректированный коэффициент детерминации модели множественной регрессии.
Скорректированный коэффициент детерминации:
где – коэффициент детерминации, n – общее число наблюдений, k – число объясняющих переменных (число параметров модели регрессии без учета свободного члена).
Скорректированный коэффициент детерминации применяется для решения двух типов задач:
-
оценка тесноты связи между объясняемой и объясняющей переменной. Необходимо обратить внимание на близость к нескорректированному коэффициенту детерминации. Модель считается качественной, если показатели велики и несильно отличаются друг от друга. -
сравнение моделей с различным числом параметров. При прочих равных условиях, предпочтение отдается той модели, у которой скорректированный коэффициент детерминации больше.
Следует отметить, что скорректированный коэффициент детерминации нельзя использовать в формулах, где применяется обычный коэффициент детерминации, поскольку скорректированный коэффициент детерминации нельзя интерпретировать как долю вариации объясняемой переменной, обусловленную вариацией факторов, включенных в модель.
23. F-тест качества спецификации регрессионной модели.
Первый шаг. Вычисление статистики с известным распределением
статистика Фишера
Второй шаг. Проверка значимости статистики F
Проверка гипотезы H0:F=0
Статистика незначима, если
Статистика значима, если