Файл: Учебное пособие Киров 2010 удк 311(075. 8) Ббк 60. 60я73 К91.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.04.2024

Просмотров: 106

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
, т. е. остаточная сумма квадратов отклонений фактических значений результативного признака от их выровненных значений должна быть минимальна. Для определения параметров а0 и а1 уравнения прямолинейной корреляционной связи в условие метода наименьших квадратов вместо подставляем выражение a0+a1x: . Для нахождения минимума данной функции Sприравняем к 0 её частные производные по a0 и a1 и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:



где n – число уровней (членов) ряда (в нашем примере 10);

Σx– сумма значений факторного признака;

Σy – сумма значений результативного признака;

Σx2 – сумма значений квадратов факторного признака;

Σхy – сумма произведений значений факторного признака на значение результативного признака.

Решая эту систему, получаем значения параметров уравнения прямой линии.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n < 30) осуществляют с помощью t-критерия Стьюдента.

Алгоритм:

  1. Вычисляют фактические значения t-критерия:

  • для параметра а0 : , где – остаточное среднее квадратическое отклонение;

  • для параметра а1: , где – среднее квадратическое отклонение факторного признака.

  1. Вычисленные и сравниваются с , которое определяется по таблице t-распределения Стьюдента с учетом принятого уровня значимости или и числом степеней свободы , где k – число факторных признаков.

  2. Параметры а0 и а1 признают значимыми, если и .


Для определения параметров гиперболической функции система нормальных уравнений следующая:



Для определения параметров параболы второго порядка система нормальных уравнений такова:



В качестве меры достоверности уравнения корреляционной зависимости используется процентное отношение средней квадратической ошибки уравнения (Se) к среднему уровню результативного признака ( ): ,

где у – фактические значения результативного признака;

– значения результативного признака, рассчитанные по уравнению регрессии;

m – число параметров в уравнении регрессии.

Если это отношение не превышает 10–15%, то следует считать, что уравнение регрессии достаточно хорошо отображает изучаемую взаимосвязь.

7) Изучение множественной корреляционной зависимости начинается с анализа матрицы парных коэффициентов корреляции, что позволяет произвести отбор факторов, включаемых в модель множественной зависимости.


Матрица имеет следующий вид (табл. 9.2).

Таблица 9.2

Признак

y

x1

x2



xk

y

1









x1



1







x2





1

















xk









1


Анализ первой строки матрицы позволяет выявить факторы, у которых степень тесноты связи с результативным показателем значительна, а поэтому они могут быть включены в модель. Однако при построении многофакторных моделей должно соблюдаться требование возможно меньшей коррелированности (зависимости) включенных в модель признаков-факторов (отсутствие мультиколлинеарности). В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

; .

Если приведенные неравенства (или хотя бы одно из них) не выполняются, то исключается тот фактор или , связь которого с результативным признаком у будет менее тесной.

8) Отобранные факторы включаются в модель множественной зависимости. При этом следует учитывать, что число факторов, включаемых в модель, должно быть в 5–6 раз меньше, чем число единиц, входящих в совокупность.

Угадать функцию, которая наилучшим образом отображала бы взаимосвязь между признаками, бывает очень сложно. Обычно проверяют пять основных видов функций:

а) – линейная;

б) – квадратическая;

в) – гиперболическая;

г) – показательная;

д) – степенная.

Мерой достоверности уравнения является процентное отношение средней квадратической ошибки уравнения к среднему уровню результативного показателя, так же как в случае парной корреляции.

9) Для измерения степени тесноты связи между изменениями величины результативного признака (у) и изменениями значений факторных признаков определяется коэффициент множественной (совокупной) корреляции (R).

Для случая зависимости результативного признака от двух факторных признаков формула коэффициента корреляции имеет вид:



Величина R2 называется коэффициентом детерминации; она показывает, в какой мере вариация результативного признака обусловлена влиянием признаков-факторов, включенных в уравнение множественной зависимости.


Величина совокупного коэффициента корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Чем ближе он к единице, тем меньше роль неучтенных в модели факторов и тем более оснований считать, что параметры регрессионной модели отражают степень эффективности включенных в нее факторов.

Для оценки существенности (значимости) совокупного коэффициента корреляции используется критерий F-Фишера.

Алгоритм:

1. Определяется F-расчетное по следующей формуле:

,

где – факторная дисперсия результативного признака, обусловленная вариацией признаков-факторов;

– остаточная дисперсия;

n число данных;

mчисло параметров уравнения.

2. По таблице F-распределения с учетом принятого уровня значимости и числом степеней свободы , находим табличное значение .

3. Если , то с вероятностью 0,95 можно утверждать, что связь между результативным и факторными признаками существенна.

Кроме совокупного коэффициента корреляции познавательное значение имеют частные коэффициенты корреляции, позволяющие установить степень тесноты связи между результативным признаком у и каждым из факторных признаков при исключении искажающего влияния других факторных признаков. Следовательно, коэффициенты частной корреляции отражают степень «чистого» влияния факторного признака на результативный признак. Для их расчета могут быть использованы парные коэффициенты корреляции.


Для случая зависимости результативного признака у от двух признаков-факторов (х1 и х2) определяются два коэффициента частной корреляции:

1) частный коэффициент корреляции между результативным признаком у и фактором х1 при элиминировании фактора х2 :

;

2) частный коэффициент корреляции между результативным признаком у и фактором х2 при элиминировании фактора х1:

.

Величина частного коэффициента корреляции лежит в пределах от 0 до 1, а знак определяется знаком соответствующих параметров регрессии.

Рассчитывая величины частных коэффициентов корреляции, следует иметь в виду, что каждый из них по своей абсолютной величине не может быть больше величины коэффициента множественной (совокупной) корреляции.

10) Для сравнения роли различных факторов в формировании моделируемого показателя определяется коэффициент эластичности (Эj) или коэффициент ( ).

Частный коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак у с изменением признака-фактора х на 1%, и определяется по формуле:

,

где – коэффициент регрессии при j-м факторе.

коэффициент показывает, на какую часть среднего квадратического отклонения изменится результативный показатель при изменении соответствующего фактора х на величину его среднего квадратического отклонения. Его формула имеет вид:

.

Пример: Рассмотрим построение однофакторного уравнения регрессии зависимости производительности труда (y) от стажа работы (x) 10 рабочих одной бригады: