Файл: Учебное пособие Киров 2010 удк 311(075. 8) Ббк 60. 60я73 К91.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.04.2024

Просмотров: 107

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
прямолинейную (или просто линейную) и нелинейную (криволинейную).






Рис. 1. Примеры криволинейных зависимостей

По количеству факторов, действующих на результативный признак, различают однофакторные и многофакторные связи.

2) Сбор первичной информации и проверка ее на однородность и нормальность распределения.

Для оценки однородности совокупности рассчитывается коэффициент вариации по каждому факторному признаку:

.

Совокупность считается однородной, если коэффициент вариации не превышает 33%. Проверка нормальности распределения исследуемых факторных признаков (х1, х2, х3,, хn) проводится с помощью правила «трех сигм». Результаты проверки на нормальность распределения следует представлять в табличной форме (табл. 9.1).

Таблица 9.1

Интервалы значений признака фактора

Число единиц, входящих в интервал

Удельный вес единиц, входящих в интервал, в общем их числе, %

Удельный вес единиц, входящих в интервал, при нормальном распределении, %













68,3

95,4

99,7

Сопоставление данных граф 3 и 4 позволяет судить о наличии или отсутствии нормальности распределения.

На практике часто встречаются случаи отклонения от этих двух предпосылок. Однако это не означает, что следует отказаться от применения корреляционного анализа.

3) Исключение из массива первичной информации всех резко выделяющихся (аномальных) единиц по уровню признаков-факторов.

Исключаются все единицы, у которых уровень признака-фактора не попадает в интервал
,

и формируется новый массив для последующего анализа.

4) Установление факта наличия и направления корреляционной зависимости между результативным (у) и факторным (х) признаками.

Для установления наличия корреляционной связи используется ряд специфических методов: параллельное сопоставление рядов результативного и факторного признака, графическое изображение фактических данных с помощью поля корреляции, построение корреляционной таблицы.

Основным методом выявления наличия корреляционной связи является метод аналитической группировки и определения групповых средних. Он заключается в том, что все единицы совокупности разбиваются на группы по величине признака-фактора и для каждой такой группы определяется средняя величина результативного признака. На основе данных аналитической группировки строится график эмпирической линии связи (линии регрессии), вид которой не только позволяет судить о возможном наличии связи, но и дает некоторое представление о форме корреляционной связи. Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи; если эмпирическая линия приближается к какой-либо кривой, то это связано с наличием криволинейной связи.

5) После установления факта наличия связи и ее формы измеряется степень тесноты связи и проводится оценка ее существенности.

Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции (r); при любой форме зависимости (линейной и криволинейной) – эмпирическое корреляционное отношение ( ).

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя признаками. Для расчета линейного коэффициента корреляции по несгруппированным данным может быть использована следующая формула:

,

где – среднее квадратическое отклонение факторного признака;

– среднее квадратическое отклонение результативного признака.

Свойства линейного коэффициента корреляции

  1. Линейный коэффициент корреляции может принимать значения в пределах от –1 до +1.

  2. Если , то связь между признаками функциональная, т. е. на результативный признак влияет только рассматриваемый факторный признак и больше ничего, если r = 0, то связь между признаками отсутствует.

  3. Если r> 0, то связь между признаками прямая, если r< 0, то связь – обратная.

  4. Выделяют следующие промежутки для r:


связь между признаками фактически отсутствует;

связь слабая;

связь умеренная;

связь сильная.



Рис. 2. Примеры расположения точек на графике и значений коэффициента корреляции
Для оценки существенности линейного коэффициента корреляции r используют t – критерий Стьюдента. При этом выдвигается гипотеза о равенстве коэффициента корреляции нулю.

Проверка гипотезы:

  1. Вычисляют фактические значения t-критерия для r:

(такая формула применяется при небольшом объеме выборки).

  1. По таблице t-распределения Стьюдента с учетом принятого уровня значимости или и числе степеней свободы определяют .

  2. Если , то гипотеза отвергается, что свидетельствует о значимости коэффициента корреляции.

Корреляционное отношение определяется по формулам:

η = или η = ,

где – межгрупповая дисперсия результативного признака, вызванная влиянием признака-фактора;

общая дисперсия результативного признака;


средняя из внутригрупповых дисперсий результативного признака.

Вычисление корреляционного отношения требует достаточно большого объема информации, которая должна быть представлена в форме групповой таблицы или в форме корреляционной таблицы, т. е. обязательным условием является группировка данных по признаку-фактору.

По несгруппированным данным эмпирическое корреляционное отношение может быть рассчитано по следующей формуле:

.

где y – эмпирические (фактические) значения результативного признака;

среднее значение результативного признака;

выравненные значения результативного признака, вычисленные по аналитическому уравнению.

Корреляционное отношение в квадрате ( ), а для парной связи линейный коэффициент корреляции в квадрате ( ) называют коэффициентом детерминации (причинности), он отражает долю факторной дисперсии в общей дисперсии.

Коэффициент детерминации (D) показывает, на сколько процентов изменение среднего значения результативного признака определяется влиянием данного факторного признака.

В практике могут быть использованы и другие показатели для определения степени тесноты связи.

Элементарной характеристикой степени тесноты связи является коэффициент Фехнера:

,

где na– количество совпадений знаков отклонений индивидуальных величин факторного признака х и результативного признака у от их средней арифметической величины (например, «плюс» и «плюс», «минус» и «минус», «отсутствие отклонения» и «отсутствие отклонения»);

nb– количество несовпадений знаков отклонений индивидуальных значений признаков от значения их средней арифметической.

Коэффициент Фехнера используют при небольшом объеме исходной информации. Он изменяется в пределах от –1 до 1.

Для определения тесноты связи как между количественными, так и
между качественными признаками, при условии, что значения этих признаков можно проранжировать по возрастанию или убыванию, используется коэффициент корреляции рангов Спирмэна:

,

где di– разность между величинами рангов признака-фактора и результативного признака;

n – число показателей (рангов) изучаемого ряда.

Он варьирует в пределах от –1 до 1.

6) После установления достаточной степени тесноты связи выполняется построение модели связи (уравнения регрессии).

Тип модели выбирается на основе сочетания теоретического анализа и исследования эмпирических данных посредством построения эмпирической линии регрессии. Чаще всего используются следующие типы функций:

а) линейная – ;

б) гиперболическая – ;

в) параболическая – ;

г) показательная – .

Так как параметр а0 является средним значением результативного признака в точке, где факторный признак равен нулю (х = 0), то экономическая интерпретация этого параметра часто затруднена или вообще невозможна.

Параметры а1, а2,… называются коэффициентами регрессии. Они характеризуют силу связи между факторными и результативным признаками.

При анализе парной связи коэффициент а1 получил название коэффициента полной регрессии. Он показывает, насколько изменится в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

При изучении множественной связи коэффициенты а1, а2,… называются коэффициентами чистой регрессии. Они отражают степень среднего изменения результативного признака при изменении данного факторного признака на единицу, при условии, что остальные факторы, включенные в модель, остаются неизменными.

Для определения численных значений параметров уравнения связи (линии регрессии) используется метод наименьших квадратов. Суть этого метода состоит в выполнении следующего требования: