Файл: Учебное пособие Киров 2010 удк 311(075. 8) Ббк 60. 60я73 К91.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.04.2024

Просмотров: 97

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Таблица 9.3


Стаж работы, лет

х


1

2

3

4

5

6

7

8

9

10

Дневная выработка рабочего, шт.

y

4

5

6

7

7

8

8

9

10

9

1) Для уточнения формы связи между рассматриваемыми признаками используем графический метод.

Графически взаимосвязь признаков изображается с помощью поля корреляции.



Область, которую образуют эмпирические точки на поле корреляции, близка к прямой линии. Следовательно, можно считать наличие прямолинейной корреляции.

2) Для измерения степени тесноты связи между признаками используем линейный коэффициент корреляции:

.

Для расчета rиспользована вспомогательная таблица (табл. 9.4)

Поскольку r > 0, то связь между стажем работы и выработкой рабочих прямая, то есть с увеличением стажа работы средняя дневная выработка рабочего увеличивается. Так как линейный коэффициент корреляции находится в промежутке , то связь между факторным и результативным признаками сильная.

Проверяем значимость коэффициента корреляции:

.

По таблице t-распределения Стьюдента с учетом принятого уровня значимости и числа степеней свободы =10 – 2 = 8 определяем = 3,355. Так как , следовательно, можно утверждать существенность коэффициента корреляции.

Рассчитаем коэффициент детерминации по следующей формуле: , т. е. на 92% изменение производительности труда рабочего обусловлено изменением его стажа работы. Остальные 8% связаны с другими факторами, которые мы не рассматриваем.


3) Определяем модель связи. График показывает наличие линейной связи (рис. 3), поэтому используется функция

=a0+a1x,

где – выравненные значения результативного признака;

a0 – значение y при х = 0;

a1 – коэффициент регрессии (пропорциональности), характеризующий изменение значения y при изменении х на 1 единицу.

Параметры уравнения a0 и a1 находим методом наименьших квадратов.

Для линейной функции условие метода наименьших квадратов равносильно следующей системе нормальных уравнений:



где n – число уровней (членов) ряда (в нашем примере 10);

Σx– сумма значений факторного признака;

Σy – сумма значений результативного признака;

Σx2 – сумма значений квадратов факторного признака;

Σхy – сумма произведений значений факторного признака на значение результативного признака.

Чтобы решить данную систему, построим вспомогательную таблицу (табл. 9.4).

Таблица 9.4

Вспомогательная таблица для расчета линейного коэффициента корреляции

и уравнения связи

x

y

xy

x2

y2





1

4

4

1

16

4,6

0,36

2

5

10

4

25

5,2

0,04

3

6

18

9

36

5,8

0,04

4

7

28

16

49

6,4

0,36

5

7

35

25

49

7,0

0,00

6

8

48

36

64

7,6

0,16

7

8

56

49

64

8,2

0,04

8

9

72

64

81

8,8

0,04

9

10

90

81

100

9,4

0,36

10

9

90

100

81

10,0

1,00

55

73

451

385

565

73,0

2,40


Полученные в итоговой строке значения подставляем в систему нормальных уравнений и решаем ее.





Вычитая из первого уравнения второе, получаем:

, откуда

Подставляем числовое значение в одно из уравнений (например, в первое) и получаем:

, откуда .

Таким образом, нами получено следующее линейное уравнение регрессии:

=4+0,6x.


=4+0,6x.



Коэффициент регрессии a1показывает, что при увеличении стажа рабочих на 1 год их производительность труда в среднем возрастает на 0,6 шт.

Если перед угловым коэффициентом прямой a1 знак «-», то наблюдается тенденция к снижению (связь между признаками обратная).

Для проверки значимости параметров уравнения а0 и а1 рассчитаем:

,

где (предварительные расчеты см. в табл. 9.4).

В формуле – значения результативного признака, рассчитанные по уравнению связи. Так, для х = 1 ; для остальных значений х расчет выполняется аналогично. Результаты расчета записаны в табл. 9.4

,

где .

По таблице t-распределения Стьюдента с учетом принятого уровня значимости
и числом степеней свободы =10 – 1 – 1 = 8 (где k – число факторных признаков) определяем tкрит = 2,306.

Поскольку и , то параметры а0 и а1 признаем значимыми.

Средняя квадратическая ошибка уравнения

.

Тогда отношение меньше 15%, поэтому уравнение достаточно хорошо отображает взаимосвязь двух признаков и может быть использовано в практической работе.

3. Методы изучения связи социальных явлений

Применение корреляционного и регрессионного анализа требует, чтобы все признаки были количественно измеримы. Построение аналитических группировок предполагает, что количественным должен быть результативный признак.

Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными) признаками. Сфера их применения шире, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет об установлении наличия связи и измерения ее тесноты.



Коэффициенты ассоциации и контингенции

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. При исследовании связи числовой материал располагается в виде таблиц сопряженности, например табл. 9.5:

Таблица 9.5

Таблица для вычисления коэффициентов ассоциации и контингенции

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d

Для вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой).

Коэффициенты определяются по формулам:

  • ассоциации

  • контингенции

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если или .

Пример. Исследовалась связь между успеваемостью студентов-заочников и работой их по специальности. Результаты обследования характеризуются следующими данными (табл. 9.6).

Таблица 9.6

Зависимость успеваемости студентов-заочников от работы их по специальности

Студенты-заочники
Число студентов

Из них

получившие положительные оценки

получившие неудовлетворительные оценки

Работающие по специальности

Не работающие по специальности


200
200


180
140


20
60

Итого

400

320

80