Файл: Основы статистического метода исследования общественного здоровья и здравоохранения.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 76

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
, при которой одной величине изучаемого признака соответствует несколько других величин, взаимосвязанного с ним признака, варьирующих около своей средней. Изменение одной величины может вести к изменению другой на различные значения.

Корреляционная связь может быть прямой и обратной.

Под прямой корреляционной зависимостью понимают такую связь, когда увеличению (снижению) одной величины соответствует увеличение (снижение) связанной с ней другой. Например, интенсивность курения ведет к увеличению риска развития ишемической болезни сердца, с увеличением возраста ребенка увеличивается его масса тела и др.

Под обратной корреляционной зависимостью понимают такую зависимость, когда увеличению (снижению) одной величины соответствует снижение (увеличение) связанной с ней другой. Например, курение снижает среднюю продолжительность жизни; уменьшение времени ожидания приема врача увеличивает удовлетворенность пациентов медицинской помощью; сокращение сроков доставки пациентов с острой хирургической патологией в стационар от момента начала заболевания снижает послеоперационную летальность и др.

Корреляционная связь может иметь различную силу, быть слабой, средней, сильной (таблица 13).

В зависимости от этого корреляционная связь может быть очевидна: с увеличением роста увеличивается масса тела; с повышением температуры тела увеличивается частота сердечных сокращений и др. Однако большинство сложных явлений общественного здоровья, организации здравоохранения, вопросов профилактической и клинической медицины имеют завуалированные, зависящие от многих причин взаимосвязи. Именно на выявлении и количественной оценки такой формы связи сосредоточено внимание медицинской статистики, которая должна в рамках корреляционного анализа ответить на следующие вопросы:

∙ определить наличие или отсутствие связи;

∙ определить направление связи;

∙ определить силу связи;

∙ определить достоверность результатов исследования. 

Существует большое количество различных параметрических и непараметрических методик определения корреляционной зависимости. При параметрических методах вычисления проводят с реальными полученными количественными данными, имеющими симметричное распределение в статистической совокупности. При асимметричном распределении или при необходимости провести корреляционный анализ качественных признаков применяют непараметрические методы. Непараметрические методы в отличие от параметрических менее точны, но позволяют проводить корреляцию как между количественными, так и между качественными признаками. Наиболее простыми являются
параметрический метод расчета коэффициента корреляции Пирсона (r) и непараметрический метод расчета коэффициента корреляции Спирмена (ρ).

Значения коэффициента корреляции интерпретируют следующим образом (таблица 13).

 
Таблица 13

Схема оценки коэффициента корреляции

 Оценка корреляции

Величина коэффициента корреляции при наличии

Прямой связи

Обратной связи

Слабая

0 – 0,29

0 – (-0,29)

Средняя

0,3 – 0,69

(-0,3) – (-0,69)

Сильная

0,7 – 1,0

(-0,7) – (- 1,0)


Коэффициент корреляции Пирсона рассчитывается по следующей формуле:

где: r – коэффициент корреляции;

x и y – коррелируемые ряды;

dx и dy – отклонения каждого из чисел ряда от их средних.

Применять корреляцию Пирсона можно только в том случае, когда оба сравниваемых признака являются количественными и имеют симметричное распределение. Поскольку в большинстве медицинских исследованиях редко удается получить распределение, которое было бы близко к нормальному, то чаще для оценки взаимосвязи между парами признаков применяется метод ранговой корреляции Спирмена.

Коэффициент ранговой корреляции Спирмена является несколько менее точным методом определения корреляции, однако может быть применен при любом распределении сравниваемых количественных признаков, а также при поиске связи между количественными и качественными признаками (когда последние могут быть ранжированы, например, по степени интенсивности выраженности какого - либо явления). Поэтому данный метод применяется в большинстве медицинских исследований.

Рассчитывается коэффициент ранговой корреляции по формуле:

 
где: ρ - коэффициент ранговой корреляции;

d – разность рангов (порядковые номера рядов)

n – число коррелируемых пар рядов.

 

Проиллюстрируем вычисление коэффициента ранговой корреляции на следующем примере. Существует мнение, что уровень рождаемости в регионе зависит от доли сельского населения. Необходимо найти наличие, направление и силу связи и сделать вывод. В таблице 14 в первых двух графах располагаются данные о доле сельского населения в различных регионах России и соответствующих уровнях рождаемости. В следующих графах последовательно вычисляется сумма квадратов разности рангов.

Таблица 14

Расчет коэффициента ранговой корреляции Спирмена на примере корреляции уровня рождаемости и доли сельского населения в различных регионах

 

X

Доля сельского населения (%)

y

Показатель рождаемости (‰)

Ранговые места

d

d2

Ранг X

Ранг y

21,5

9,9

1

2

-1

1

28,9

9,6

2

1

1

1

29,4

10,1

3

3,5

-0,5

0,25

34,1

10,1

4

3,5

0,5

0,25

37,4

11,7

5

7

-2

4

38,4

10,7

6

6

0

0

38,6

10,2

7

5

2

4

 

 

 

 

 

∑ d2 = 10,5


Вначале необходимо расположить данные одного из рядов (x) в порядке возрастания (в таблице они уже расставлены). Так как значения второго ряда (y) связаны со значениями первого ряда, то естественно равномерного их увеличения или снижения может и не быть. Для каждого из рядов определяем ранги, т.е. расставляем порядковые номера значений по возрастанию. Т.к. во втором ряду имеется два одинаковых значения показателя рождаемости, то для каждого из них вписываем значение средней арифметической их порядковых номеров. В следующей графе построчно определяем разность рангов. В последней графе построчно возводим разность рангов в квадрат, и получаем сумму квадратов разности рангов. Полученные данные подставляем в формулу.



Прежде чем делать вывод необходимо оценить достоверность значения полученного коэффициента, вычислив среднюю ошибку коэффициента ранговой корреляции и критерий достоверности:

 



На основании полученных данных можно сделать вывод о сильной прямой корреляционной зависимости уровня рождаемости в различных регионах от доли сельского населения. Т.е. чем выше доля сельского населения в регионе, тем выше уровень рождаемости. Поскольку критерий достоверности более 2, данный вывод можно считать достоверным с вероятностью более 95,5%.

 

При сравнительном анализе показателей общественного здоровья и здравоохранения всегда возникает вопрос: чем обусловлены имеющиеся в них различия. Так, например, при сравнении показателей смертности в Российской Федерации и стран Западной Европы в 2004 г. (17‰ и 10 ‰ соответственно) возникает вопрос, почему смертность в России гораздо выше, чем в странах Западной Европы. Различия в этих показателях могут быть обусловлены не только действительными отличиями в размерах смертности, но и разницей в возрастном, половом, социальном составе населения, различиями в уровне, укладе и качестве жизни, санитарно-гигиенических условиях проживания, наличием в составе Российской Федерации регионов с наиболее неблагополучной и нестабильной обстановкой. Выявление истинных причин этого явления сложно, но, безусловно, необходимо для проведения целенаправленной государственной политики, направленной на снижение смертности. Поэтому при сравнении показателей рождаемости, смертности, заболеваемости, инвалидности и др. обычно применяют метод стандартизации, позволяющий нивелировать различия в структуре изучаемого явления.
Сущность метода стандартизации заключается в том, что он позволяет рассчитать стандартизированные показатели, определяя, какими бы были истинные размеры изучаемых явлений, если бы состав сравниваемых совокупностей был одинаков.
Существует три метода расчета стандартизированных коэффициентов: метод прямой стандартизации, метод обратной стандартизации и метод косвенной стандартизации.

Метод прямой стандартизации может применяться, когда известен как размер изучаемого явления, так и состав среды (например, известны уровни смертности и возрастной состав населения).

Метод обратной стандартизации применяется, когда имеются данные о размерах изучаемого явления, но отсутствуют данные о составе среды.

Метод косвенной стандартизации применяется, когда отсутствуют данные о размерах изучаемого явления, но есть данные о составе среды.

Прямой метод стандартизации включает в себя следующие этапы:

1) расчет общего и погрупповых интенсивных показателей;

2) выбор стандарта;

3) расчет ожидаемых величин;

4) расчет стандартизированных показателей;

5) сравнение стандартизированных показателей между собой и истинными интенсивными показателями.

 

Приведем пример расчета стандартизированных показателей. В таблице 15 приведены данные об общей заболеваемости населения злокачественными новообразованиями в районе К. в 1996 и 2006 гг. в различных возрастных группах. Рассчитав стандартизированные показатели мы ответим на вопрос, повлияли ли изменения возрастного состава населения на изменения в показателях заболеваемости злокачественными новообразованиями.
Таблица 15

Распределение населения и больных злокачественными новообразованиями по возрасту в районе К. в 1996 и 2006 гг.

 

Возрастные группы

1996 г.

2006 г.

Численность населения

Число

больных

Численность населения

Число

больных

До 30 лет

5190

5

5593

8

30-39 лет

1780

11

1934

18

40-49 лет

1554

22

1687

28

50-59 лет

1032

44

1124

36

60 лет и ст.

2172

52

1282

64

Всего

11728

134

11620

154


1) Рассчитаем общий и погрупповые интенсивные показатели и занесем их таблицу 16. Так для возрастной группы до 30 лет показатель общей заболеваемости злокачественными новообразованиями в 1996 г. составил:




Число больных возрастной группы до 30 лет

×

10000

=

Численность возрастной группы до 30 лет

=

5

×

10000

=

9,6 случаев на 10000 населения

5190



Из таблицы 16 видно, что за десять лет общая заболеваемость в районе «К» злокачественными новообразованиями выросла с 114,3 до 132,5 случаев на 10000 населения.

2) Выберем стандарт. За стандарт можно взять возрастной состав населения как в 1996 так и в 2006 году, можно взять суммарный возрастной состав за эти годы. Примем за стандарт возрастной состав в населения в 1996 г. (таблица 18). В этом случае стандартизированный показатель необходимо будет рассчитать только для 2006 года, т.к. выбирая такой стандарт, мы задаем вопрос: какими бы были показатели общей заболеваемости населения злокачественными новообразованиями в районе «К» в 2006 г., если бы возрастной состав жителей района был бы такой же, как и в 1996г.


Таблица 16

Общий и погрупповые коэффициенты общей заболеваемости населения района К злокачественными новообразованиями в 1996 и 2006 гг.

 

Возрастные группы

1996 г.

2006 г.

Численность населения

Число

больных

Заболеваемость на 10 тыс. населения

Численность населения

Число

больных

Заболеваемость на 10 тыс. населения

До 30 лет

5190

5

9,6

5593

8

14,3

30-39 лет

1780

11

61,8

1934

18

93,1

40-49 лет

1554

22

141,6

1687

28

166,0

50-59 лет

1032

44

426,4

1124

36

320,3

60 лет и ст.

2172

52

239,4

1282

64

499,2

Всего

11728

134

114,3

11620

154

132,5


3) Рассчитаем ожидаемые числа случаев заболеваний злокачественными новообразованиями в районе «К» в 2006 г., исходя из стандарта возрастного состава населения, обычной пропорцией и занесем в таблицу (Таблица 17).

Порядок расчета следующий.

Если заболеваемость в 2006 г. в возрастной группе до 30 лет составила 14,3 случая на 10000 населения, то если бы численность этой возрастной группы была 5190 человек, число случаев болезни составило бы – х.

10000 – 14,3

5190 – х 5190 × 14,3 / 10000 = 7,4 случая

Ожидаемое число случаев заболеваний в строке «Всего» таблицы 18 получим как сумму всех ожидаемых чисел.

 Таблица 17

Общая заболеваемость злокачественными новообразованиями, стандарт возрастного состава населения и ожидаемые числа заболеваний в районе «К» в 2006 г.

 

Возрастные группы

2006 г.

Стандарт (возрастной состав населения в 1996г.)

Заболеваемость на 10 тыс. населения

Ожидаемые числа заболеваний

До 30 лет

5190

14,3

7,4

30-39 лет

1780

93,1

16,6

40-49 лет

1554

166,0

25,8

50-59 лет

1032

320,3

33,1

60 лет и ст.

2172

499,2

108,4

Всего

11728

132,5

191,3



4) Рассчитаем стандартизированный показатель заболеваемости злокачественными новообразованиями в районе «К» в 2006 г.:

 

Ожидаемое число заболеваний всего

×

10000

=

Стандарт (всего)

=

191,3

×

10000

=

163,1 случаев на 10000 населения

11728


5) Проведем анализ полученных данных. В 1996 г. заболеваемость злокачественными заболеваниями составляла 114,3 случая на 10000 населения, а в 2006 г. - 132,5. Следовательно, произошло увеличение заболеваемости за период с 1996 по 2006 гг. Стандартизированный по возрасту показатель заболеваемости злокачественными новообразованиями в 2006 г. составил 163,1 случай на 10000 населения, т.е. если бы возрастной состав района «К» в 2006 г. был бы такой же как в 1996 г., то заболеваемость составила бы 163,1 случай на 10000 населения. Таким образом, можно сделать вывод, что изменения в возрастном составе не повлияли на рост заболеваемости злокачественными новообразованиями в районе «К».
Задания для проведения самостоятельной работы

на практическом занятии

Задания по методу корреляции

Эталон выполнения

Существует мнение, что чем дольше сроки доставки больных с острым аппендицитом в хирургический стационар от момента начала заболевания, тем выше частота послеоперационных осложнений. В таблице приведены данные о частоте послеоперационных осложнений, в зависимости от времени доставки больного.

Рассчитайте коэффициент ранговой корреляции и определите наличие связи, ее направление и силу. Оформите вывод.

Время доставки (час)

Частота осложнений (%)

Ранговые места

d

d2

Ранг Х

Ранг Y

До 3

6

1

2

-1

1

3 – 5

5

2

1

1

1

6 – 8

9

3

3

0

0

9 – 11

12

4

4

0

0

12 – 14

18

5

5

0

0

15 – 17

24

6

6

0

0

18 – 20

28

7

7

0

0

21 – 23

34

8

8

0

0

24 и более

46

9

9

0

0

 

 

 

 

 

Σd2=2



 

Вывод: Выявлена прямая сильная связь, т.е. чем дольше сроки доставки пациентов с острым аппендицитом в стационар, тем выше частота послеоперационных осложнений.
Варианты заданий по методу корреляции

 


Задание №1

Существует мнение, что с возрастом увеличивается число злокачественных новообразований среди населения. В таблице приведены данные по распространенности злокачественных новообразований среди различных возрастных групп населения.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Возрастные группы

Распространенность злокачественных новообразований (на 10000 населения)

До 30 лет

1,0

30-39 лет

5,6

40-49 лет

23,7

50-59 лет

76,2

60 лет и ст.

187,4



Задание №2

 Существует мнение, что послеоперационная летальность при кишечной непроходимости зависит от сроков доставки пациента в хирургическое отделение от начала заболевания. В таблице приведены показатели послеоперационной летальности в зависимости от сроков доставки пациентов.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Время (час)

Летальность (%)

До 3

1,5

3 – 5

2,2

6 – 8

3,8

9 – 11

2,9

12 – 14

5,8

15 – 17

5,8

18 – 20

10

21 – 23

11,8

24 и более

15,6


Задание №3

Существует мнение, что при вакцинации против гриппа резко снижается заболеваемость детей. В таблице приведены данные об охвате детей прививками и заболеваемости гриппом в различных регионах.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

% охвата

Заболеваемость ()

45%

140,8

50%

56,6

78%

60,2

80%

39,4

88%

44,2

93%

31,4


Задание №4

Имеются данные о влиянии толщины угольного пласта на заболеваемость шахтеров гипертонической болезнью (таблица).

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Толщина пласта (м)

Заболеваемость (‰)

0,6

3,5

0,8

4,2

1,0

3,6

1,2

6,3

1,4

7,4

1,5

8,9

1,6

10,0


Задание №5

Иметься мнение, что в регионах с преобладанием сельского населения уровень рождаемости более высокий. В таблице представлены данные о доле сельского населения в различных регионах и уровне рождаемости.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Доля сельского населения (%)

Рождаемость (‰)

21,5

9,9

28,9

9,6

29,4

10,1

34,1

10,1

37,4

11,7

38,4

10,7

38,6

10,2


Задание №6

Существует мнение, что заболеваемость дизентерией повышается с увеличением средней температуры летнего сезона. В таблице приведены данные о заболеваемости дизентерией и средней температуре летнего сезона за ряд лет.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

 





Заболеваемость

(на 10000 населения)

Средняя температура сезона (град.)

31,8

14,6

59,8

15,7

60

15

60,4

14,6

67

13,2

67

14,1

68,2

15,2

77

15

88

14,3

117

15,4

 

Задание №7

Имеется мнение, что заболеваемость болезнями желудочно-кишечного тракта при вахтовом методе работы зависит от продолжительности периода вахты. В таблице приведены данные о длительности вахты и уровне заболеваемости.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Длительность вахты (нед.)

Заболеваемость ЖКТ (‰)

1

129,9

2

136,7

3

133,9

4

187,6

5

123,6

6

135,0

7

295,9

8

301,0

Задание №8

Существует мнение, что уровень заболеваемости психическими расстройствами зависит от численности населения, проживающего в населенном пункте. В таблице приведены города Оренбургской области, расположенные по мере возрастания численности населения и уровень заболеваемости психическими расстройствами.

Рассчитайте коэффициент ранговой корреляции и определите наличие, направление и силу связи. Оформите вывод.

Города

Заболеваемость (‰)

Медногорск

13,4

Бугуруслан

6,5

Бузулук

17,3

Новотроицк

13,3

Орск

12,7

Оренбург

12,5


Задание №9

Существует мнение, что уровень травматизма зависит от численности населения, проживающего в населенном пункте. В таблице приведены города Оренбургской области, расположенные по мере возрастания численности населения и уровень травматизма.

Рассчитайте коэффициент ранговой корреляции, определите наличие, направление и силу связи. Оформите вывод.

Города

Заболеваемость (‰)

Медногорск

84,9

Бугуруслан

101,2

Бузулук

151,4

Новотроицк

133,0

Орск

101,0

Оренбург

174,2