Файл: Алабин М.А. Корреляционно-регрессионный анализ статистических данных в двигателестроении.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.07.2024

Просмотров: 114

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

дартизованном масштабе упрощаются соотношения между пере­ менными, что удобно при анализе многомерных связей.

Формула перевода в стандартизованный масштаб:

 

 

X — х

 

(7 )

 

 

 

°х

 

 

 

 

 

 

где

X — значения

параметров

(результирующего

или состав­

 

ляющих)

в натуральном масштабе;

 

 

tx — соответствующие их

значения

в стандартизованном

 

масштабе.

 

 

 

 

При расчетах могут применяться также новые значения пере­

менных, подсчитанные по формуле

 

 

 

 

X t-X pi

 

(8)

 

 

 

dx

 

 

 

 

 

 

где

Хы — новое начало отсчета переменных, которое выбирается

 

вблизи средних значений переменных Хй

корреляци­

 

dX; — произвольная величина (при

расчетах по

онным таблицам в качестве такой произвольной вели­ чины берутся длины интервалов соответствующих пе­ ременных) .

После расчета параметров корреляционных зависимостей по масштабным значениям переменных производится замена зна­

чений Х[ на Х{ по одной из формул (6), (7), (8). Например, для стандартизованного масштаба

X i=X i + txi ста';.

1.4. Оценка тесноты корреляционных связей

Для оценки тесноты корреляционной связи при линейных кор­ реляционных зависимостях используется коэффициент корре­ ляции. Коэффициент корреляции характеризует относительную величину отличия математического ожидания произведения пе­ ременных величин от произведения математических ожиданий каждой переменной величины.

Коэффициент корреляции является безразмерной величиной, значения которого должны находиться в пределах — Его значение равно единице при линейной функциональной за­

висимости между переменными и равно нулю — для независи­ мых переменных величин.

Для оценки тесноты связи между двумя переменными вели­ чинами применяется коэффициент парной корреляции, между тремя и более переменными — коэффициент частной корреля­ ции и общий коэффициент корреляции.

Коэффициент парной корреляции выражает меру корреля­ ционной линейной зависимости. Для определения численного зна­

14


чения коэффициента парной корреляции могут использоваться следующие формулы:

Х уХ 2 — ХхХъ

 

 

и

АV1 «АVа

 

(9)

 

 

 

( 10)

 

 

га

 

 

 

 

 

2 (Х\ — х х) ( х 2Хо) .

 

 

 

п V A'pY, — У

V Хо

 

 

12

V n

У X? — СУ А’,

] /

п V Х\ — (У А"2)2

( П )

 

 

где

 

 

 

 

 

 

 

 

 

 

- ( A i )2

 

— среднеквадратическое отклонение параметра Лу,

 

=

| /

S

=

_ д

а

 

— среднеквадратическое отклонение параметра /Y2.

 

При я<30

для устранения постоянной

погрешности значе­

ния среднеквадратического отклонения, получаемые по указан­ ным выше формулам,, умножаются на величину ‘

При изменении всех численных значений коррелируемых при­ знаков на величину выбранных начала отсчета и масштаба ко­ эффициент корреляции определяется по формуле

 

 

 

У

12 '

 

S'х \х 2 71

 

 

 

,

Хх— A"io

, Хо — Хоо

где х. = -------х„-------------- -}

1

И

Ь

dXi

 

‘X,

 

Х л \ I У X

, (НО

При вычислении в стандартизованном масштабе коэффициент парной корреляции находится по формуле

ri 2 = —

, t-x~ =

ix 1■tx«,

( 12)

где

 

 

Хо x<2 .

 

X i - X x .

tx

 

‘■х,:

;»

G

 

 

Оv-

 

 

Xi, Xo — значения переменных в натуральном масштабе.

15


Для логарифмических моделей коэффициент парной корре­ ляции находится по выражению

п 2 In Xji In X ki — ^

In X g y; In X hi____________

гInХуШХк

l / n j In2 Xui — ( у In X Kif '

У п Ъ In2 X j t - { ^ l n X j i f

Коэффициент множественной корреляции с использованием ме­ тода определителей находится по формуле

где Д-определитель, составленный из всех коэффициентов парной корреляции: х

1 Г12 Г13* •• • - Г1т

 

Г21 1 г 2з . . . г2т

( 15)

 

гтх г т2 г тЗ • * . . . \

 

Дп — определитель, получающийся из определителя Д вычер­ киванием нулевого (первого слева) столбца и нулевой (верхней) строки:

1 Г03. • •

Гgo 1 . . . • •Г 3т

Д п =

( 16)

ГШ2 ^ m3 * * * . . .

1

Общий коэффициент множественной корреляции для трех пере­ менных равен

= l / - Г2+Г'3

( 17)

уl ~ rh ■

Если расчет ведется в стандартизованном масштабе, то

 

^1.23...яг = У ^ l - r i2 +

^2r i3 + ---- + ^mr lm i

( 1 8 )

где bi,

bo, ..., bm— стандартизованные

коэффициенты уравне­

ния множественной корреляции;

 

 

 

г\г, га,

..., гт— коэффициенты

парной

корреляции

между за­

висимым переменным и независимыми переменными

Х2, Х3, ...

. • Хт.

 

 

 

 

Вычисление численных значений коэффициентов частной кор­ реляции может производиться следующими способами.

1. Решением системы нормальных уравнений находится з чение коэффициента 612.34... т . Находится значение коэффициен­ та 621.34... ш по системе нормальных уравнений, полученной из

16


исходной, в которой переменные

А\ и

А2

заменены местами.

Тогда

 

 

 

 

 

 

 

 

 

Г 12.34...ш ~

У ^12.34...m^21.34...m

О ® )

2.

Находится значение

решением исходной системы нор­

мальных уравнений. Дополнительно находится значение БА“,

ре­

шением системы нормальных уравнений, полученной из исходной

с отбрасыванием строки и столбца, содержащих Х2. Тогда

 

 

г

=

У, х ; -

v

x l

 

(20)

 

1 / ^

1 ~

 

1*

 

12.34..

 

у у

д . 2 __

у

X 1*

 

3. Третий способ вычисления коэффициента частной корре­ ляции основан на постепенном переходе от коэффициентов кор­ реляции низших порядков к коэффициентам корреляции выс­ ших порядков. Порядок коэффициента корреляции определяется числом вторых индексов; так, например, коэффициент г1245 яв­ ляется коэффициентом третьего порядка.

Переход к коэффициенту частной корреляции ближайшего высшего порядка производится по формуле

^12.34...гп—\ ' Г lm.23...m—1 * ^2m.34...m—1

(21)

' 12.34. ..пГ

 

V i} •

lm .34...m - l ) 0 ~~ r 2 m .3 4 ...m -l)

 

Так, коэффициент частной корреляции Xi по Х2 при исключении влияния А3 исчисляется по формуле

г ,_ Л—

Г 11 — Г 13г 23

( 2 2 )

12.3

V ( 1 - г М О - 4 )

'

 

а при исключении А3 и А4 — по формуле

 

'12.34

г 12.3— г 14.ЗГ24.3

(23)

 

У У ~ л14.з) ( 1 — г 24.з)

В тех случаях, когда линии регрессии значительно отличаются от прямой линии, в качестве меры связи по данным вы­ борки используют корреляционное отношение, представляющее собой отношение межгруппового среднеквадратического откло­ нения переменной Ai к общему среднеквадратическому отклоне­ нию этой величины:

 

Л1/2=

1( 2 )

 

 

 

(24)

где

 

 

 

 

 

 

 

F Ъ {Х и -Х <?-пх 1.

 

Г

2 (A if-ЛДЗ пх

3l(2)=|/

уГ

 

 

 

п

 

п

 

 

 

Из (24)

следует, что цц2 = 0 в тех случаях,

когда 6i(2)= 0, т. е

в случаях,

когда линия регрессии утлраметров"п редетавл ет ГО-

 

 

■■

:

7

'

17

 

 

I


ризонтальную линию, проходящую через центр тяжести распре­ деления. В тех случаях, когда все распределение сконцентриро­ вано на кривой регрессии, гр/г = 1.

При вычислении корреляционного отклонения по корреляци­ онной таблице выгодно применять следующую формулу:

Теснота корреляционных связей может быть оценена величи­ ной угла между прямыми линиями регрессии. В этом случае, чем меньше эта величина, тем больше степень корреляционных связей между коррелируемыми параметрами.

Величина угла между линиями регрессии находится по урав­ нению

0=

 

-----— Q12

 

(26)

arc tg -

Qoi

Qto

ч

 

 

 

14-

 

 

 

 

 

 

021

 

 

(26')

е21

£ (ЛЧ — А',) (Хп Хо)

■ (26")

 

 

 

Порядок определения

коэффициентов регрессии gi2

и g2i при­

веден в следующем разделе.

Теснота связи может быть охарактеризована также коэффи­ циентами Пирсона и Чупрова. Порядок определения этих коэф­ фициентов дан в разд. 2.4.

1.5. Уравнение регрессии

Уравнение' корреляционной зависимости, или уравнение рег­ рессии, дает форму и численное выражение статистической за­ висимости результирующего параметра от составляющих пара­ метров. Уравнение регрессии позволяет определять для каждого значения независимого переменного вероятное численное значе­ ние зависимого переменного.

В принципе уравнение регрессии может быть графически представлено на многомерной плоскости регрессии. Однако прак­ тически это может быть выполнено для дву- и трехмерных кор­ реляционных зависимостей. Корреляционные зависимости могут выражаться прямой или плавйой кривой линиями. Степень точ­ ности приближения принятой формы (модели) корреляционной зависимости к истинной (в некоторых случаях - - теоретической) форме зависимости зависит от объема статистической информа­

18