Файл: Алабин М.А. Корреляционно-регрессионный анализ статистических данных в двигателестроении.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.07.2024

Просмотров: 105

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

не могут существовать между тягой, с одной стороны, давлени­ ем и температурой масла — с другой стороны и т. п.

Кроме того, применение корреляционного и регрессионного анализов основывается на следующих предпосылках.

1 . Результаты наблюдений над параметрами Ху, Х2, ..., Хт представляют собой независимые, нормально распределенные случайные величины.

2. Дисперсии

о ^ , . . : ,

,

получаемые при различных

(повторных, последовательных и т.

д.) наблюдениях параметров,

равны между собой.

 

 

 

3. Точность измерения каждого из параметров меньше диа­ пазона (предела) изменения данного параметра.

Ыа практике часто приходится иметь дело с результатами наблюдений, не подчиняющимися нормальному распределению. В этом случае всегда можно подобрать такую функцию преоб­ разования, чтобы перейти от Xi к новой случайной величине 2 = =/(A 'i), распределенной приближенно нормально. Например, многие асимметричные распределения часто удается аппрокси­ мировать нормальным законом, перейдя от случайной величины Ху к случайной величине z= ln Ху.

Второе требование также не всегда выполняется в условиях

.реальных наблюдений. Если удается найти функциональную за­ висимость а2(Ах) = ф (А !), то оказывается возможным предло­ жить такое преобразование случайной величины, которое позво­ ляет получить однородные дисперсии. Преобразования случай­ ных величин подробно изложены во многих руководствах по математической статистике [10, 16] и др.

1.2. Основные определения й обозначения

Случайная величина — величина X, представляющая ре­ зультат случайного опыта, наблюдения, замера. Определенные значения одной и той же случайной величины обозначаются как Ху (i= 1, 2, . .., k ). Случайными величинами являются зависи­ мые переменные или результирующие параметры (обозначаемые Ху) и независимые переменные или составляющие параметры (обозначаемые Х2, Х3, ..., Хт) .

Результирующими параметрами являются выходные пара­ метры, свойства, характеристика двигателя, определяющие воз­ можность использования двигателя по назначению (тяга, запас устойчивой работы компрессора и форсажной, камеры, виброус­ корения корпусов, надежность работы и др .).

Составляющими параметрами являются все геометрические (зазоры, площади проходных сечений, посадки), газодинамиче­

ские (температура и давление

по тракту) параметры, условия,

в которых работают двигатели

(температура и давление возду-

9



ха на входе в компрессор, режимы работы и относительное вре­ мя работы на них за ресурс и др.).

Статистическая (стохастическая) связь. Связь (зависимость) между результирующими и составляющими параметрами, имею­ щими различные случайные значения, называется статистиче­ ской, если каждому значению независимой величины соответст­

вуют сопряженные

значения зависимых величин.

Зависимая ве­

личина

связана

с независимыми величинами Х2, Х3, .. ., Хт

статистически, если каждому значению Х2, Х3, ...,

Хт соответст­

вует не одно значение Хи а распределение Хи меняющееся вме­ сте с изменением Х2, Х3, ..., Хт.

Слова «зависимые» и «независимые» переменные применяют­ ся в алгебраическом смысле, т. е. Xi рассматривается как функ­

ция Х2, Х3, ..., Хт.

■/

Корреляционная связь (зависимость). Связь между величи­ нами Xi и Х2, Х3, ..., Х,„ называется корреляционной, если опре­ деленны^ значениям Х2, Х3, .. ., Хт соответствуют групповые средние ХиМножественная корреляционная связь характеризу­ ет статистическую зависимость результирующего параметра от двух и более составляющих параметров.

Групповой средней зависимой переменной Хи является сред­ нее арифметическое значение зависимой величины, соответст­ вующее каждому значению (интервалу) независимых перемен­ ных.

Форма корреляционной связи — тенденция, которой следует зависимая переменная при изменении значений независимых пе­ ременных. Если наблюдается тенденция равномерного возраста­ ния или убывания значений зависимой переменной, то корреля­ ционная связь — линейная; при тенденции же неравномерного изменения значений зависимой переменной корреляционная связь — криволинейная. Форма корреляционной связи при оп­ ределенном объеме статистической информации может быть оп­ ределена с известной вероятностью.

Уравнение корреляционной связи (уравнение регрессии) — уравнение, по которому могут быть найдены числовые значе­ ния групповых средних зависимых переменных в зависимости от соответствующих значений независимых переменных. В общем случае это уравнение может быть записано в следующем виде:

X i= f(X 2, Х3, ...,

Хт ).

(1)

Коэффициент корреляции (коэффициент парной

корреля­

ции)— простейшая характеристика

статистической

связи слу­

чайных величин. Тесноту связи по данным выборки можно оце­ нить только по относительным величинам. По абсолютным зна­ чениям коррелируемых параметров эту оценку нельзя сделать не только в том случае, когда они выражены в различных еди­ ницах измерения, но и когда они выражены в одних и тех же

Ю


единицах измерения, так как величины отклонений зависят от значений самих параметров. Такие относительные величины мо­ гут быть получены в виде отношений к их среднеквадратическо­ му отклонению, т. е. в форме нормированных отклонений. Срав­ нивать нормированные отклонения возможно, так как абсолют­ ная величина признаков при этом не имеет значения.

Для простейшей линейной двумерной корреляционной связи коэффициент корреляции представляет собой среднее произведе­ ние нормированных отклонений коррелируемых параметров

где п — число составляющих пар наблюдений (пара наблюде­ ний — сопряженные значения параметров, для которых опреде­ ляется корреляционная связь).

В индексе коэффициента парной корреляции указывается сначала индекс зависимого переменного, а затем — независимо­ го переменного. Численные значения rJ2 и г21 одинаковы. Коэф­ фициент корреляции есть показатель как того, насколько связь между случайными величинами близка к строгой линейной за­ висимости, так и слишком большой криволинейности этой связи.

Достаточно полным показателем коэффициент корреляции является:

для величин, для которых заранее из общих соображений можно предсказать линейную зависимость;

для величин, собственные случайные колебания которых подчиняются нормальному закону;

—•для величин, являющихся следствием единой причины. Коэффициент корреляции всегда лежит в пределах

Значения коэффициента корреляции, меньшие 0,5, выражают недостаточную меру предполагаемой или принятой зависимости.

Если нормированные отклонения—-— —

и — ------ -рядов равны

°Xi

ах~

между собой, то при совпадении их знаков (этот случай означа­ ет полную прямую связь) коэффициент корреляции получается равным единице:

При полной обратной связи коэффициент корреляции равен

1. Практически этих значений коэффициент корреляции нико­ гда не достигает, лишь приближаясь к единице при высокой ■степени тесноты корреляционных зависимостей.

И

Если случайные величины независимы, то коэффициент кор­ реляции равен нулю. Обратное утверждение, т. е. из равенства нулю коэффициента корреляции не следует независимость корре­ лируемых параметров.

Коэффициент частной (парциальной) корреляции г12,34... т является коэффициент парной корреляции, в котором исключе­ но влияние одной или нескольких других переменных. Коэффи­ циент частной корреляции позволяет выявить основные факторы, оказывающие наибольшее влияние между двумя переменными при условии, что все остальные переменные перестают быть пе­ ременными, так как они закрепляются на своем среднем уровне.

В индексе коэффициента частной корреляции указываются индексы коэффициента парной корреляции, а после точки — ин­ дексы исключаемых переменных.

Общий (совокупный) коэффициент множественной корреля­ ции R\,23i... т выражает меру зависимости результирующего па­ раметра Xi от всех составляющих параметров Х2, Х3, ..., Хт. Этим коэффициентом измеряется теснота (сила) совместного влияния всех составляющих параметров на результирующий па­ раметр. Численное значение общего коэффициента ' корреляции зависит от значений коэффициентов парной корреляции между Xi и Х2, Х3, ..., Хт, а также между каждой парой составляющих параметров. В индексе общего коэффициента множественной корреляции указывается сперва индекс зависимого переменного, а после точки — индекс всех составляющих параметров.

Уравнение регрессии — вид уравнения, который выбирается или которьвг характеризуется форма (модель) статистической связи результирующего параметра с составляющими парамет­ рами. Форма (модель) связи может быть линейной или криво­ линейной. Наиболее употребительными моделями связи являют­ ся линейные уравнения регрессии вида

 

Х 1~ Ь 0-{-Ь12Х 2 — для

парной корреляции. (3)

X 1= b 0-j-bJ2'3i'_mX 2-{-b132i'''mX 3-{-... — для

множественной

кор­

 

реляции.

(4)

Нелинейными уравнениями регрессии, как правило, являются

уравнения вида

 

 

 

■ ^■ 1 —

^12.34... щ Х 2 " Г ^13.24.,.т -'^ 2 _Ь ■"

^1т.234 ...т—1 ‘

(® )

Линейные уравнения регрессии можно использовать как пер­ вый этап исследований нелинейных корреляций-с тем, чтобы в дальнейшем! внести в них необходимые поправки.

Параметры уравнения корреляционной зависимости (уравне­ ния регрессии) — свободный член и коэффициенты при состав­ ляющих параметрах правой части уравнений регрессии.

Коэффициенты регрессии — коэффициенты при составляю­ щих параметрах правой части уравнения регрессии. В индексе

12


при коэффициенте регрессии вначале указываются индексы ре­ зультирующего и соответствующего составляющего параметра, а после точки — все остальные составляющие параметры.

Линии регрессии — графическое изображение уравнений кор­ реляционной зависимости (уравнений регрессии). Они характе­ ризуют форму связи результирующего параметра с составляю­ щими и определяют характер изменения результирующего пара­ метра, который получается при условии, что влияние неучтенных причин закрепляется на одном и том же уровне. Сами измене­ ния представляются как изменения, которые происходят в сред­ нем.

Следовательно, линия регрессии — это математическое вы­ ражение зависимости между параметрами, свойственной изучае­

мым наблюдениям. Практически графическое

изображение

уравнений регрессии применяется в основном

при

двумерных

линейных и криволинейных корреляционных связях.

 

 

Система нормальных уравнений — совокупность

уравнений,

по которым могут быть определены параметры

уравнения

рег­

рессии. Эта

система получается из условия максимального при­

ближения

линии регрессии к ломаной линии,

построенной

по

эмпирическим данным, получаемым в результате данного стати­ стического наблюдения. Эта задача обычно решается способом наименьших квадратов, при применении которого выдвигается требование, чтобы сумма квадратов разностей между значения­ ми результирующего параметра по линии регрессии и по эмпи­ рическим значениям была минимальной. Это требование соответ­ ствует свойству средней арифметической — сумма квадратов отклонений от своей средней была бы минимальной.

1.3. Масштабы выражения зависимых и независимых

переменных

 

Применение для расчета коэффициента корреляции

вместо

исходных случайных значений переменных X t новых

значений

X ' = k X t + C ,

(6)

где k — масштаб переменной величины Х{; С — начало отсчета этой переменной, не меняет абсолютного значения коэффициента корреляции. При k < 0 знак коэффициента корреляции получает­ ся обратный тому, который получается при подсчете коэффици­ ента корреляции по исходной статистической информации.

При подсчете параметров уравнения регрессии все перемен­ ные и соотношения между ними иногда выгодно выражать в стандартизованном масштабе, где за начало отсчета для каждой переменной принимается среднее значение, а за единицу масш­ таба —• величина среднеквадратического отклонения. В стан­

13