Файл: Алабин М.А. Корреляционно-регрессионный анализ статистических данных в двигателестроении.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.07.2024
Просмотров: 105
Скачиваний: 0
не могут существовать между тягой, с одной стороны, давлени ем и температурой масла — с другой стороны и т. п.
Кроме того, применение корреляционного и регрессионного анализов основывается на следующих предпосылках.
1 . Результаты наблюдений над параметрами Ху, Х2, ..., Хт представляют собой независимые, нормально распределенные случайные величины.
2. Дисперсии |
о ^ , . . : , |
, |
получаемые при различных |
(повторных, последовательных и т. |
д.) наблюдениях параметров, |
||
равны между собой. |
|
|
|
3. Точность измерения каждого из параметров меньше диа пазона (предела) изменения данного параметра.
Ыа практике часто приходится иметь дело с результатами наблюдений, не подчиняющимися нормальному распределению. В этом случае всегда можно подобрать такую функцию преоб разования, чтобы перейти от Xi к новой случайной величине 2 = =/(A 'i), распределенной приближенно нормально. Например, многие асимметричные распределения часто удается аппрокси мировать нормальным законом, перейдя от случайной величины Ху к случайной величине z= ln Ху.
Второе требование также не всегда выполняется в условиях
.реальных наблюдений. Если удается найти функциональную за висимость а2(Ах) = ф (А !), то оказывается возможным предло жить такое преобразование случайной величины, которое позво ляет получить однородные дисперсии. Преобразования случай ных величин подробно изложены во многих руководствах по математической статистике [10, 16] и др.
1.2. Основные определения й обозначения
Случайная величина — величина X, представляющая ре зультат случайного опыта, наблюдения, замера. Определенные значения одной и той же случайной величины обозначаются как Ху (i= 1, 2, . .., k ). Случайными величинами являются зависи мые переменные или результирующие параметры (обозначаемые Ху) и независимые переменные или составляющие параметры (обозначаемые Х2, Х3, ..., Хт) .
Результирующими параметрами являются выходные пара метры, свойства, характеристика двигателя, определяющие воз можность использования двигателя по назначению (тяга, запас устойчивой работы компрессора и форсажной, камеры, виброус корения корпусов, надежность работы и др .).
Составляющими параметрами являются все геометрические (зазоры, площади проходных сечений, посадки), газодинамиче
ские (температура и давление |
по тракту) параметры, условия, |
в которых работают двигатели |
(температура и давление возду- |
9
ха на входе в компрессор, режимы работы и относительное вре мя работы на них за ресурс и др.).
Статистическая (стохастическая) связь. Связь (зависимость) между результирующими и составляющими параметрами, имею щими различные случайные значения, называется статистиче ской, если каждому значению независимой величины соответст
вуют сопряженные |
значения зависимых величин. |
Зависимая ве |
|
личина |
связана |
с независимыми величинами Х2, Х3, .. ., Хт |
|
статистически, если каждому значению Х2, Х3, ..., |
Хт соответст |
вует не одно значение Хи а распределение Хи меняющееся вме сте с изменением Х2, Х3, ..., Хт.
Слова «зависимые» и «независимые» переменные применяют ся в алгебраическом смысле, т. е. Xi рассматривается как функ
ция Х2, Х3, ..., Хт.
■/
Корреляционная связь (зависимость). Связь между величи нами Xi и Х2, Х3, ..., Х,„ называется корреляционной, если опре деленны^ значениям Х2, Х3, .. ., Хт соответствуют групповые средние ХиМножественная корреляционная связь характеризу ет статистическую зависимость результирующего параметра от двух и более составляющих параметров.
Групповой средней зависимой переменной Хи является сред нее арифметическое значение зависимой величины, соответст вующее каждому значению (интервалу) независимых перемен ных.
Форма корреляционной связи — тенденция, которой следует зависимая переменная при изменении значений независимых пе ременных. Если наблюдается тенденция равномерного возраста ния или убывания значений зависимой переменной, то корреля ционная связь — линейная; при тенденции же неравномерного изменения значений зависимой переменной корреляционная связь — криволинейная. Форма корреляционной связи при оп ределенном объеме статистической информации может быть оп ределена с известной вероятностью.
Уравнение корреляционной связи (уравнение регрессии) — уравнение, по которому могут быть найдены числовые значе ния групповых средних зависимых переменных в зависимости от соответствующих значений независимых переменных. В общем случае это уравнение может быть записано в следующем виде:
X i= f(X 2, Х3, ..., |
Хт ). |
(1) |
Коэффициент корреляции (коэффициент парной |
корреля |
|
ции)— простейшая характеристика |
статистической |
связи слу |
чайных величин. Тесноту связи по данным выборки можно оце нить только по относительным величинам. По абсолютным зна чениям коррелируемых параметров эту оценку нельзя сделать не только в том случае, когда они выражены в различных еди ницах измерения, но и когда они выражены в одних и тех же
Ю
единицах измерения, так как величины отклонений зависят от значений самих параметров. Такие относительные величины мо гут быть получены в виде отношений к их среднеквадратическо му отклонению, т. е. в форме нормированных отклонений. Срав нивать нормированные отклонения возможно, так как абсолют ная величина признаков при этом не имеет значения.
Для простейшей линейной двумерной корреляционной связи коэффициент корреляции представляет собой среднее произведе ние нормированных отклонений коррелируемых параметров
где п — число составляющих пар наблюдений (пара наблюде ний — сопряженные значения параметров, для которых опреде ляется корреляционная связь).
В индексе коэффициента парной корреляции указывается сначала индекс зависимого переменного, а затем — независимо го переменного. Численные значения rJ2 и г21 одинаковы. Коэф фициент корреляции есть показатель как того, насколько связь между случайными величинами близка к строгой линейной за висимости, так и слишком большой криволинейности этой связи.
Достаточно полным показателем коэффициент корреляции является:
—для величин, для которых заранее из общих соображений можно предсказать линейную зависимость;
—для величин, собственные случайные колебания которых подчиняются нормальному закону;
—•для величин, являющихся следствием единой причины. Коэффициент корреляции всегда лежит в пределах
Значения коэффициента корреляции, меньшие 0,5, выражают недостаточную меру предполагаемой или принятой зависимости.
Если нормированные отклонения—-— — |
и — ------ -рядов равны |
°Xi |
ах~ |
между собой, то при совпадении их знаков (этот случай означа ет полную прямую связь) коэффициент корреляции получается равным единице:
При полной обратной связи коэффициент корреляции равен
— 1. Практически этих значений коэффициент корреляции нико гда не достигает, лишь приближаясь к единице при высокой ■степени тесноты корреляционных зависимостей.
И
Если случайные величины независимы, то коэффициент кор реляции равен нулю. Обратное утверждение, т. е. из равенства нулю коэффициента корреляции не следует независимость корре лируемых параметров.
Коэффициент частной (парциальной) корреляции г12,34... т является коэффициент парной корреляции, в котором исключе но влияние одной или нескольких других переменных. Коэффи циент частной корреляции позволяет выявить основные факторы, оказывающие наибольшее влияние между двумя переменными при условии, что все остальные переменные перестают быть пе ременными, так как они закрепляются на своем среднем уровне.
В индексе коэффициента частной корреляции указываются индексы коэффициента парной корреляции, а после точки — ин дексы исключаемых переменных.
Общий (совокупный) коэффициент множественной корреля ции R\,23i... т выражает меру зависимости результирующего па раметра Xi от всех составляющих параметров Х2, Х3, ..., Хт. Этим коэффициентом измеряется теснота (сила) совместного влияния всех составляющих параметров на результирующий па раметр. Численное значение общего коэффициента ' корреляции зависит от значений коэффициентов парной корреляции между Xi и Х2, Х3, ..., Хт, а также между каждой парой составляющих параметров. В индексе общего коэффициента множественной корреляции указывается сперва индекс зависимого переменного, а после точки — индекс всех составляющих параметров.
Уравнение регрессии — вид уравнения, который выбирается или которьвг характеризуется форма (модель) статистической связи результирующего параметра с составляющими парамет рами. Форма (модель) связи может быть линейной или криво линейной. Наиболее употребительными моделями связи являют ся линейные уравнения регрессии вида
|
Х 1~ Ь 0-{-Ь12Х 2 — для |
парной корреляции. (3) |
|
X 1= b 0-j-bJ2'3i'_mX 2-{-b132i'''mX 3-{-... — для |
множественной |
кор |
|
|
реляции. |
(4) |
|
Нелинейными уравнениями регрессии, как правило, являются |
|||
уравнения вида |
|
|
|
■ ^■ 1 — |
^12.34... щ Х 2 " Г ^13.24.,.т -'^ 2 _Ь ■" |
^1т.234 ...т—1 ‘ |
(® ) |
Линейные уравнения регрессии можно использовать как пер вый этап исследований нелинейных корреляций-с тем, чтобы в дальнейшем! внести в них необходимые поправки.
Параметры уравнения корреляционной зависимости (уравне ния регрессии) — свободный член и коэффициенты при состав ляющих параметрах правой части уравнений регрессии.
Коэффициенты регрессии — коэффициенты при составляю щих параметрах правой части уравнения регрессии. В индексе
12
при коэффициенте регрессии вначале указываются индексы ре зультирующего и соответствующего составляющего параметра, а после точки — все остальные составляющие параметры.
Линии регрессии — графическое изображение уравнений кор реляционной зависимости (уравнений регрессии). Они характе ризуют форму связи результирующего параметра с составляю щими и определяют характер изменения результирующего пара метра, который получается при условии, что влияние неучтенных причин закрепляется на одном и том же уровне. Сами измене ния представляются как изменения, которые происходят в сред нем.
Следовательно, линия регрессии — это математическое вы ражение зависимости между параметрами, свойственной изучае
мым наблюдениям. Практически графическое |
изображение |
|||
уравнений регрессии применяется в основном |
при |
двумерных |
||
линейных и криволинейных корреляционных связях. |
|
|
||
Система нормальных уравнений — совокупность |
уравнений, |
|||
по которым могут быть определены параметры |
уравнения |
рег |
||
рессии. Эта |
система получается из условия максимального при |
|||
ближения |
линии регрессии к ломаной линии, |
построенной |
по |
эмпирическим данным, получаемым в результате данного стати стического наблюдения. Эта задача обычно решается способом наименьших квадратов, при применении которого выдвигается требование, чтобы сумма квадратов разностей между значения ми результирующего параметра по линии регрессии и по эмпи рическим значениям была минимальной. Это требование соответ ствует свойству средней арифметической — сумма квадратов отклонений от своей средней была бы минимальной.
1.3. Масштабы выражения зависимых и независимых
переменных |
|
Применение для расчета коэффициента корреляции |
вместо |
исходных случайных значений переменных X t новых |
значений |
X ' = k X t + C , |
(6) |
где k — масштаб переменной величины Х{; С — начало отсчета этой переменной, не меняет абсолютного значения коэффициента корреляции. При k < 0 знак коэффициента корреляции получает ся обратный тому, который получается при подсчете коэффици ента корреляции по исходной статистической информации.
При подсчете параметров уравнения регрессии все перемен ные и соотношения между ними иногда выгодно выражать в стандартизованном масштабе, где за начало отсчета для каждой переменной принимается среднее значение, а за единицу масш таба —• величина среднеквадратического отклонения. В стан
13