Файл: Шепелев, И. Г. Математические методы планирования и управления в строительстве конспект лекций.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.10.2024
Просмотров: 53
Скачиваний: 0
некоторая искусственная |
переменная в первой степени, |
тогда |
__________ ___ |
t = |
(3.3.4) |
|
У ъ ( у - у )2 |
Степенная зависимость линеализируется и определяется t для параметров Iga и Ь из уравнения:
■lgy = lga + b\gx.
Логарифмы здесь заменяются некоторыми условными перемен ными
Ig у = у и lg х — x v
Аналогично в уравнениях периодического типа тригонометриче ские функции заменяются условными переменными х*
c o sk x — x*; sin k x — х*.
§ 3.4. Оценка значимости уравнения регрессии
Значимость уравнения регрессии определяется его предска зательной силой, т. е. возможностью надежно прогнозировать
средние значения зависимой переменной у по заданным значе ниям независимых переменных х1.
Уравнение г/ = f (х1), согласно которому должно проводиться прогнозирование, получено на основании статистической обработ ки частичной совокупности. Это уравнение может существенно отличаться от гипотетического уравнения, соответствующего ге неральной совокупности. Для оценки надежности уравнения регрессии применяют F-критерий Фишера, который определя ется:
|
F - |
|
(3.4.1) |
где |
— дисперсия фактических значений зависимого перемен |
||
|
ного |
|
|
|
ся |
2 ( у - у ) » |
(3.4.2) |
|
— |
г: : I |
S^CT— остаточная дисперсия уравнения.
Остаточная дисперсия характеризует степень рассеяния факти ческих значений у относительно расчетных значений у.
32
c 2 = S ( y - J f |
( 3 .4 .3 ) |
|
ост |
N — и — 1 |
' |
Знаменатели выражений (3.4.2) и (3.4.3) называются числом степеней свободы Д = N — п — 1 и f2 = N — 1, здесь п — число коэффициентов регрессии. Полагают, что F, соответствующий ге неральной совокупности, зависит только от числа степеней сво боды fj и f2 и имеет распределение Сиедекора |[6 ], его плотность вероятности
„ |
Г [(fi + fa)/2] Г (f1/fa)t,/2 F(f,/2bl [1 - ( Ь т ) Г <f,+w |
/0 „ Л. |
P(f,/{2) = |
------------------------------------------------------------ , |
(3.4.4) |
l ,/ s, |
Г (П/2) Г (fo/2) |
v |
где Г(Ж) — гамма-функция.
Интеграл этого распределения приведен в приложении IV. По этой таблице, зная значение числа степеней свободы fi и f2, с заданной доверительной вероятностью 5% или 1%, можно оп ределить FTa6 n- Если F ^ FTa6 n, то уравнение считается значи мым, т. е. предсказательная сила уравнения регрессии больше,
чем предсказательная сила среднего значения у. Если F < FTa6 n, то гипотеза о значимости уравнения не подтверждается, но это не значит, что подтверждается гипотеза о незначимости урав нения.
Пользуясь критерием Фишера, проверим на значимость урав нение регрессии
|
у = 0,615 + |
0,0035, |
|
|
|
где у — себестоимость |
строительства, |
в млн. |
руб. затрат |
на |
|
1 млн. руб. сметной стоимости строительно-монтажных |
|||||
работ; |
|
млн. руб. сметной стоимости. |
|||
х — численность рабочих на 1 |
|||||
Дисперсия зависимой |
переменной |
= |
0,0128; |
остаточная |
дис |
персия уравнения |
= 0,0904. Критерий Фишера составит: |
||||
|
0,0128 |
0,142. |
|
|
|
|
0,0904 |
|
|
||
|
|
|
|
|
Число наблюдений, согласно которому установлено уравнение, N = 43, число степеней свободы Е = 43—2—1 = 40, f2 = 43— 1=42. Табличное значение критерия Фишера при этом FTa6 n =
— 1,67, что больше, чем расчетное значение F = 0,142. Это зна чит, что нулевая гипотеза не отвергнута и уравнение регрессии ненадежно.
Но это не означает, что не нулевая гипотеза отвергнута, т. е. уравнение может быть значимым или незначимым.
2 И. Ш епелев |
33 |
§3. 5. Доверительные интервалы „н уравнению регрессии
Уравнение регрессии из-за вероятностного характера имеет некоторую случайную компоненту I, на величину которой рас четные значения зависимой переменной могут отличаться от ее истинных значений.
Укп = У ±1 - |
(3.5.1) |
Величина I отражает влияние неучтенных факторов и несоот ветствие частичной совокупности, по которой определялось
уравнение у = f (х) генеральной совокупности. Для надежного
Рис. 7. Гистограмма и закон распределения остаточной величины модели
прогнозирования необходимо определить максимально возмож
ное шах ( у ± 1 ) и минимально возможное min (у ± /) — значе ния зависимой случайной величины с заданной вероятностью. Эти значения являются границами доверительного интервала к уравнению (3.5.1).
Если сделать допущение, что частичная выборка, на основа нии которой получено уравнение у — f (xi) репрезентативна,
а величина / — (у — у) распределена нормально, (последнее допушениие на практике оправдывается чаще всего), то истинное
34
значение зависимой случайной величины лежит в пределах
У t Уист ^ у “I- t $1, (3.5.2)
здесь a, = K s 2cT-
Остаточная дисперсия S^CT определяется по формуле (3.4.3) и соответствует только частичной совокупности, t ;— аргумент, ха рактеризующий вероятность попадания случайной величины в пределы (3.5.2).
Гипотеза о нормальном распределении остаточной величины основывается на теореме Ляпунова о том, что случайная вели-. чина, являющаяся суммой других случайных величин, распре делена нормально. На величину I влияет очень много факторов и есть основания ожидать, что она будет распределена нор мально. Как показывают исследования, при достаточно боль ших выборках эта гипотеза подтверждается. На рис. 7 показана
гистограмма и закон |
распределения |
остаточной величины мо |
|
дели |
|
|
|
у = |
11,998+41,96 |
cos л: — 27,395 |
sin л: — 7,88 cos 2л:-— |
2,892 |
sin 2х — 21,102 |
cos Зл: + 8,251 |
sin Зл: + 29,39 cos 4л: + |
|
+ |
12,131 sin 4л:, |
(3.5.3) |
где у — отклонения фактических поставок цемента от плановых по тресту «Челябметаллургстрой».
Проверка гипотезы о нормальном распределении величины
(У — У) по критерию Пирсона показала хорошую сходимость статистического и теоретического законов распределения. Как
правило, математическое ожидание величины (у — у) |
близко к |
нулю. |
|
Вероятность попадания yaCi в пределы |
|
р {у — t ^ < y 0CT < y + t^ l =<z |
(3.5.4) |
обычно принимается равной 0,95 или 0,99.
Конкретная величина а зависит от цели и важности прогно за. Этой же вероятностью в некоторой степени учитывается ре презентативность выборки; там где выборка более репрезента тивна можно принимать меньшую доверительную вероятность и наоборот.
2 *
Г Л А В А I V
МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
§ 4.1. Факторы
Факторы — это технические, технологические, природные, климатические, организационные, социально-демографические и другие показатели, оказывающие количественное влияние на какой-либо результирующий экономический показатель: произ
водительность |
труда (выработку), себестоимость, прибыль |
и т. д. Задача |
математического моделирования состоит в выяв |
лении количественной связи между факторами и результирую щим экономическим показателем.
Фактор, включаемый в модель, должен соответствовать сле дующим требованиям: 1 ) иметь количественное выражение; 2 ) между фактором и регулирующим показателем должна быть логическая, причинная связь; 3) между фактором и результи рующим показателем должна быть статистическая связь; 4)факторы не должны быть тесно связаны между собой, то есть между факторами не должно быть мулътиколлинеарности
Не многие авторы считают, что все показатели,, включаемые в
корреляционный анализ, должны иметь нормальное распреде ление. Однако практика корреляционного анализа показывает следующее: а) в основном экономические показатели не подчи няются нормальному закону распределения; б) корреляцион ные модели, включающие в себя такие факторы, имеют непло хие оценки качества и достаточно высокую предсказательную силу. Поэтому, видимо, нет необходимости считать факторами только те показатели, которые распределяются нормально.
В главе II рассматривались парные связи между результи рующим показателем и факторами. В экономике и природе на результирующий показатель всегда влияет не один, а несколь ко взаимосвязанных факторов. Поэтому и в моделях, если эти модели претендуют на адекватность, необходимо учитывать со вокупное влияние нескольких факторов. Это совокупное влия ние факторов определяется методами множественной корреля ции.
3G
Вернемся к требованиям, предъявляемым к факторам, сфор мулированным в начале параграфа. Первое требование: если какой-то показатель невозможно выразить в виде количества или хотя бы величины V, то, естественно, такой фактор не может быть включен в математическую модель, несмотря на качест венную связь его с результирующим показателем.
Особое значение для правильного проведения корреляцион ного анализа имеет изучение логических, причинных связей между факторами и результирующим показателем, В экономи ческих исследованиях приходится оперировать небольшими не случайными совокупностями (выборками), часто может ока заться, что в данный выборке какой-нибудь фактор, на самом деле не влияющей на результирующий показатель, может вы ражать влияние других факторов и показать статистическую связь с результирующим показателем. Более того, может быть, что этот фактор в действительности влияет в противополож ную сторону статистическому влиянию, показанному в выборке.
Но может оказаться, что, несмотря на логическую обосно ванность связи, в выборке не будет статистической связи меж ду показателем (кандидатом в факторы), и результирующим показателем. В этом случае такой показатель также нельзя включать в модель в качестве фактора, так как количественная оценка связи не может быть выполнена методами корреляции, если статистической связи нет.
Таким образом, для того, чтобы показатель мог рассматри ваться в качестве фактора, необходима его логическая и стати стическая связь с результирующим показателем.
Требование отсутствия мультиколлинеарности вызвано тем, что если между двумя факторами, отвечающими трем первым требованиям, имеется тесная связь, то нет нужды оба фактора включать в модель, так как один можно выразить через другой. Кроме того, при неосмотрительном включении взаимосвязан ных факторов в одну многофакторную модель возникают вычис лительные трудности, связанные с тем, что матрица нормаль ных уравнений становится неразрешимой.
Остается ответить на вопрос, каковая допустимая теснота связи между факторами, включаемыми в одну экономическую модель?
Ответить на это непросто. Теоретически факторы должны
') Показатель имеет количественное выражение, если его можно измерить, т. е. однозначно выразить с помощью числа. Показатель имеет характер ве личины, если его измерить нельзя, но можно оценить и однозначно расставить по порядку, по степени влияния, по сравнению с другими аналогичными пока зателями.
37
быть полностью независимы, практически таких факторов в эко номике нет. На основании опыта корреляционных исследова ний можно рекомендовать включать в многофакторные модели те факторы, коэффициент корреляции между которыми не ока зался значимым при вероятности 0,9, т. е. подтвердилась нульпипотеза.
Например, в практике статистического анализа встретился
такой |
случай. Исследовалось влияние на себестоимость |
строи |
|||
тельно-монтажных работ, |
выполняемых собственными |
силами |
|||
(х5), |
механовооруженности |
труда |
рабочих |
(х6), фондоотдачи |
|
(х3), |
среднего расстояния |
от строительной |
организации |
до объ |
|
ектов |
(xi), численности рабочих |
(х2) и количества объектов |
(х^). Все факторы отвечали требованиям. Однако три фактора: механовооруженность труда, фондоотдача и объем строительно монтажных работ оказались тесно связанными между собой. Коэффициенты корреляции, выражающие тесноту связи между факторами, составили:
Гз.б = —0,79; Г3.5 = 0,68.
Таким образом, фондоотдача оказалась тесно связанной с механовооруженностью и объемом строительно-монтажных ра бот, выполняемых собственными силами. Проверка этих связей на нульгипотезу показывает, что нулевая гипотеза (см. § 3.2) отвергается при уровне значимости 0,9. Напомним, что нулевая гипотеза подтверждается, если
г!<-
|
/ N - 1 |
|
|
Для Р = 0,9 tp = 2,576, |
при числе наблюдений |
N = 43 ну |
|
левая гипотеза не отвергается, |
если коэффициент |
корреляции |
|
fp |
2,576 |
|
|
будет меньше значения — |
— 1 |
= —--..— = 0,396. |
|
/ N |
/ 4 3 - 1 |
|
В нашем случае коэффициенты корреляции по модулю боль ше, чем 0,396 и поэтому нулевая гипотеза отвергается, связь между факторами надежна и вместо трех факторов в корреля ционную модель достаточно включить один.
Часто возникает вопрос, какой из двух тесно связанных между собой факторов надо включить в модель? В рассмотрен ном примере такой вопрос не возник, так как фондоотдача ока залась тесно связанной с двумя факторами; бесспорно выгод нее выразить через один фактор два других, поэтому в модель вошла фондоотдача. Но в случае, когда два фактора оказыва ются тесно связанными между собой, в модели надо оставлять
38