Файл: Шепелев, И. Г. Математические методы планирования и управления в строительстве конспект лекций.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.10.2024

Просмотров: 51

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г Л А В А I I I

МЕТОДЫ ОЦЕНКИ

§ 3.1. Генеральная и выборочная совокупности

Группа предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количест­ венного характера, называется статистической совокупностью. Например, отчетные данные о выработке на одного трудящего­ ся, о себестоимости, уровне механизации и т. д.

Генеральная совокупность — это такая случайная совокуп­ ность, когда можно предположить, что группа объединяет очень большое, неограниченное число наблюдений. Применительно к экономическим явлениям генеральная совокупность обозначает наблюдения по всем возможным предприятиям с родственной технологией за длительный период времени, в том числе и не­ который период времени в будущем.

Исследование всей генеральной совокупности невозможно, поэтому для суждения о генеральной совокупности пользуются выборкой или выборочной совокупностью. Выборочной совокуп­ ностью называется часть случайных величин генеральной сово­ купности, отобранных из последней для получения сведения о ней.

Чтобы правильно судить о всей совокупности, необходимо иметь представительную выборочную совокупность. Представи­ тельная выборка называется репрезентативной. Например, если при исследовании выработки взять только передовые предприя­ тия, то результаты исследования не будут характерны для всех предприятий и по средним значениям, полученным из такой вы­ борки, невозможно судить о всех предприятиях.

Вцелях исключения ошибок и предвзятости при отборе об­ разцов обычно пользуются случайным методом отбора из гене­ ральной совокупности.

Вэкономике наиболее представительной является такая вы­

борка, когда исследователь берет все возможные в сопоста­ вимых условиях наблюдения. Главной задачей оценки является установление того, соответствуют ли какие-то характеристики случайной величины или взаимосвязи случайных величин, полу-

ченные по выборке, истинным характеристикам и взаимосвязям, которые могли быть получены при изучении генеральной сово­ купности.

В практике часто приходится решать задачу: достаточно ли число наблюдений в выборке для того, чтобы судить по ней о генеральной совокупности.

Если обозначить:

N — число наблюдений в выборке,

S — среднеквадратичное или стандартное отклонение, полу­ ченное по результатам выборки,

а — вероятность приближенного равенства о0 ~ S, где Оо — стандарт генеральной совокупности,

е — точность наблюдений,

k = N — 1— число степеней свободы,

qs — аргумент функции распределения вероятности. Аргумент qs определяется из выражения е = qs • S. Из функции L (qs&) = а вероятность а зависит только от q и k. Можно с за­ данной вероятностью а построить доверительный интервал, в котором будет находиться стандартное отклонение а. Этот ин­ тервал можно записать в виде следующего соотношения:

 

 

 

Р =

( S - q sS < 3o< S + qs S}=«.

 

(3.1.1)

 

 

 

L(qs6)

 

 

 

 

 

Пример определения достаточного числа наблюдений. Опре­

делить

Идост при

заданной

вероятности а =

0,95,

S = 0,12,

е =

0,06.

Определяем qs —

 

= 0,5. По таблице функ­

ции

L(qs&),

(приложение

1)

находим k = 14,

следовательно

'N =

k +

1 =

15.

 

 

 

 

 

Такой метод оценки репрезентативности выборки пригоден

для

любого

N. Если N >

20,

то можно пользоваться

упрощен­

ным методом, основанным на гипотезе нормального распределе­ ния случайной величины. При этом

 

N >

t‘2 S2

(3.1.2)

 

- ^ ,

 

 

£2 X2

 

где ta — аргумент,

характеризующий вероятность нормального

распределения в

интегральной

функции

распределения Ф (t);

ta определяется по таблицам

функции

Ф (t) (приложение II)

взависимости от заданной вероятности а.

х— среднее значение случайной величины в выборке. Если выполняется соотношение (3.1.2), то число наблюдений доста­ точно.

28


§ 3. 2. Оценка представительности коэффициента корреляции

Коэффициент корреляции г, рассчитанный по выборочным данным, может не совпасть с истинным коэффициентом корре­ ляции р, соответствующим генеральной совокупности.

Ошибка выборочного коэффициента корреляции определя­ ется по формуле

<3 -2 Л )

У N - 1.

Так как истинный коэффициент корреляции р неизвестен, то ошибку приближенно можно определить по формуле:

■ ■ г-

.

(3.2.2)

] / n -

1

 

Полагая коэффициент корреляции распределенным нормально,

можно утверждать, что

 

 

 

Р {г — К ar < р < г + t, зг) = 2 Ф (t),

(3.2.3)

при Р =

0,9

t =

1,643,

 

Р =

0,95

t =

1,96,

 

Р =

0,99

t =

2,576.

 

Особенно интересна проверка так называемой нулевой гипо­ тезы. Известно (см. § 2.2), что если коэффициент корреляции по модулю больше нуля, то между двумя случайными величинами имеется связь. Однако г, определенный по частичной выборке, отличается от истинного коэффициента корреляции р. Может быть, что при | г j > 0 , р — 0 тогда связь, установленная по час-, тичной выборке, в генеральной совокупности отсутствует. Для ответа на вопрос: есть ли связь в генеральной совокупности, за­ даются гипотезой, что такой связи нет и проверяют эту гипотезу.

Будем считать, что р = 0, тогда

ор = —===г.

 

 

 

I / n -

г .

 

Р jг -

~ 7 = = r < Р <

г + ,

) = а.

(3.2.4)

I

>AN - 1

J/N —1 J

 

При проверке нулевой гипотезы интересен только нижний пре­ дел

г -------^ == < р;

(3.2.5)

/ N - 1

 

29



так как р =

0, можно записать г — ■—■ - - -< 0. Отсюда, если

t„

/N —Г

то нулевая гипотеза подтверждается и с вероятно-

г - < —.........,

/N - 1

 

стью а можно утверждать, что между двумя величинами может

ta

.

не быть связи в генеральной совокупности. Если г > —

y"N —1

 

то с этой же вероятностью можно утверждать, что такая связь

есть.

,,

Для примера проверим нулевую гипотезу для коэффициента

корреляции между выработкой и коэффициентом текучести (см. § 2.4) при аппроксимации связи прямой линией. Коэффициент корреляции г = 0,197, значение аргумента t функции Ф (t) при­ ложения II при 95-процентном доверительном интервале равно

1,96 при N = 17.

t

_

1,96

_ 1,96 = 0,49 > 0,197.

] / N -

1

1/17 -1

4,0

Так как 0,49 больше коэффициента корреляции г = 0,197, с на­ дежностью 95% надо считать, что нулевая гипотеза подтверди­ лась и коэффициент корреляции р в генеральной совокупности может быть равен нулю.

§ 3.3. Оценка коэффициента регрессии

При аппроксимации корреляционной зависимости получен­ ная линия регрессии отвечает только частичной выборке, т.' е. тем данным, которые были использованы при статистической обработке. Для распространения этой зависимости на генераль­ ную совокупность необходимо оценить значение коэффициента регрессии, ибо может оказаться, что при условии неравенства коэффициента регрессии нулю at ф 0 истинный коэффициент регрессии, отражающий генеральную совокупность, й\ = 0. В этом случае прогнозировать по полученной кривой нельзя. Зна­ чимость отдельных коэффициентов определяют при помощи t-критерия Стьюдента.

Для оценки значимости коэффициентов регрессии t-критерий Стьюдента определяется по формулам:

t„ =

( З А 1,

/

2 (у _ Уу

30


и

tla,

ai.---

( 3 .3 .2 )

 

s l 7^

 

где а,\— коэффициент регрессии при i-ом независимом перемен­

ном, Р — число коэффициентов регрессии,

S — остаточная дисперсия,

Си — диагональный элемент обратной матрицы нормальных уравнений (см. § 4.4). Формула (3.3.1) применяется при одном переменном, формула (3.3.2) применяется при множественной

корреляции

и матричном решении ортогональных

уравнений.

ta сравнивается с йгабл,

которое определяется по таблицам рас­

пределения

Стьюдента

(см. приложение III). Если

tTa6jI <-te

то нулевая гипотеза не отвергается, т. е. можно предполагать, что коэффициент регрессии может быть незначимым, если ta >

> t ia6jl, то нулевая гипотеза отвергается, а это значит, что коэф­ фициент регрессии значим, т. е. имеет значение и в генеральной совокупности.

Оценка по t-критерию Стьюдента основана на предположе­ нии, что t-критерий распределен согласно t-распределения Стью­ дента. Величина t зависит от числа степеней свободы f = N — Р и доверительной вероятности. Для этой вероятности можно по­ строить доверительный интервал

Р (а, — tTS6[ < а, < а, + tTSa[) = 1 — q,

(3.3.3

здесь q — вероятность непопадания щ в интервал (3.3.3). Взяв нижний предел доверительного интервала и приняв гипотезу

a"i = 0, получаем <2, — tTSa < 0 ,

отсюда- ^ - < t Tпри условии под-

1

s °i

тверждения гипотезы cti = 0, так как = -^-, в этом случае t^-ta!

Оценка коэффициентов регрессии при помощи t-критерия Стьюдента применяется только для линейных связей. Но так как при помощи метода наименьших квадратов путем спрямления или замены нелинейного значения независимого переменного определяются только линейные коэффициенты регрессии прак­ тически для любого вида функций, то t-критерий может приме­ няться также для любого вида функций в линеализированном

виде. Например, в параболе вида у = а + Ьх + сх2 для оценки коэффициента регрессии необходимо заменить х2 — и, где и —

31