Файл: Золотарь, И. А. Экономико-математические методы в дорожном строительстве.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.10.2024

Просмотров: 137

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г л ав а

IV

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ПРИМЕНИТЕЛЬНО К ЭКОНОМИЧЕСКОМУ АНАЛИЗУ ДОРОЖНОГО СТРОИТЕЛЬСТВА

§ 8. Элементы статистической проверки гипотез

Для количественного анализа вероятностных процессов необ­ ходимо знать закон распределения случайной величины и ряд чис­ ловых характеристик, причем обязательно математическое ожида­ ние t и дисперсию ю2. Наиболее сложным является установление закона распределения случайной величины. Эта задача решается обычно методами математической статистики. Так как количество эмпирических данных (объектов) обычно бывает ограниченным (ограниченная выборка), то используются специальные приемы для того, чтобы по свойствам выборки судить о неизвестных свой­ ствах остальных объектов и в целом о так называемой генераль­ ной совокупности объектов. Статистическая проверка гипотез име­ ет целью на основе анализа данных по выборке дать суждение о законе распределения генеральной совокупности. Вначале прини­ мается так называемая основная или нулевая статистическая гипо­ теза в отношении неизвестного закона распределения случайной величины (допустим, принимается, что этот закон нормальный, пуассоновский и т. п.). Затем с помощью специальных статистиче­ ских критериев устанавливается, соответствуют ли данные выбор­ ки принятой гипотезе или нет. В зависимости от ответа на этот во­ прос гипотеза принимается или отвергается.

Рассмотрим методику такого анализа на двух примерах.

П р и м е р 1. Требуется установить на основе приведенных ранее (см. стр. 38) даннных изучения движения, подчиняется ли количество автомобилей, проходя­ щих через определенное сечение дороги в единицу времени, закону Пуассона.

В табл. 7 представлены данные наблюдений за числом автомобилей, прохо­ дящих по автомобильной дороге в одном направлении за одноминутный интер­

вал времени, причем такие наблюдения были повторены 100 раз.

Из табл. 7

следует, что прохождение пяти автомобилей в течение минутного

интервала

встретилось 7 раз, семи автомобилей — 2 раза и т. д.

 

 

Так как число наблюдений составило 100, то величины fn выражают факти­

чески установленные вероятности прохождения п автомобилей

за 1

мин, выра­

женные в процентах.

 

 

Например, р4=

12 = 0,12.

 

 

Среднее число

наступления событий a=%t вычисляется по

уже

известной

формуле (III.11):

к

 

 

 

 

 

а = У mpi, i=1

где к может быть и бесконечным.

53


В нашем примере получим

а = О- Т_

23

+ 3- _20

+ 4- _12_

 

100 + ь

100

 

100

100 +

 

+ 5-

 

2

0

= 2,50.

 

 

100 + 8

* 100 +

 

В табл. 7 приведены теоретические частоты f T по закону Пуассона,

вычислен­

ные с помощью формулы (III.24) для

а=2,50.

Как видно из таблицы,

величины

fa и / т достаточно близки. Однако необходима более детальная проверка прием­ лемости гипотезы о применении к наблюденному статистическому распределению закона Пуассона.

Как уже отмечалось, дисперсия случайной величины, распределенной по за­ кону Пуассона, равна ее математическому ожиданию.

Вычислим на основе экспериментальных данных табл. 7 математическое ожи­ дание яп и дисперсию сгп2.

В качестве математического ожидания следует взять среднее арифметическое из наблюдавшихся в одноминутных интервалах количеств автомобилей:

т

2 п‘

г=1

В нашем примере т = 100; фактически величина па уже была определена,

т. е. яп=а=2,50.

Определим теперь эмпирическую дисперсию огп2 с помощью формулы (III.12)

°п= 2 («гп—«п)2Ры- /-I

Подставляя данные из табл. 7

в эту формулу,

получим

 

-

(0 — 2,5)2 • 7 +

(1 — 2,5)2 • 23 +

(2 — 2,5)2 • 26 + (3 — 2,5)2 ■20

q 2 =

-------------------------------— —

-------------------------------------------------------------------------------------------------------------------------------------------------------

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

(4 — 2,5)2-12 + ( 5

— 2 ,5 )2 -7 +

( 6 — 2,5)2-3 +

(7 — 2,5)2-2

= 2,58.

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, величины пш и а2

достаточно близки, и гипотеза о примени­

мости к

наблюденному

распределению

закона Пуассона правдоподобна. Далее

необходимо

вычислить

«критерий

%2»

Пирсона,

характеризующий

отклонения

 

 

 

 

 

 

 

 

 

Т а б л и ц а 7

Число

Наблюденная

Частота по

 

Число

Наблюденная

Частота по

автомобилей

час тота

 

закону Пуассо­

автомобилей

частота

закону Пуас-

за одноминут­

f a

 

на jfт

 

за одноминут­

f a

сона / т

ный интервал

 

 

ный интервал

0

 

7

 

8,2

 

5

 

7

6,6

1

 

23

 

20,5

 

6

 

3

2,7

2

 

26

 

25.6

 

7

 

2

0,9

3

 

20

 

21,3

 

8

 

0

0,3

4

 

12

 

13,3

 

9

 

0

0,0

54


между наблюденными и теоретическими частотами появления событий («мера расхождения»):

( / п

- / т ) 2

Х2 =

( I V . 1)

1=1

/ т

 

где к — число разрядов (интервалов), на которые разбиты наблюдения. Используя данные табл. 7, получим

 

 

(7 — 8,2)2

 

(23 — 20,5)2

 

(26 — 25,6)2

 

(20 — 21,3)2

 

1

~

8 ,2

+

20,5

+

25,6

+

21,3

~

.

(1 2 - 1 3 ,3 )2

 

_ ( 7 - 6 ,6 ) 2

 

( 3 - 2 ,7 ) 2

 

(2 — 0,9)2

 

 

 

13,3

 

6,6

 

2,7

 

0,9

 

(0-0,3)2

2,40.

+0,3

Распределение величины х2 зависит от параметра v, называемого числом сте­ пеней свободы. Число степеней свободы равно числу разрядов к минус число условий («связей»), наложенных на наблюденные и теоретические вероятности. Примерами таких условий являются:

к

1)

 

2 Pin =

1 (сумма наблюденных по

всем

разрядам вероятно-

 

 

/=1

стей равна единице); это условие принимается во

 

к

 

всех случаях;

 

 

 

 

 

 

 

 

 

 

2)

2

Л/пЛ'п— п т (равенство

теоретического и

экспериментального

 

1=

1

средних значений);

 

 

 

 

к

 

 

 

 

 

 

3)

2 (я/п — лп)2р/п =

°т (совпадение дисперсий,

вычисленных по

экспери-

 

i= i

 

ментальным

данным и

принятой гипотезе

закона

 

 

 

распределения).

 

 

 

Таким образом, если теоретическое распределение совершенно независимо от данных практических наблюдений, то v=re— 1. Если же для оценки h параметров

теоретического

распределения использовались

данные

эксперимента, то

v =

= к 1—h.

 

 

 

 

 

В нашем примере число разрядов к=10. Принимая дополнительные условия

(«связи») 1 и

2 (условие 2 было

реализовано

при вычислении величин fT в

табл. 7), получим v = 1 0 —2=8. В

приложении 4

найдем

вероятность того,

что

экспериментальное распределение не противоречит пуассоновскому. При х2=

=2,40 и v = 8 получим р = 0,96.

Таким образом, проведенный анализ в принципе подтверждает соответствие экспериментальных данных табл. 7 пуассоновскому распределению.

Важной характеристикой пуассоновского потока является закон распределе­ ния вероятностей интервалов времени 0 между смежными событиями, выражаю­

щийся зависимостью

 

/ > ( 0 > 0 ) = е - хе,

( I V. 2)

т. е. вероятность того, что два последовательных события разделены интервалом времени большим, чем 0, дается экспоненциальной функцией с показателем сте­

пени Х0. Такое

распределение

называется экспоненциальным. Из

формулы

(II 1.23) найдем

вероятность того, что в интервале времени 0 не произойдет ни­

какого события

(л = 0):

 

 

 

 

(л6)0е~хб

1 • е ~ Х9

(IV .3)

 

Ро (е) =

0!

= е -хе

 

1

 

Правые части формул (IV.2)

и (IV.3)

равны. Следовательно,

 

 

р (0 > 0 )= р о (0)-

(IV .4)

55


Т а б л и ц а 8

0, с

хе

р(е>6.

0, с

X0 р (0 > 0 )

0, с

хе

р (0 > 0 )

0, с

Х0

р (0>0)

0

0

1

12

0,500

0,606

40

1,668

0,187

100

4,170

0,015

2

0,0834

0,920

14

0,584

0,558

50

2,085

0,124

п о

4,587

0,010

4

0,167

0,846

16

0,668

0,513

60

2,502

0,0082

120

5,004

0,007

6

0,250

0,779

20

0,834

0,434

70

2,919

0,054

130

5,421

0,004

8

0,334

0,716

24

1,001

0,368

80

3,336

0,036

140

5,838

0,003

10

0,417

0,659

30

1,251

0,286

90

3,753

0,023

150

6,255

0,002

т. е. вероятность того, что интервал по времени между двумя смежными собы­ тиями будет больше 0, равна вероятности того, что за время 0 не произойдет ни­ какого события.

Таким образом, если вероятность числа п событий в заданном интервале вре­ мени следует закону Пуассона с параметром X, то интервалы между событиями

следуют экспоненциальному закону с тем ж е параметром К.

 

 

 

 

 

 

 

В табл. 8 приведены данные распределения вероятностей

интервалов

вре­

мени 0 между смежными событиями при

Х=2,5 за 1 мин, или, что то же

самое,

Л = 0,0417 за

1 с. Средний

интервал

времени между

автомобилями

равен

Т ’

Т- е- В Нашем СЛУЧае

2^5 =

0Д1417 =

24 С

 

Из таблицы видно, что ве­

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

роятность

интервала,

который

 

 

 

 

 

 

 

 

 

больше 24 с, составляет 0,368.

 

 

 

 

 

 

 

 

 

Из этого следует, что, заменяя

 

 

 

 

 

 

 

 

 

пуассоновский

поток

автомоби­

 

 

 

 

 

 

 

 

 

лей

потоком

с

одинаковыми

 

 

 

 

 

 

 

 

 

средними

интервалами,

можно

 

 

 

 

 

 

 

 

 

допустить значительные погреш­

 

 

 

 

 

 

 

 

 

ности в расчете потерь времени

 

 

 

 

 

 

 

 

 

перед светофорами, на переез­

 

 

 

 

 

 

 

 

 

дах через железные дороги в

 

 

 

 

 

 

 

 

 

одном уровне, а также в ряде

 

 

 

 

 

 

 

 

 

других случаев.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

П р и м е р

2*.

Установить

 

 

 

 

 

 

 

 

 

правомерность

применения

бе­

 

 

 

 

 

 

 

 

 

та-распределения

к

описанию

 

 

 

 

 

 

 

 

 

производительности

бульдозе­

 

 

 

 

 

 

 

 

 

ров

на

основе

статистических

Рис.

16.

Гистограмма

производительности

данных, собранных на объектах

треста

«Севзапдорстрой»

и

бульдозеров.

В

столбиках показано число

Управления

строительства

до­

 

 

соответствующих случаев

 

роги Москва — Рига, за период

 

 

 

 

 

 

 

 

 

1967— 1971

 

гг.

Как

показали

наблюдения,

значения производительности

бульдозеров

находились

в

пределах

от 30 до

150%,

причем за 100% принята директивная норма

выработки.

 

 

Приведенный диапазон изменения производительности разбит на участки по

10% и по экспериментальным данным построена гистограмма рис. 16.

 

 

 

Соответствующие частоты определялись из соотношения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л/

 

 

 

 

 

 

 

 

 

 

где N — объем

выборки, в данном случае

222

экспериментальных

наблюдения;

и, — число наблюдений, попавших в i-й интервал.

 

 

 

 

 

 

 

 

* Пример излагается по материалам канд. техн. наук Ю. А. Мальцева.

56


Эмпирическое среднее I вычислялось по формуле (III.11) и составило при­ мерно 100%.

Дисперсия эмпирического распределения о2, определенная по формуле

(III.12), оказалась равной 666%2, что дает

а = У'а2 =

У 666 = 26%. Выражая

t и о2 в долях единицы, имеем гэП, 0 = 0,26.

 

 

Определим теперь с помощью формул

(III.33) и

(III.34) параметры формы

г| и у. Как отмечалось ранее, эти формулы справедливы в случае, когда весь

диапазон_изменения случайной величины принят за

единицу.

Поэтому

величины

£ = 1,0 и 0 = 0,26 должны

быть пересчитаны с учетом этого

обстоятельства.

 

 

Легко уяснить, что для эмпирического среднего мы получим

 

 

 

_ 7

0

 

 

_

0,26 -0,58 =

0,151

_ 0

0,1512 = 0,0228.

 

t0 =

120 1 ’0 =

0>58Тогда и о° =

и oq=

 

 

Аналогично

шаг гистрограммы равен

теперь не 0,1,

а

0,1

100

=0,0834.

 

 

 

 

 

Вычислим т) =

1 — 0,58

 

 

 

 

4,06.

 

 

 

 

 

-------—— [0,58 (1 — 0,58) — 0,0228] =

 

 

 

 

 

 

 

0,0228

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,58-4,06

5,61.

 

 

 

 

 

 

 

 

 

 

 

 

1 — 0,58

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рис.

Форма кривой

распределения

с параметрами ti= 4

и

у = 5,6

показана

на

16.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценим теперь с помощью критерия %2 Пирсона степень соответствия эмпи­

рического и теоретического распределений. В

табл.

9

приведены

необходимые

для этого значения экспериментальных fn

и теоретических f T частот, разности

и

квадрата разности их.

 

 

 

 

 

 

 

Т а б л и ц а 9

 

 

 

 

 

 

 

 

 

 

 

Интервалы единичного

 

fn

 

/ т

 

 

 

 

( / т- / п) 2

 

диапазона

 

 

 

 

 

 

 

 

0—0,834

0,027

0

 

 

0,027

0,0073

 

 

0,834—0,1668

0,009

0

 

 

0,009

0,0001

 

 

0,1668—0,2502

0,027

0,00253

 

0,024

0,0006

 

 

0,2502—0,3336

0

104

0,059

 

0,045

0,0020

 

 

0,3336—0,4170

0,162

0,0845

 

0,078,

0,0060

 

 

0,4170—0,5004

0,117

0,144

 

0,027

0,0007

 

 

0,5004—0,5834

0,099

0,183

 

0,084

0,0071

 

 

0,5834—0,6668

0,131

0,215

 

0,074

0,0055

 

 

0,6668—0,7502

0,117

0,157

 

0,040

0,0016

 

 

0,7502—0,8334

0,113

0,098

 

0,015

0,0002

 

 

0,8334—0,9168

0,063

0,040

 

0,023

 

0,0005

 

 

0,9168— 1,0000

0,031

0,0165

 

0,014

 

0,0002

 

 

Как уже отмечалось,

%2=f(p,

v), причем

число

степеней

свободы

v=/c—s,

где, в свою очередь, к — число разделов, в которые были сгруппированы наблю­

дения (как ясно из рис. 16,

к = 12), и s — число наложенных связей

или условий.

При обработке экспериментальных данных были использованы

три условия:

 

 

К

 

равенство суммы всех частот единице, т. е. 2

р < = 1 »0;

 

равенство экспериментального

1=1

 

среднего

математическому ожиданию, т. е.

г—- _

—2

2

 

 

t n—t T; равенство дисперсий

°п ~

°г

 

 

Следовательно, v = 1 2 —3=9.

Расчеты по формуле (IV. 1) дали х2=0,559.

57