Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 606

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

74

Глава

2

 

вести к серьезным ошибкам. Так, для равенства двух

выражений

 

( 2 * і ) 2

«

 

 

і = і

г= і

 

при

= 9000, х2 = 9001 и х 3 =

9003 вычисления с

точностью

до единицы в восьмиразрядном десятичном числе дают для левой

части значение 0, а использование

двоичной системы

счисления

с 27 разрядами (что эквивалентно

8 десятичным

разрядам) дает

значение 4,0. С другой стороны, для правой части

этого

равенства

любой способ вычисления дает значение 4,6666667, верное для восьми десятичных знаков.

Пример 2.4.1. Сравнение выборочных статистик

сих математическими ожиданиями

Втабл. П.2.4.1 дана плотность биномиального распределения вероятности для эксперимента с бросанием монеты. Предположим, что монета подбрасывается 5 раз; пусть X обозначает число выпа­ дений орла при 5 бросаниях. Считается, что вероятность выпаде­

ния орла при каждом подбрасывании равна Ѳ = Ѵ2 . Во второй строке табл. П.2.4.1 приведены вероятности выпадения соответ­ ственно 0, 1, 2, 3, 4 или 5 орлов для 5 бросаний. Д л я такого спе-

 

 

 

 

 

 

Таблица

П.2.4.1

Значения случайной величины X

0

1

2

3

4

5

Сумма

Теоретическое распределение

 

 

 

 

 

 

 

вероятности

 

 

 

 

 

 

 

 

 

 

1

5

10

10

5

1

1

 

 

32

' 32

32 .

32

32

32

 

 

 

Экспериментальные

данные

 

 

 

 

 

 

 

(30 испытаний) щ

 

1

6

10

7

5

1

30

циального типа эксперимента выборочное среднее значение и дис­ персию можно сравнить со средним значением и дисперсией по ансамблю. В третьей строке таблицы записаны экспериментальные данные, представляющие суммарные результаты нескольких экспе­ риментов при 5 бросаниях в каждом, выполненных разными экспериментаторами с одной и той же монетой.


Распределения вероятности и выборочная статистика 75

 

Вычисления

дают

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рх=2іР(хі) ^ • = = 0

,

5 1 + 1 , à

+

2 ,

a I + 3

- ^

+ 4

,

à

+

5 - 4 = = 2 ' 5 '

 

^ = . т Е 7 г

^ =

і ( 0

- 1

+ 1

- 6 + 2 - 1

0 + 3

- 7 + 4

> 5

+ 5

' 1

) = 2

' 4 -

 

 

 

 

 

=2 р

 

 

 

2

 

 

 

 

 

 

 

°х=2

р

 

 

( x i ) ß i ~ x

 

2 ^ =

 

 

 

 

 

 

 

= [ ° 2 4 + 1 2 4 + 2 2 - З І + 3 2 - і + 4 2 - з 1 + 5 2 - Г 2 - ( 2 ' 5 ) 2 ] = 1 ' 2 5 '

 

 

^njjXj-X)*

 

_

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s2x

=

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^ [ ( 0 - 2 , 4 ) 2 . 1 + ( 1 - 2 , 4 ) 2 . 6 + ( 2 - 2 , 4 ) 2 . 1 0 + ( 3 - 2 , 4 ) 2 . 7 +

 

 

 

 

 

 

 

 

+ (4—2,4)2 -5 + (5 — 2,4)2 .1] =

1,42.

 

Нетрудно

показать,

переставляя

операторы

Щ и

2

» ч т 0

 

 

 

і

 

 

 

і

 

 

 

і

 

 

 

 

 

 

 

и,

используя

соотношение

(2.2.9а)

для

независимых

 

переменных

с Var {Хг } = а|-,

получить

 

 

 

 

 

 

 

 

 

 

 

 

Var { X } = Var { і - 2

 

 

 

 

V a

r

{*«> = 7F

 

 

 

=

4"

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

_

(2.4.6)

 

Положительное значение

 

квадратного

корня из Var {X}

назы­

вается стандартной

ошибкой

или выборочным

средним

 

квадрати-

ческим

(стандартным)

отклонением.

Таким образом,

выборочные

средние значения сами являются случайными величинами с таким же математическим ожиданием, что и для X, и средним квадратическим отклонением, равным охіѴп- На фиг. 2.4.1 показано, как уменьшается дисперсия при увеличении объема выборки в соот­

ветствии с соотношением

(2.4.6)с-

 

Одна из важнейших теорем

статистики, центральная

предель­

ная теорема, утверждает,

что

при совершенно общих

условиях

распределение суммы п независимых случайных величин стре­ мится к нормальному распределению при п - > оо. Таким образом, плотность распределения вероятности выборочных средних значе­ ний случайных величин, не подчиняющихся нормальному рас­

пределению, будет более симметричной, чем плотность

исходного

распределения,

и обладать меньшей дисперсией, как

показано

на фиг. 2.4.2.

 

 


п~10

Ф и г . 2.4.1. Уменьшение дисперсии

при

увеличении

объема выборки сог­

ласно соотношению

Ѵаг

{X} = (1/и)

ах-

Распределения

вероятности и выборочная статистика

77

Выборочное среднее значение можно преобразовать к норми­ рованной величине с нормальным законом распределения [по ана­ логии с выражением [(2.3.2)], вводя

U= Х~^_ .

(2.4.7)

Теперь покажем, что математическое ожидание величины s\, определяемой формулой (2.4.2), равно о\. Разобьем величину X , — X на два члена

 

Хі

-

X =

(Xt -

u,*) -

(X - рх)

 

 

и подставим

их

вместо

Хг- — X

в выражение

(2.4.2):

 

( 7 і - 1 ) й = 2

[{Xt-iix)-(X-iix)]am

 

 

=

 

 

 

= S № - f e ) 2

ni-2

S (Xt-VLX)

 

( Х - и - z ) пг + S ( Х - р л ) 2 «г -

i

 

 

 

 

 

 

 

 

i

 

 

= S

-

M

2 m -

2n (X-

fe)2

+ n ( Х - и*)я =

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

3 ( Х | - ^ ) 8

/ г , - і г ( Х - ^ ) А .

(2.4.8)

 

 

 

 

 

 

г

 

 

 

 

 

Вычисляя

математическое

ожидание обеих

частей

равен­

ства (2.4.8), получим

 

 

 

 

 

 

 

% { ( / г - 1 ) & } = % { 2 ( Х і - \ і х ) 2 П і - п ( Х - ^ ) 2 } =

 

 

 

 

i

 

 

 

 

 

 

 

 

=

na\—n

Var { X } = nax—n

= ox(n

— l).

(2.4.9)

Следовательно, математическое ожидание выборочной дисперсии равно дисперсии по ансамблю.

Установление закона распределения sx для п независимых наблюдений из нормально распределенной совокупности со сред­ ним значением цх и дисперсией о\ выходит за рамки настоящей книги, хотя это можно сделать с помощью теоремы разложения для ^-распределения, которая изложена в нескольких работах, приведенных в списке литературы в конце этой главы. Здесь доста­ точно отметить, что величина

2 1 Хі Х \2

имеет ^-распределение с (п — 1) степенями свободы, т. е. она равна X2 , если число степеней свободы равно (п — 1). Следова-


78

Глава 2

тельно, можно написать

Ф и г. 2.4.3. Плотность распределения вероятности sx-

Дисперсия выборочной дисперсии определяется как

Ѵаг {бі} = Ш {(sx - o-i)2 }

и вычисляется следующим образом:

Ѵаг{&} = Ѵаг

= К ) 2 Var {-£-}

• (2-4.11)

(Напомним, что Ѵаг {%2 } =

2ѵ.)

 

Если из нормально распределенной совокупности

производится

к выборок, каждая из которых обладает одной и той же диспер­

сией Ох, но не обязательно одним

и

тем же средним

значением,

то объединенная оценка дисперсии

о\ равна

 

*1 = Ц

 

,

(2.4.12)

S

vi

 

 

где vt — число степеней свободы, связанное с величиной s?. Таким образом, используя большое число выборок малого объема.

Распределения вероятности

и выборочная статистика

79

можно найти оценку дисперсии ох,

sp, основанную на

эффективно

большем числе степеней свободы, чем можно получить,

производя

одну большую выборку при таком же полном числе наблюдений, что будет показано на следующем примере.

Пример 2.4.2. Уменьшение дисперсии при объединении

образцов в пары

Предположим, что некоторый продукт производится на двух различных установках А ж В или в результате различных процес­ сов А и В. По некоторым показателям эти продукты могут быть одинаковыми, а по другим различаться. Однако предполагается, что одна специфическая характеристика (процентное содержание некоторого химического компонента, определяемое с помощью титрования) для А и В имеет одно и то же значение, исключая случайные нормальные отклонения. В гл. 3 будет показано, как определить, являются ли одинаковыми продукты А и В. Здесь же пока будем считать, что они тождественны. Тогда, используя выражение (2.4.2), можно подсчитать выборочную дисперсию.

С другой стороны, предположим, что проводится титрование пар образцов, один из которых взят из Л, а другой — из В. Пусть при і-м титровании для образца А получено значение Х^, а для

 

 

Таблица

П.2.4.2

А

в

Разность D

D2

73,2

74,0

0,8

0,64

68,2

68,8

0,6

0,36

70,9

71,2

0,3

0,09

74,3

74,2

- 0 , 1

0,01

70,7

71,8

1,1

1,21

66,6

66,4

—0,2

0,04

69,5

69,8

0,3

0,09

70,8

71,3

0,5

0,25

68,8

69,3

0,5

0,25

73,3

73,6

0,3

0,09

 

 

Сумма

3,03

образца В — значение ХІ2 (табл. П.2.4.2). Если для каждой пары

1

титрований Х{ = y № і + ХІ2), то сумма квадратов отклонений при і-м титровании пары равна

(Xil-XiY

+ (Xit-XiY=

г 1 2 l2' = - f - ,

(a)


80

Глава 2

где Di — разность результатов измерений. Кроме того, дисперсия пары измерений равна

 

1

(Х-—Х-

)2

л?

 

 

S î

~ 2 - 1

2

_

2 -

 

W

Тогда для к наборов измерений объединенная

оценка

дисперсии

ft

 

. *

да

 

 

 

2 ^ ?

 

 

 

I

 

 

 

 

 

 

Sn = - i =l

 

 

 

 

 

 

2

Vj

i=l

 

i=l

 

 

t=l

 

 

 

 

ft

 

 

 

 

 

 

 

где К — полное число степеней свободы, равное 2

ѵ і -

 

 

 

 

 

і = 1

 

Если бы данные,

приведенные

в

таблице,

рассматривались

(некорректно) как отдельные измерения, то получилось бы среднее значение X = 70,89, а дисперсия, вычисленная по формуле (2.4.2)

с 19 степенями

свободы, оказалась

бы равной

 

20

 

 

S * =

 2 і-70,89)»

=

^ - 5 , 8 9 .

s

i=l

 

 

Напротив, если данные обрабатываются по парам (корректно), из

равенства

(в)

 

получается

 

 

 

 

 

 

 

 

 

 

 

s ^ =

2^10=

0Д52

 

 

при 10 степенях

свободы.

 

 

 

 

 

Полученный результат можно объяснить следующим образом.

Заметим,

что

для

одной пары

наблюдений

 

 

 

 

 

 

Di-D

=

 

(Xli-Xl)-{Xb-Xi),

 

 

 

ft

 

 

 

 

 

 

 

 

 

где

D = — 2

Dh

и

тогда

 

 

 

 

 

 

і=1

 

 

 

 

 

 

 

 

 

2

(Di-D)2

_

S

( * i

t - X i ) a

2 ( X i 2 - X 2 ) 2

2 g ( ^ - ^ i )

{г)

n — 1

n — 1

'

n — 1

/1—1

или

 

 

 

 

 

4

= *Згі + &,—2sxiZ,.

(г)

Заметим, что дисперсия разностей зависит от корреляции между парами наблюдений [ковариации в выражении (г)]. Следователь­ но, весьма желательно всегда упорядочивать пары наблюдений в надежде получить большую положительную корреляцию и тем самым уменьшить дисперсию. Если пары выбирать так, чтобы