Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 612

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

94 Глава 2

если учесть, что

 

 

^(ХІХ)

(Yi —

Y)ni=2lniXiYi—nXY.

г

 

г

Следовательно, выборочный

коэффициент корреляции равен

 

i

 

— K p i r < + 1 .

(2.4.28)

Если предложена некоторая эмпирическая модель и выполнен ряд соответствующих экспериментов с целью определения связи

4,

,

-і,о

о

 

Ar

 

Ф и г . 2.4.9. Плотность

распределения вероятности

выборочного коэффи­

 

циента к о р р е л я ц и и PXY-

 

между двумя переменными и в измерениях одной или обеих пере­ менных содержится ошибка, то, как описано в гл. 4 и 5, можно применить регрессионный анализ. С другой стороны, если просто измерять или наблюдать две переменные в некоторой случайной выборке, можно вычислить меру линейной связи между этими переменными, а именно выборочный коэффициент корреляции. При этом несущественно, являются ли эти переменные независимы­ ми или нет. Если по какой-нибудь причине значения одной из переменных, которая в генеральной совокупности является слу­ чайной величиной, ограничены некоторыми пределами или иссле­ дуются некоторые предварительно отобранные значения пере­ менной, то выборочный коэффициент корреляции дает искажен­ ную оценку коэффициента корреляции [13, 14].

Распределение выборочного коэффициента корреляции весьма сложное. Оно симметрично только при р Х у = 0 и резко асимме-


Распределения

вероятности

и выборочная

статистика

95

трично, если абсолютное значение | pXY слишком большое (фиг. 2.4.9). Фишер

I велико, а число п не нашел преобразование

1 1 - Р х у

Z* = Arc th PXY = y l n — -PXY

такое, что величина Z* распределена приблизительно по нормаль­ ному закону при любых значениях pXY и умеренных значениях п.

• ••

а

о

Ф и г . 2.4.10. Диаграммы рассеяния для гипотетических

данных пр и п р и б л и ­

зительно нулевой к о р р е л я ц и и .

 

Выборочный коэффициент корреляции дает оценку pXY; про­ верки, которые производились 1 ) , основывались на предположении о том, что совместное распределение для обеих переменных X и Y

а

*

б

X

Ф и г . 2.4.11. Диаграммы

рассеяния данных

пр и сильной

положительной

 

к о р р е л я ц и и .

 

 

является нормальным. Отклонение от нормального закона может привести к сильно смещенным оценкам и как следствие к ошибоч­ ным заключениям.

При использовании выборочных коэффициентов корреляции целесообразно принять некоторые меры предосторожности. Как показано на фиг. 2.4.10, б, выборочный коэффициент корреляции

г ) Различные проверки, которые

можно выполнить для pXY с помощью

таблиц и графиков, обсуждаются в

[15—17].


96 Глава 2

может быть очень близок к нулю и тем не менее между переменны­ ми X и Y явно имеет место некоторая нелинейная связь. Если по данным фиг. 2.4.10, б вычислить выборочные коэффициенты корре­ ляции, то они оказались бы почти равными нулю. Можно заклю­

чить, что между двумя переменными может существовать

нелинейная

связь, которая не будет замечена исследователем,

использую­

щим в качестве меры этой связи выборочный коэффициент корре­ ляции. Фиг. 2.4.11 иллюстрирует необходимость использования однородных данных для того, чтобы избежать ложной корреляции, которая возникает, если при вычислении выборочного коэффи­ циента корреляции объединяются две неоднородные группы дан­ ных. Наконец, важно помнить, что значительная корреляция еще не доказывает, что между двумя переменными существует

причинная связь.

Пример 2.4.8. Выборочный коэффициент корреляции

Были взяты восемь проб полимера и измерены две его характе­ ристики: 1) скорость седиментации и 2) степень кристалличности. Чему равен выборочный коэффициент корреляции между этими двумя переменными?

Скорость седиментации

15

И

8

8

6

4

3

1

Степень к р и с т а л л и ч н о с т и

8

8

7

5

4

3

2

1

Решение

Выборочный коэффициент корреляции можно подсчитать по формуле (2.4.28), как показано в табл. П.2.4.8.

 

 

 

 

 

 

Таблица

П.2.4.8

Степень

Скорость

 

 

 

 

 

 

кристаллич­

седиментации

г

- X)

( Г ; - Y )

І - X)*

(YT - Y)2 (XT-X)(YT-Y)

ности Х^

Y i

 

 

 

 

 

 

1

1

 

- 4

—6

16

36

24

2

3

 

- 3

- 4

9

16

12

3

4

 

—2

—3

4

9

6

4

6

 

—1

—1

1

1

1

5

8

.

0

1

0

1

0

7

8

 

2

1

4

1

2

8

11

 

3

4

9

16

12

8

15

 

3

8

9

64

24

40

56

 

б

0

52

144

81

X = 5

У = 7

^(Zt-X)(Xt-Y)

81

PXY-

=0,937

V^iXi-X^Wi-YT-

~ V52 - 14 4


Распределения вероятности и

выборочная

статистика

97

Вообще говоря, значение pXY

0,937

является

высоким;

чтобы провести соответствующую

проверку,

следует

обратиться

к литературе, цитированной выше.

Задачи

2.1. Соберите 20 пятикопеечных монет. Д л я каждого из сле­ дующих экспериментов предскажите, какого типа закон распре­ деления вероятности следует ожидать, напишите его выражение и сделайте эскиз графика. После этого возьмите монеты и прове­ дите указанные эксперименты. Сравните экспериментальные отно­

сительные частоты

с предсказанными вероятностями.

 

а)

Распределение монет по размерам с округлением до 1 см.

б)

Распределение монет по размерам с округлением до 0,5

мм.

в)

Распределение монет по размерам с округлением до 0,01

мм.

Используйте микрометр.

 

г)

Распределение

орлов при однократном подбрасывании

каждой монеты; распределение решек; распределение попаданий

на ребро. Возможны ли

другие

исходы?

д)

Распределение

по

годам выпуска

монет.

е)

Распределение

по последним

цифрам

года выпуска; распре­

деление по первым

цифрам.

 

 

2.2. Постройте график распределения вероятности и распре­ деления накопленной вероятности дискретной случайной вели­ чины, для которой задано распределение накопленной вероят­

ности

 

 

 

 

Р{Х<х}

 

 

 

 

Чему равно значение Р {X = 3}?

 

 

2.3. При условии

что

распределение накопленной вероятности

непрерывной случайной

величины

равно

 

 

 

0,

ж < 0 ,

Р{х) =

Р{Х<Сх}=<

—,п

О-^Сх^Сп,

 

 

 

1,

х>п,

постройте график этой функции, найдите выражение для плотности распределения вероятности и изобразите его графически.

2.4. Плотность рэлеевского распределения вероятности равна

.

P(r)=^e-ryz°\

r > 0 ,


98

 

 

Глава

2

 

где

а 2

— постоянная.

Найдите рэлеевское распределение накоп­

ленной

вероятности Р

(г) и постройте оба графика р (г) и

Р (г)

при

нескольких значениях а 2 .

(г) описывает вероятность

того,

что точка на плоскости, координаты которой являются незави­ симыми случайными величинами с нормальным законом распре­

деления,

лежит

внутри

круга

радиуса г.]

 

 

 

 

 

 

2.5.

По аналогии

с термодинамикой

«энтропию»

для

дискрет­

ного

распределения

вероятности

можно

определить

как

 

 

 

 

 

 

 

 

 

 

71

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Я ( л ) = — 2

 

 

P{xh)\nP(xk),

 

 

 

 

 

 

 

 

 

 

 

 

 

fc=i

 

 

 

 

 

 

 

 

 

 

 

где

P

(xh)

= P

{X

=

xh}.

В

каком

случае

имеет

место

равен­

ство H = 0 и как интерпретировать ответ? Когда имеет место

наибольшая неопределенность и чему тогда равно значение P

(xk)?

Какова тогда энтропия H (п)1 В каком случае энтропия мини­

мальная? Чему тогда равна H (п)?

 

 

 

 

 

 

 

 

 

2.6.

Плотность

распределения

вероятности

Максвелла

равна.

 

 

 

 

 

р (х) =

-Щ=х2е-х2'2аг

 

 

U

(х).

 

 

 

 

 

 

 

 

 

 

 

 

а3

у

л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

 

 

 

 

Покажите,

что р

(х) >

0

и что

j " p

(x)

dx

=

1.

U

(х)

единич-

 

 

 

 

 

 

 

 

 

 

— оо

 

 

 

 

 

 

 

 

 

ная

ступенчатая

функция,

 

а

а

— некоторая

постоянная.

2.7. Совместная вероятность X и Y дана в таблице внизу.

Покажите,

что

X

и

Y

независимы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

3

 

 

4

 

 

 

 

 

 

 

 

 

 

О

 

1

 

 

1

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

24

 

 

12

 

12

 

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

1 .

 

1

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

6

 

6

 

12

 

 

 

 

 

 

 

 

 

 

2

 

1

 

 

1

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

24

 

 

12

 

12

 

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.8.

Если плотность распределения

вероятности

X

равна

 

 

 

 

 

 

у2пОх

 

 

 

L

 

2 о х

Л

 

 

 

 

 

а плотность распределения вероятности Y