ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.04.2024
Просмотров: 20
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
33
жем получить любое значение в этом интервале. Ее задают функци- ей распределения и плотностью вероятности (гра-фически
кри- выми функции распределения и плотности вероятности).
Дискретная случайная величина может принимать только це- лые значения (0, 1, 2, 3, ...). Например, число золотинок в одном кубическом метре песка россыпного месторождения золота. Ее за- дают рядом распределения (графически
полигоном распределе- ния или гистограммой) и функцией распределения.
Пусть дискретная величина Х в результате опыта получает раз- личные значения х
i
с вероятностями р
i
(при этом
р
i
= 1).
Связь между возможными значениями случайной величины и вероятностями их появления устанавливает закон распределения.
Простейшей формой задания такого закона является та-блица зна-
чений x
i
и p
i
, или ряд распределения.
Графически ряд распределения изображают полигоном рас-
пределения: по горизонтальной оси откладывают возможные значе- ния случайной величины, а по вертикальной — вероятности этих значений. Этот же ряд распределения может быть изображен в виде
гистограммы.
Для непрерывной величины ряд распределения получают пу- тем разделения N возможных значений непрерывной случайной ве- личины на равные по величине классы (разряды). В каждом разряде подсчитывают частоту п
i
, и вычисляют частости n
i
/N = p
i
, которые принимают за эмпирические или статистические вероятности. В результате получают распределение вероятностей и для непрерыв- ной величины. Чем меньше величина интервала, тем точнее при достаточно большом объеме выборки построенное распределение отражает действительное.
Для количественной характеристики распределения вероятно- стей определяют вероятность события
Р при Х
х, где х
—
текущая переменная.
Вероятность этого события зависит от
х и есть некоторая функция
х:
P(X
x) = F(x). (2.1)
Эту функцию называют
статистической, или интегральной,
функцией распределения. Она дает полную характеристику случай-
34
ной величины с вероятностной точки зрения и существует для всех случайных величин, непрерывных и дискретных.
Чтобы найти значение статистической функции распределения при данном
х, подсчитывают число п опытов, в которых Х приняло значение меньше, чем
х, и делят п на общее число опытов.
Производная от функции распределения называется плотно- стью вероятности (или дифференциальной функцией распределе- ния):
f(х) = F'(х). (2.2)
Для статистической совокупности плотность вероятности представляется статистическим рядом, а графически — гистограм- мой или полигональной кривой. Если всю статистическую сово- купность разбить на разряды (интервалы), в каждом раз-ряде под- считать число наблюдений и разделить его на общее их число, то получим частости. Интервалы разрядов (или их средние значения) и их частости представляют статистический, или вариационный, интервальный ряд. Частные значения случайной величины, входя- щие в вариационный ряд, называются
вариантами.
Рассмотрим статистическую совокупность, членами которой являются значения содержания никеля, полученные в пределах од- ной очистной камеры полиметаллического месторождения по дан- ным бороздового опробования и кернового бурения. Совокупность предварительно упорядочена, т.е. члены ее расположены в порядке возрастания их значений.
Номера проб .............. 1 2 3 4 5 6 7 8 9 10
Содержание, % ....... 1,85 2,18 2,37 2,56 2,61 2,69 2,73 2,76 2,84 2,87
Продолжение
Номера проб .............. 11 12 13 14 15 16 17 18 19 20
Содержание, % ....... 2,92 2,95 3,07 3,09 3,13 3,15 3,18 3,21 3,24 3,29
Продолжение
Номера проб .............. 21 22 23 24 25 26 27 28 29 30
Содержание, %........ 3,33 3,35 3,40 3,42 3,48 3,50 3,51 3,57 3,62 3,68
Продолжение
Номера проб .............. 31 32 33 34 35 36 37 38 N = 38
Содержание, % ....... 3,75 3,83 3,91 3,98 4,09 4,32 4,47 4,76
Упорядоченный вариационный ряд может быть также задан вариантами и соответствующими им частотами (или частостями),
35
однако в данном случае такой способ задания не имеет смысла, так как каждый вариант встречается только один раз.
Задание ряда существенно упрощается при разбиении его на интервалы. Оптимальную ширину
h интервала определяют по формуле Стердженса:
h = (x max
x
min
) / (1 + 3,2 lg
N), (2.3)
где
x
max и
x
min
— наибольший и наименьший варианты; N — число вариантов в ряду (объем выборки). Для нашего примера имеем:
h = (4,76
1,85) / (1 + 3,2 lg 38) = 0,48 0,5 %.
Разбиваем исходную совокупность на интервалы шириной в
0,5 и подсчитываем частоту, соответствующую каждому из интер- валов. Теперь исходная статистическая совокупность может быть задана в виде интервального ряда (табл. 2.1).
По значениям интервалов и частотам
п
i
строят гистограмму полученного интервального ряда по серединам интервалов
i
x и частотам
n
i
или полигональную кривую распределения. Гисто- грамма и полигональная кривая могут быть построены с использо- ванием не частот
n
i
, а частостей p
i
.
В табл. 2.1 подсчитаны также накопленные частоты
N
i
,
кото- рые могут определяться как в нисходящем, так и в восходящем по- рядке и служат для графического изображения интервального ва- риационного ряда с помощью кумулятивной кривой (кумуляты).
Кумуляту строят как по накопленным часто-там, так и по накоп- ленным частостям.
Таблица 2.1
Интервал значений x
i
,
%
Значение середины интервала
i
x
Частота n
i
Накопленная частота N
i
Частотность
N
n
p
i
i
1,5
2 2
2,5 2,5
3 3
3,5 3,5
4 4
4,5 4,5
5 1,75 2,25 2,75 3,25 3,75 4,25 4,75 1
2 9
14 8
3 1
1 3
12 26 34 37 38 0,026 0,053 0,237 0,369 0,210 0,079 0,026
N =
n
i
= 38
p
i
= 1
36
Во всех случаях задания и изображения вариационного ряда с помощью частости последнюю принимают за приближенное зна- чение вероятности. При увеличении объема
N выборки статистиче- ская функция распределения приближается (сходит-ся по вероят- ности) к действительной функции распределения случайной вели- чины.
Некоторые законы распределения случайных величин
. Плот- ность вероятности описывают функциями, куда входят математи- ческое ожидание, дисперсия и стандарт.
Математическим ожиданием случайной величины Х дискрет- ного типа называют сумму произведений всех значений величины на их вероятности:
n
i
i
i
x
p
x
m
X
M
1
. (2.4)
Математическое ожидание является генеральной средней слу- чайной величины. Оно связано со средним арифметическим на- блюденных значений (выборочным средним) случайной величины зависимостью такого же порядка, как частость с вероятностью.
При небольшом числе опытов среднее арифметическое их ре- зультатов случайно. При увеличении числа опытов оно становится
«почти неслучайным» и, стабилизируясь, приближается к постоян- ной величине — математическому ожиданию.
Математическое ожидание непрерывной случайной величи-ны выражают интегралом
dx
x
xf
X
M
)
(
, (2.5)
где f(x) — плотность вероятности величины X.
Дисперсией случайной величины называют математическое ожидание квадрата разности между случайной величиной и ее ма- тематическим ожиданием:
)
(
2
x
x
2
m
X
M
D
(2.6)
Дисперсия характеризует рассеяние возможных значений слу- чайной величины около ее среднего значения. Ее вычисляют по не- сгруппированным данным по формуле
,
N
x
x
i
/
)
(
2 2
(2.7) по сгруппированным данным по формуле
37
,
i
i
n
n
x
x
/
)
(
2 2
(2.8) где
x — среднее значение случайной величины.
Стандарт представляет собой среднее квадратичное отклоне- ние случайной величины и определяется как корень квадратный из дисперсии:
2
(2.9)
Стандарт средней в
N раз меньше стандарта отдельной пе- ременной:
N
x
/
(2.10)
Рассмотрим теперь некоторые законы распределения случай- ных величин (рис. 2.1).
Нормальный закон — наиболее часто встречающийся на прак- тике закон распределения. Плотность вероятности характеризуется функцией вида
2 2
2
)
(
2 1
)
(
a
x
x
f
e
, (2.11) где а — математическое ожидание величины X;
2
— дисперсия случайной величины X.
Следовательно, нормальный закон распределения вполне оп- ределяется математическим ожиданием и дисперсией (или стандар- том) случайной величины. Кривая распределения представляет со- бой симметричную холмообразную кривую.
Распределение Пуассона (распределение редких явлений) — распределение дискретной случайной величины вида:
,
e
a
m
m
m
a
P
!
(2.12) где P
m
вероятность появления случайной величины m; a
m
ма- тематическое ожидание m или среднее значение признака для всей совокупности
38
Закон Пуассона является разновидностью биномиального рас- пределения, когда число событий велико, а вероятность появ-ления отдельного события мала. Редкие события подчиняются закону Пу- ассона при условии, если вероятность появления одно-го или не- скольких событий в определенной области не зависит от числа по- явлений их в дру-гой облас- ти; и в каждой об-ласти собы- тия располагают-ся независи- мо друг от друга.
Рис. 2.1. Типы кривых плотности распределения вероятностей:
а
нормальные; б логарифмически нормальные; в
гиперболовидные
(редких явлений Пуассона); г
бино- миальные
Для распределения Пуассона дисперсия равна математическо- му ожиданию. Это свойство часто применяют для подтверждения гипотезы распределения: если по данным опыта значения среднего и дисперсии приблизительно равны (а
2
), то это дает основание считать, что распределение подчиняется закону Пуассона.
2.3. Сравнение эмпирического распределения с теоретиче-
ским
Подбор теоретической плавной кривой распределения (за- кона), наилучшим образом описывающей данное статистическое распределение, называется выравниванием (сглаживанием) стати- стического ряда.
Как бы хорошо не была подобрана теоретическая кривая, меж- ду нею и статистическим распределением неизбежны некоторые расхождения. Величину этого расхождения определяют графически или с помощью критерия согласия (критерий А.Н. Колмогорова, хи-квадрат Пирсона и др.).
При графическом способе сравнения строят эмпирическую функцию распределения F
э
(х). На этом же чертеже проводят те- оретическую кривую распределения F
т
(x). По совпадению кривых определяют соответствие принятого по гипотезе закона и эмпири- ческого распределения.