Файл: Гром, В. П. Экспресс-анализ данных сдаточных испытаний судов с помощью бортовой ЭЦВМ.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 02.11.2024

Просмотров: 20

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Вычисляем точечную оценку среднего значения

24

V

 

Оценкой σ будет

X = Z =24I

2474

≈ 3,08,

 

 

 

24

 

 

 

 

 

C доверительной вероятностью γ значение х заключено в пре­

делах

 

 

 

X — t-ls < х ≤ X

-4-

t-is ,

 

где

t1 —

1,3

определяется из

таблиц

 

Стьюдента

 

распределения

(γ=0,8), т.

е. 0,35

х

≤ 5,81

(результат точный, если

величина

 

имеет нормальное распределение, и приближенный в любом другом случае).

Если провести проверку статистических гипотез о законе распре­

деления наблюдаемой случайной величины, то с высокой вероят­ ностью может быть принята гипотеза об экспоненциальном харак­

тере распределения. Приняв эту гипотезу, доверительные интервалы

для истинного значения среднего X следует рассчитывать по фор­

муле

-Z

2Nx

.

2Nx

 

 

 

2------------------

≤Λ< —- 5-----------------

 

 

■1 + ï

 

у ¿

 

 

 

 

 

 

z∙l-γ

γ+2

 

 

~!∙,2Λ'÷2

—I,

 

При γ=0,8, .∕V = 24 из таблиц распределения χ2 находимZ29.50 —

= 63,2; Z2Jj50 — 37,7

и, следовательно,

2,3

х

≤ 3,9.

Сравнивая с предыдущим результатом, убеждаемся, что при

объеме выборки

N—24

и распределении

наблюдаемой случайной

 

 

 

 

 

 

 

величины, близком к экспоненциальному, приближенный расчет

приводит к большой погрешности.

Пример, может быть, покажется несколько утрированным в том отношении, что объем выборки 24 позволяет, как правило, разли­

чать нормальное и экспоненциальное распределения. Однако он

свидетельствует о необходимости контроля точности и достовер­

ности

результатов.

в ра­

Метод

прямоугольных вкладов (описан, например,

боте

[14]) также можно рассматривать как специальный прием

построения

аппроксимирующей зависимости. Для методов

такого

рода

может быть исследована сходимость, но определить точность

оценки в каждом отдельном случае не представляется возможным.

Несколько перекликается с проблемой малых выборок стати­

стика экстремальных значений [5]. Речь идет об уточнении функ­

ций плотностей вероятностей в областях «редких» значений случай­

13


ных величин при общем значительном объеме выборки. Обосновы­

вается правомерность в случае установления в области наиболее

вероятных значений некоторых типовых закономерностей экстрапо­

лировать их в области возможных, но не наблюдавшихся значений случайных величин. Однако для анализа малых выборок методы статистики экстремальных значений эффективно применить пока не

удалось.

Проверка статистических гипотез о законах и параметрах рас­ пределений случайных величин является методом статистического

анализа в наиболее его чистом виде, безотносительно пути, который привел к проверяемой гипотезе. Проверка осуществляется с по­ мощью критериев. Наиболее распространенными являются крите­

рий согласия. Пирсона χ2 (хи-квадрат) и критерий K(λ) Колмого­

рова. Однако применимость их к анализу малых выборок ограни­

чена. Нижний допустимый предел объема выборки обычно уста­ навливается 25, но это, можно сказать, качественный предел, ибо

зависимость величин погрешностей от объемов выборок не установ­ лена. В этом отношении представляют интерес критерии W, WE0,

WE, описанные в работе [16], позволяющие работать с объемами

выборок, начиная с трех, однако на их применимость наложены ограничения другого рода — по типам проверяемых гипотез. Метод табулирования этих критериев в работе не описан, но вскользь упо­

мянуто, что осуществляется оно путем статистического моделиро­ вания некоторых вероятностных схем. Аналогичный принцип поло­

жен в основу предлагаемой методики экспресс-анализа, поэтому

знакомство с упомянутыми критериями может быть рекомендовано

в порядке сравнения. Преимуществом критериев W, WE0, WE является то, что в практической работе они не требуют применения

ЭЦВМ. (

Промежуточное положение между анализом и обработкой зани­

мают методы построения кривых регрессии, которые хотя и близки к методам аппроксимации, но включают в себя элементы анализа

точности результатов построения. Одна особенность их, связанная

с точностью, часто остается без внимания. Если точки, по которым

строится аппроксимирующая кривая, имеют случайную составляю­

щую ошибки (а в случае кривой регрессии это имеет место всегда),

невозможно беспредельное повышение точности путем увеличения

степени аппроксимирующего полинома. При увеличении степени

полинома происходит уменьшение погрешности собственно аппро­ ксимации, определяемой остаточным членом ряда Тейлора. Но

одновременно увеличивается составляющая случайной ошибки.

В каждом случае существует некоторая степень полинома, соответ­

ствующая минимуму суммарной погрешности. Этот вопрос подроб­ нее рассмотрен в § 5.

Методы выборочного статистического контроля обычно' рассма­

триваются вообще совершенно обособленно. Это обусловлено при­ менением достаточно специфичного аппарата — комбинаторики,

дискретных распределений вероятностей, хотя для простоты вычи­ слений часто пользуются, например, аппроксимацией биноминаль-

14


його закона нормальным законом и т. д. Но прежде всего следует обратить внимание на то, что, как правило, и не делается попыток

увязать между собой методы выборочного статистического контроля

с методами последующего, более детального анализа наблюдений,

замеров и т. д., сделанных на выборке. Такой анализ проводится

ранее упомянутыми методами (аппроксимация, анализ регрессий,

проверка гипотез и т. д.) безотносительно соотношения количеств

обследованных и необследованных изделий и, строго говоря, его результаты справедливы только, для обследованной доли совокуп­

ности. Распространение же этих результатов на необследованную

часть совокупности, как правило, осуществляется без соответствую­

щего количественного анализа.

Существующие методики статистических обработки и анализа

данных можно представить следующей схемой:

 

 

{Ni}

→∕(O→⅛,

 

 

где {Mi} —экспериментальная выборка;

f

(х) — предложенное в ре­

зультате ее

статистических обработки

и

 

анализа

функциональное

описание закономерностей

проявления

 

наблюдаемой случайной

величины х;

k —

показатели

качества исследуемого изделия, кото­

рые при условии знания зависимости

f(x)

могут

быть рассчитаны

по известным формулам.

 

 

 

 

 

 

 

В этой схеме слабым является звено

 

 

 

 

 

 

(M) →)∕(*

,

 

 

 

 

так как при малом объеме выборки велика опасность встать на лож­

ный путь и на этой ошибочной основе строить дальнейшие, сами по

себе правильные, выкладки и заключения.

Необходимо построение такой схемы статистического анализа,

которая обеспечивала бы постепенное, по мере накопления данных,

строго обоснованное «стягивание» ко все более и более определен­ ной закономерности. При любом же фиксированном объеме вы­

борки схема должна давать как бы поперечный «разрез» такого

информационного стягивающегося «конуса».

Может быть предложена схема

Реализуется она следующим образом. На основе рассмотрения

экспериментальной выборки должны быть выдвинуты различные,

а не единственная, гипотезы о закономерностях проявления случай­

ной величины, допускаемые этой выборкой в пределах некоторого

уровня доверительной вероятности. Очевидно, чем меньше объем выборки, тем более различные по своему характеру гипотезы могут быть допущены.

15


Расчет показателей качества производится для каждой гипотезы

отдельно. Переход к однозначному результату осуществляется лишь

на заключительной стадии расчета, когда имеется возможность сравнивать конечные результаты и оценивать степень ущерба или

опасности ошибки выбора.

Предлагаемый математический аппарат позволяет реализовать

такую схему. В принципе он позволяет даже большее, а именно расчеты по схеме

Последняя схема отличается тем, что если вычисленные показа­

тели качества k↑, ..., kj оказываются очень различными по значе­ нню, может быть определен объем выборки, необходимый для уменьшения разброса до заданной величины в пределах той же доверительной вероятности.

Применение таких схем расчета к экспресс-анализу данных сда­ точных испытаний судов в ходе их проведения отвечает требова­ ниям осуществления оперативного управления испытаниями в усло­

виях непрерывно возрастающего количества информации.

ГЛАВА II

МАТЕМАТИЧЕСКИЙ АППАРАТ АНАЛИЗА ДАННЫХ СДАТОЧНЫХ ИСПЫТАНИЙ СУДОВ

§ 3. Программно-логический метод проверки статистических гипотез о законах и параметрах распределений случайных величин по малым выборкам

Программно-логический метод проверки статистических гипотез

построен на основе разработанного нового статистического крите­ рия, названного Q-критерием. Реализуется он путем статистиче­

ского моделирования на ЭЦВМ некоторых простейших вероятност­ ных схем.

Указанный метод отличается существенной новизной как по принципу построения и практической реализации, так и по своим

возможностям, значительно расширяющим круг задач, которые

могут быть с его помощью решены. В связи с этим необходимо

изложение таких аспектов теории проверки статистических гипотез,

16

которые до настоящего времени оставались прерогативой работ

сугубо теоретического характера и в широкой литературе по вопро­

сам статистического анализа не рассматривались. В объеме данной

книги это сделать было невозможно, да и нецелесообразно, поэтому

после ссылок на литературные источники, наиболее полно освещаю­

щие вопросы теории и практики проверки статистических гипотез,

дается краткое изложение тех положений, которые в первую оче­

редь необходимы для понимания и практического применения метода.

Вопросам проверки статистических гипотез о законах распреде­ ления случайных величин посвящена обширная литература. Сугубо теоретическое изложение вопроса содержится в работе [9]. Подроб­

но этот вопрос рассмотрен в работах [4, 11, 15]. Оригинальное

исследование проблемы с позиций теории

информации

проведено

в работе [8].X

 

 

случайной

Статистической гипотезой о законе распределения

величины

является любое утверждение

о виде распределения

вероятностей принятия случайной величиной ее возможных значе­

ний. После того как сформулирована некоторая основная, прове­

ряемая гипотеза G0, класс всех возможных распределений случай­

ной величины х оказывается разбитым на два непересекающихся

подкласса — распределений, обладающих свойствами, по которому

выделена основная гипотеза G0, и не обладающих ими.

Способы определения основной гипотезы G0 могут быть различ­ ными. Возможны гипотезы о виде закона распределения. Может

быть задана область параметра Ѳ (в общем случае многомерного)

параметрического закона распределения. При этом если речь идет о дискретной случайной величине, принимающей г различных зна­

чений, в самом общем виде гипотеза может быть определена неко­

торой областью в г-мерном пространстве.

Гипотеза G0 может состоять в ограничении на величину сред­

него значения случайной величины, ее дисперсии или еще какой-

либо статистической характеристики. Задание конкурирующей

гипотезы Gj при этом возможно двумя принципиально различными

способами. В первом к гипотезе Gi относятся все распределения, не

обладающие свойством, по которому выделена G0, т. е. гипотеза Gi

задается как альтернативная к G0. Во втором из этого множества

распределений, не вошедших в G0, также по какому-то признаку выделяется часть.

Понятие основной и конкурирующей гипотез является исходным

понятием теории проверки статистических гипотез. После того как

гипотезы G0 и Gi сформулированы, задача проверки заключается в принятии решения о принадлежности наблюдаемой случайной

величины к одному из двух определяемых ими взаимоисключающих подклассов распределений.

Правило или система правил, согласно которым осуществляется принятие такого решения по результатам наблюдения величины, называется статистическим критерием. Статистические критерии,

дающие в каждом отдельном случае ответ по однозначному пра­

2

В.

П.

Гром,

Р.

В.

Кузьмин

17

 

 


вилу, называются нерандомизированными. В некоторых случаях используются рандомизированные статистические критерии, в кото­ рых само принимаемое решение является случайной функцией ре­

зультата наблюдения и вычисленного по нему значения критерия. Ниже рассматриваются только нерандомизированные статисти­

ческие критерии. Такой критерий обычно представляет собой неко­ торую статистику S(x), вычисляемую как функцию от исхода на­

блюдения, распределение которой зависит от закона распределения наблюдаемой случайной величины, а именно от принадлежности его к одному из подклассов, определяемых гипотезами G0 и G1.

Область возможных значений величины S(x) разбивается на две —

область допустимых значений S0 и критическую для гипотезы G0

область Sκp, попадание в которую маловероятно в случае справед­

ливости гипотезы G0, но весьма вероятно в альтернативном случае.

Тогда в случае попадания значения статистики S(x), вычисленной

по результатам наблюдений, в область S0 принимается гипотеза G0,

в случае же попадания в область Sκp гипотеза G0 отвергается и при­

нимается гипотеза Gi.

В каждом из этих двух случаев возможна ошибка. C вероят­ ностью а значение S (х) может попасть в область Sκp, в то время как

верна гипотеза G0, которая при этом будет ошибочно отвергнута.

C вероятностью β значение S(x) может попасть в область S0, когда

верна гипотеза Gb и тогда ошибочно будет принята гипотеза G0.

Величина а называется вероятностью ошибки первого рода, вели­ чина β — вероятностью ошибки второго рода. Определяются они из

соотношений

P{S(x)

Sκp∕G0}=α;

(1)

 

P{S(x)

 

 

S0∕G1}=β.

(2)

Если гипотезы G0 и Gi определяются путем задания области зна­ чений параметра Ѳ, так что случай θ Ωo соответствует гипотезе G0,

а случай θ Qi гипотезе G1, соотношения (1) и (2)

могут быть за­

писаны в виде

P{S(x) Sκp'0 Ω0}=α;

 

(3)

Если гипотеза

P{S(X) S0θ Ω1}=β.

по

(4)

Gi задана как

альтернативная

отношению

к гипотезе G01 практически может

быть определена

только вели­

чина а, ибо для определения β потребовалось бы перебрать беско­

нечное множество законов распределения. В этом случае величина

Sκp определяется из условия задания величины а, т. е.

P{S(x) Sκp(α) GJ < а.

(5)

Важной числовой характеристикой критерия является вероят­

ность отвергнуть проверяемую гипотезу G0, определяемая как функ­

ция характеристик наблюдаемой случайной величины. Наиболее

18