Файл: Гришин В.К. Статистические методы анализа результатов измерений учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 26.07.2024

Просмотров: 119

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

- п о -

где ^ » л. - / .

Иногда в серии наблюдений имеется несколько сомнитель­

ных точек. Тогда их анализ проводится путем последователь­

ного отбора.

Сначала оотавляют наименьший из "подозрительных" выб­

росов и рассматривают усеченную выборку, в которую включа­ ются точки, не вызывающие сомнения, и наименьшее из резких

отклонений.

Если проверка,базирующаяся на этой ограниченной ииоо|>-

ке,позволяет забраковать сомнительный результат,то, «отестион-

но, отбраоываютоя и другие большие отклонения. Напротив,в случав благоприятного исхода, анализ продолжается; в вы­

борку включается следующий по величине, выброс, и т . д .

З А Д А Ч А

При измерении температуры плазмы дугового разряда получены значения: (1,0; 1,2; 1,4; 1,0; 0,8; 2,3 ) • Ю3 К. Можно ли отбросить последний результат как ошибочный?

 

 

 

ГЛАВА ІУ

 

 

 

 

 

 

 

РЕГРЕССИОННЫЙ АНАЛИЗ

 

 

 

 

 

§ 19.

Стохастическая

зависимость •

 

 

 

 

До сих

пор мы рассматривали задачи,

прототипом которых

являлись эксперименты, проводимые при неизменных условиях

 

наблюдения. Однако существует

также более широкий класс

ис­

следований,

в которых изучаемое

явление

наблюдается при

раз­

личных внешних

условиях.

 

 

 

 

 

 

В общих чертах такой эксперимент можно рассматривать

как

попытку

установления

зависимости некоторой

величины

у

от

независимой

переменной

X .

 

 

 

 

 

Нетрудно

видеть, что

здесь

мы встречаемся

о новым типом

зависимости, которую нельзя интерпретировать как функциональ­ ную зависимость.

Действительно, для каждой оовокупнооти опытных условий

неизбежно

следует

ожидать

рассеяния результатов измерений.

Поэтому,

переходя

от

одной

 

"точки" независимой

переменной

 

к другой,

мы будем

наблюдать не

строго

детермкнизо-

ванные

значения исследуемой

величины

у

, а лишь набор

данных,

в той или иной степени

характеризующих генеральные

совокупности значений

у

 

,

соответствующих конкретным

условиям опыта. Но, хонечно, параметры генеральных совокупностей могут изменяться в зависимости от условий наблюдение, как показано, например,на рио. 13.


У»:

У,пЛ

Рио. 13. Уоловия опыта Х,,Х„ . . . , X результаты наблюдений ул> у ,

Такая зависимость, при которой изменение одной перемен­ ной меняет распределение другой, нооит название стохастиче­ ской зависимости.

Изучение стохастической зависимости затрагивает весьма обширный круг проблем. Заметны, например, что не всегда сто­ хастическая зависимость четко указывает на первопричинную связь. Поучительным примером в этом отношении являются опыты

- из -

Беккереля, который обнаружил, что интенсивность рентгеновских лучей теи выше, чей ярче люминесцентное свечение катодной трубки, испускающей эти лучи. Это послужило основанием для

ошибочного предположения, что люминесцентное свечение явля­

ется причиной рентгеновского излучения.

Проблема усложняется вдвойне, еолн значения независи­ мого аргумента определяются не точно, а о некоторой неопре­ деленностью, т . е . независимый аргумент также является случай­

ной величиной.

Мы ограничимся рассмотрением наиболее важного аспекта

анализа стохастической зависимости: установлением функцио­

нальной зависимости между

средним значением генеральных с о ­

вокупностей

^ X t ^

" а Р г У м е н * ° и

x t .

§ 20. Регрессионный анализ. Метод наименьших .

квадратов

Кривая

г) = у(Х)

носит название кривой регрессии.

Различают теоретическую линию регрвсоии, подразумевая под таковой истинную функциональную зависимость, существующую в

природе, и эмпирическую линию регрессии, инея в виду соотно ­

шение, устанавливаемое с помощью конкретного опытного мате­

риала. Последнюю

мы будем обозначать как

р

«

ф(х)-

Проведение

кривых через экспериментальные

точки и их

уравновешивание

относятоя к так называемому

регрессионному

анализу. Такой анализ мы будем развивать,

опираясь на прин­

цип максимального правдоподобия.

 

 

 


- т -

Итак, предположим, что в результате серии иеэаиисимых

 

 

п.

 

 

 

 

 

 

измерений

получено

£21-

эмпиричеоких

точек

,

соответствующих

п. '"'значениям

независимой переменной

Х;

( і S ї ї

N. ) , причем результаты

у.^

при /

s X «;

%i

относятся к каждой из точек

X f

 

 

 

 

 

Мы будем подразумевать,

что

общий характер

гено)>альноИ

совокупности результатов известен, т . е . известно Функциональ­

ное выражение для вероятности наблюдения

измеряемых значе­

ний,

которое мы будем обозначать

кок

 

 

 

Р(У*)*Р(УІАІ

і * J

 

(20.1)

 

Неизвестными остаются

лишь

параметры

этих

распределений,

определение которых и составляет один из

этапов

регрессион­

ного

анализа.

 

 

 

 

Вообще говоря, априорное знание вида распределения ге­

неральных совокупностей значений во многом предопределяет

характер

проведения

измерений.

Дело в том, что помимо знания

средних

значений у.

= y(*L)

крайне желательно такие

иметь представление о достоверности (точности) их определе­ ния. Только таким образом, оценивая достоверность вклада от­ дельных точек, мы и можем с наибольшим правдоподобием пост­ роить итоговую кривую регрессии.

Достоверность определения у.ш^(\.) мы можем оценить,

располагая значением генеральной дисперсии. Для пуассоновского процесса дисперсия совпадает со значением генерального среднего. Поэтому определение среднего уже позволяет оценить достоверность измерений. Напротив, для нормального распреде-


линия дисперсия находитоя с помощью специальных

оценок, от­

личных ит используемых для вычисления генерального

среднего. Следовательно, измерения величин с пуассоновским

и нормальным распределениями носят различный характер.

Поясним сказанное на следующем примере. Допустим, что

мы наблюдаем угловое рассеяние частиц на мииени.

Измерения

для некоторого фиксированного угла мы можем проводить непре­ рывно в течение всего выделенного времени 4. , поскольку

есть все основания ожидать, что процесс рассеяния является

иуиссоновскиы.

Коли в течение

этого времени

£.j

прибор

отметил

Л/.

частиц, то,

используя это число, мы можем

определить интенсивность рассеяния и его дисперсию.

 

Однако, если появились сомнения, что характер распреде­

ления в силу каких-то причин

не является уже

пуассоновоким,

то ми р'КіОии'івн полное время

tL наблюдения на ряд

интерва­

лов

 

и производим

П в

независимых из­

мерений, на основании которых и оцениваем среднюю интенсив­ ность рассеяния и его дисперсию.

Располагая

совокупностью

эмпирических точек,

составляем

функцию правдоподобия

 

 

 

 

 

 

L

=<

P f y d і ? * * * * ) -

-

( 2 0 . 2 )

 

< #i * It

 

 

 

 

 

 

Оптимизируя

функцию

L

по

. р .

, б1 . ,

получаем

для каждого из

параметров

 

п,

уравнений,

о помощью

к о т о р и х иокно наИти оценки значений этих параметров. Од­

нако, если нас

интересует

установление

функциональных со от-