Файл: Горюшко, В. Е. Планирование эксперимента в бытовой химии [обзор].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 01.11.2024
Просмотров: 34
Скачиваний: 0
или |
(1.5) |
Известно, что lims — а.
П-> оо
Относительная величина средней квадратичной ошибки, выра женная в процентах, называется коэффициентом вариации. Для его расчета используется формула
№ = 4 -100% .
Если случайные ошибки играют большую роль в измерении, все оценки точности измерения можно сделать лишь с некоторой ве роятностью. Пусть а означает вероятность того, что результат из мерений отличается от истинного значения не больше чем на Ах. Запишем это условие в виде
Р ( х ~ Ах<^ р. Дх) = а, (1.6)
где Р — обозначение вероятности;
А л:= х — р.
Доверительную вероятность а называют также коэффициентом надежности, величину Дх — доверительным интервалом. Чем боль шим доверительным интервалом мы задаемся, тем. вероятнее, что результаты измерений не выйдут за его пределы.
Таким образом, для характеристики случайной ошибки, поми мо ее величины, надо знать величину а.
При технических измерениях, как правило, ограничиваются до верительной вероятностью 0,95, соответствующей удвоенной сред ней квадратичной ошибке 2о. Средней квадратичной ошибке а со ответствует а = 0,68, утроенной средней квадратичной ошибке За соответствует а = 0,997.
Отсюда следует известное «правило трех сигм», которое заклю чается в том, что в случае нормального распределения 99,7% всех измерений укладываются в интервал р±30, т. е.
Р ({1 - 3= < х < I» + Зз) = 0,997.
Однако это правило действует при достаточно большом числе измерений (практически для н>30). При меньшем числе измере ний выборочная оценка х существенно отличается от истинного среднего значения ц.
Общеизвестно, что увеличение числа измерений повышает точ ность среднего арифметического. Средняя квадратичная погреш ность среднего арифметического равна средней квадратичной по грешности отдельного измерения, деленной на корень квадратный из числа измерений [2]:
ш
Условия практических исследований, как правило, не позволя ют затрачивать много времени и средств на проведение обширных исследований р и о.
Если же при оценке доверительной вероятности считать, что выборочное значение s совпадает с а, то по кривой нормального распределения будут найдены завышенные значения доверитель
ной вероятности а.
Чтобы пользоваться формулой (1.6) при малом числе парал лельных определений п, принимают
дX= taf—^ ,
У п
где taf — коэффициент Стыодента (см. Приложение 2). При большом числе измерений
Дд:= |
xi |
/ п ’ |
где s = —— доля средней квадратичной ошибки. Ол-
В этом случае a s —>а. Перепишем (1.6) в виде
\ |
У п |
У п 1 |
(1-7)
(I. 8)
(I. 9)
Уменьшить случайную ошибку можно, уменьшив дисперсию еди ничного измерения или увеличив число параллельных определений.
Первый путь связан с совершенствованием техники измерений. Если это невозможно или нежелательно, применяют второй путь.
Рассмотрим практический пример на изложенный материал. Один и тот же эксперимент по определению глубины сульфати-
рования проводили в разные дни. Сырье и условия эксперимента не изменялись. Были получены следующие результаты: 81,45, 63,95, 70,70, 67,11%.
Для обработки экспериментальных данных применим способ, автоматически контролирующий правильность расчетов. Исходные данные и промежуточные выкладки представлены в табл. 1.1.
|
|
|
|
|
Т а б л и ц а 1.1 |
|
№ |
X i |
X i — X 0 |
(xi- х о)2 |
х ~ х ' 0 |
(х-—х о)2 |
|
п/п |
||||||
|
|
|
|
|
||
1 |
81,45 |
11,45 |
131,10 |
6,45 |
41,60 |
|
2 |
63,95 |
—6,05 |
36,60 |
—11,05 |
122,10 |
|
3 |
70,70 |
0,70 |
0,49 |
—4,30 |
18,49 |
|
4 |
67,11 |
- 2 , 8 9 |
8,35 |
- 7 , 8 9 |
62,25 |
|
|
V |
3,21 |
176,54 |
—16,79 |
244,44 |
|
|
|
Равенство х и х/, s2 и s'2 свидетельствует о правильности произ веденных расчетов:
|
|
я |
П |
|
|
1 „ |
|
( X : — Х п ) 2 — — |
Л А |
( X l - Х 0) 2 |
|
|
п |
|
|||
x = x n- \ - ^ 2 ^ { X i — x 0\ sl = - ^ -------- |
|
|
|||
Т«1 |
п — 1 |
|
|
||
|
|
|
|||
х = 7 0 + — |
= 70,80, |
176,54- |
3,212 |
||
|
: 57,99, |
||||
s- = |
|
||||
|
|
|
|||
|
|
4 — 1 |
|
||
|
|
16,792 |
|
||
х ' = 75 - ^ Z ? = 70,80; |
244,44 |
4 |
|
||
$'2 |
57,99. |
||||
4 |
|
|
|||
|
|
4 — 1 |
|
|
|
Обычно за |
х0 принимают число, наиболее близкое к среднему |
арифметическому. Нами для контроля расчета выбраны значения
70 и 75.
Выборочная средняя квадратичная ошибка, т. е. ошибка отдель ного измерения, характеризующая метод получения данных,
s =1/57,99 = 7,62.
Средняя квадратичная ошибка среднего арифметического
7,62
3,81.
/ 4
Коэффициент Стьюдента для четырех измерений при довери тельной вероятности 0,95 равен 3,2.
В таблицах ^-критерий определяется по числу степеней свобо ды /. В нашем случае f = n—1, поскольку одна степень свободы ис пользуется при определении среднего значения.
Таким образом, можно записать:
д х = + - ^ = 3,2-3,81 =12,2
Р (70,8012,2 < [а< 70,80+ 12,2) = 0,95.
При большом числе измерений экспериментальные данные груп пируют по классам с равномерным интервалом, который определя ется по формуле Стерджесса [3, 4]
^ . |
ХП Х\ |
(I. 10) |
|
'х ' ~ |
1 + 3,3221g п ’ |
||
|
|||
где х\ и хп — соответственно |
минимальное и максимальное значе |
ния в выборке.
Рассмотрим данные о моющей способности порошкообразного СМС,, приведенные в табл. 1.2.
12
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица |
1.2 |
|
Зоны |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
9 |
10 |
и |
12 |
13 14 |
15 |
|
|
|
|
|
|
С т и р к a |
I |
|
|
|
|
|
|
||
а |
43,4 |
40,3 |
39,6 |
42,1 |
39,9 |
38,4 |
34,3 |
29,9 |
30,4 |
37,5 |
38,5 |
44,5 |
40,2 39,7 39,5 |
||
с |
44,9 |
40,2 |
40,9 |
42,2 |
39,4 |
38,8 |
34,9 |
32,0 |
34,3 |
40,0 |
37,7 |
44,5 |
40,0 38,3 40,2 |
||
в |
44,6 |
42,4 |
40,8 |
43,6 |
41,9 |
40,6 |
38,4 |
35,3 |
37,8 |
37,7 |
37,8 |
44,7 |
41,0 38,9 39,5 |
||
|
|
|
|
|
|
С т и р к a |
II |
|
|
|
|
|
|
а 40,3 41,6 38,5 43,7 39,7 41,6 36,3 30,8 38,6 40,6 45,4 38,3 41,1 43,2 39,2
б45,0 41,8 41,7 41,2 37,0 40,7 35,7 32,0 38,6 41,1 43,2 39,8 41,6 43,9 40,6
в48,6 43,0 42,5 42,1 37,9 41,7 32,3 32,3 37,3 41,3 43,6 42,7 38,9 42,1 37,6
|
|
|
|
|
|
Таблица |
1.3 |
|
Номер |
Интервалы |
|
|
|
|
|
|
|
интерва |
|
|
|
|
|
|
||
группиро |
|
|
|
|
|
|
||
ла груп |
-*+ % |
k |
mi |
km-i |
к2 |
k^rtii |
||
вания, |
||||||||
пирова |
% |
|
|
|
|
|
|
|
ния |
|
|
|
|
|
|
||
1 |
2 9 ,9 -3 2 ,3 |
31,1 |
- 4 |
7 |
- 2 8 |
16 |
112 |
|
2 |
3 2 ,3 -3 4 ,7 |
33,5 |
- 3 |
2 |
—6 |
.9 |
18 |
|
3 |
34,7—37,1 |
35,9 |
- 2 |
5 |
— 10 |
4 |
20 |
|
4 |
3 7 ,1 -3 9 ,5 |
38,3 |
—1 |
24 |
—24 |
1 |
24 |
|
5 |
3 9 ,5 - 4 1 ,9 |
40,7 |
0 |
30 |
0 |
0 |
0 |
|
6 |
41,9—44,3 |
43,1 |
+ 1 |
14 |
+ 14 |
1 |
14 |
|
7 |
4 4 ,3 -4 6 ,7 |
45,5 |
+ 2 |
7 |
+ 14 |
4 . |
28 |
|
8 |
4 6 ,7 -4 9 ,1 |
47,9 |
+ 3 |
1 |
+ 3 |
9 |
9 |
В нашем случае dx= 2,4.
Исходные данные и вспомогательные величины для расчета эм пирических характеристик распределения моющей способности представлены в табл. 1.3.
За середину классов принимается х ;0=40,7. Номера классов определяются по формуле
Выборочное среднее
_ |
р |
|
|
^ |
m-fi |
|
|
^ = — |
----- 4г + **„, |
(1.11) |
|
|
|
п |
|
2045 |
аз |
где р — число интервалов группирования.
В рассматриваемом случае |
|
|
|
|||
|
х = - |
— -2,4 + 40,7 = |
39,71. |
|
|
|
|
|
90 |
|
|
|
|
Выборочная дисперсия |
|
|
|
|||
2 |
v |
щк |
|
|
|
|
|
2,42 |
|
-372 |
|
||
dx |
m;k2 — ' /=1 |
225 - |
= 13,43. |
|||
~1ю~ |
90 |
|||||
|
/=1 |
|
|
|||
|
|
|
|
|
(I. 12)
Оценка среднеквадратичного отклонения единичного измерения s = 3,66. Оценка коэффициента вариации
W = 5 : т = 0,0923 = 9,23%.
Доверительный интервал для среднего значения моющей спо собности порошка на основании 90 измерений
Д* = W > -4 = -= 1,99 |
-0 ,7 7 . |
|
у |
п |
У 90 |
Отсюда |
|
|
Р (39,71 - 0,77 < |
р < 39,71 + 0,77) = 0,95. |
Если оценка средней квадратичной ошибки единцчного измере ния известна из более ранних исследований, ее удобно применять для оценки доверительного интервала.
Ясно, например, что для оценки моющей способности препарата 90 измерений производиться не будет.
Определим доверительный интервал при шести измерениях,
пользуясь t (а = 0,95, п = 90) |
= 1,99 и 5= 3,66. |
||
В этом случае |
1,99-3,66 |
|
|
дэс |
2,97, |
||
/ 6 |
|||
|
|
что составляет 7,5% от х.
Это значит, что моющее действие препарата при шести измере ниях с вероятностью Р = 0,95 находится в пределах 39,71 ±2,97.
Если бы доверительный интервал определяли только из шести измерений, ошибка определения истинного значения х оказалась бы гораздо выше:
д± |
2,57-3,66 |
3,83. |
|
/ 6 |
|||
|
|
Можно ставить вопрос несколько иначе: какое число измерений требуется, чтобы ошибка с надежностью 0,95 была равна единице?
Для данного случая (Дх=1) запишем
Дл: ’
14
откуда
я = (1,99-3,66)2 = 53.
Для 1хх=2
1,99-3,66
2
Следует отметить, что увеличением числа измерений можно уст ранить случайную ошибку только в том случае, если средняя квад ратичная погрешность в несколько раз превосходит систематиче скую ошибку. В других случаях проще принципиально изменить методику, чем увеличивать число определений.
Итак, в настоящей главе внимание исследователя было обраще но на то, что ошибки при проведении экспериментов практически неизбежны. Введены понятия систематических и случайных оши бок; чтобы исключить влияние систематических ошибок, опыты рекомендовано рандомизировать во времени. Рассмотрено нормаль ное распределение ошибок, введены понятия среднего значения случайной величины, средней квадратичной ошибки, доверительной вероятности, доверительного интервала. Особое внимание уделено путям уменьшения случайной ошибки. Приведены примеры по группировке результатов эксперимента, оценке выборочного среднего и дисперсии, определения доверительного интервала при различном количестве измерений. Рассмотрен вопрос выбора числа измерений, необходимых для получения заданной точности.
Г Л А В А II
ДИСПЕРСИОННЫЙ АНАЛИЗ
1. Дисперсионный анализ результатов наблюдений
Влияние систематических и случайных погрешностей на резуль таты измерений в процессе исследования физических и химических явлений изучают, применяя статистические методы обработки экс периментальных данных. Одним из наиболее эффективных методов является дисперсионный анализ.
Метод дисперсионного анализа заключается в разложении об щей дисперсии на составляющие, обусловленные действием отдель ных независимых факторов, как количественных, так и качест венных.
На первых этапах исследования большую роль играют качест венные факторы (способы измерения и обработки результатов, тех нологические приемы, применяемые аппараты, приборы и т. д.), которые не могут быть измерены по непрерывной шкале.
Метод основан на аддитивности дисперсий, т. е. равенстве пол ной дисперсии данного показателя сумме составляющих ее част ных дисперсий:
(П.1)
Как известно, применение дисперсионного анализа правомерно для нормально распределенной выборки при однородности диспер сий измерений (3—5].
В случае однофакторного дисперсионного анализа суммарную дисперсию разлагают на дисперсию воспроизводимости и диспер сию, обусловленную изменением одного фактора. Общее количест во опытов определяется числом уровней фактора т и числом па раллельных определений п. Результаты эксперимента оформляют ся в виде табл. II.1.
По данным полученной таблицы вычисляют суммы квадратов:
пт
(II. 2)
15