Файл: Краткое содержание 1 Введение. Основные определения и понятия.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.05.2024
Просмотров: 65
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
20
задание количества значений каждого фактора, которые он будет принимать.
Каждое такое значение называется уровнем фактора. Обычно факторы имеют от 2 до 3 уровней, планы первого порядка изменяются на 2-х уровнях;
расчет уровней факторов, а именно верхнего и нижнего уровня для линейных моделей.
Но чтобы определить эти уровни, целесообразно задать нулевой уровень. Это исходная точка для построения плана, иногда ее называют центром плана. Чтобы найти верхний уровень необходимо к нулевому уровню прибавить интервал варьирования, и наоборот, для нахождения нижнего уровня необходимо из нулевого уровня вычесть интервал варьирования. Удвоенная величина интервала варьирования есть диапазон изменения
фактора.
Для упрощения записи плана, построения и анализа модели целесообразно избавиться от размерности факторов, т.е. привести их значения к одному диапазону от -1 (минимум) до
+1 (максимум).
Для факторов с непрерывной областью определения это делается с помощью следующих преобразований:
Прямое
(кодированное) ,
Обратное
(декодированное) , где:
,
Например, значения фактора изменяются от 1 до 10:
В результате таких преобразований переходим от системы координат в натуральных значениях факторов к новой безразмерной системе.
Рассмотрим построение полного факторного эксперимента типа 2
k
Количество опытов в плане (N) рассчитывается по следующей формуле N = 2
k
, где к – количество факторов.
Значения факторов задаются на 2-х уровнях: минимальном (-1) и максимальном (+1).
Эксперимент, в котором реализованы все возможные сочетания уровней факторов, называется полным факторным экспериментом.
Условия эксперимента записываются в виде таблицы, которая называется матрицей
планирования эксперимента.
Матрица планирования для 2-х факторного эксперимента будет выглядеть следующим образом (табл. 1).
Таблица 1
Матрица планирования 2-х факторного эксперимента 1-ого порядка
Номер опыта
X
1
X
2
y
1
-1
-1
Y
1 2
-1
+1
Y
2 3
+1
-1
Y
3 4
+1
+1
Y
4
Здесь представлены все сочетания уровней факторов. Каждый столбец называется вектор-столбцом, а каждая строка вектор-строкой.
В представленной матрице имеются две вектор-столбца независимых переменных
(факторов) и один - зависимой переменной (отклик).
21
Графически такой план можно представить в виде точек в 2-х факторном пространстве, соответствующих вершинам квадрата в плоскости исследуемых переменных x
1 и x
2,
центром которого является начало координат для кодированных значений факторов (рис.
2).
Рис. 2. Графическое представление 2-х факторного эксперимента 1-ого порядка
Существует три наиболее распространенных приема построения матрицы.
1. Используется правило чередования знаков. В последнем или первом; столбце знаки меняются черев 1 строку, в следующем столбце через 2 строки, далее через 4 и т.д.:
N
x
1
x
2
x
3
y
1
-1
-1
-1
Y
1 2
-1
-1
+1
Y
2 3
-1
+1
-1
Y
3 4
-1
+1
+1
Y
4 5
+1
-1
-1
Y
5 6
+1
-1
+1
Y
6 7
+1
+1
-1
Y
7 8
+1
+1
+1
Y
8 2. Второй прием основан на том, что при достраивании нового фактора (например, от
2-х факторного плана) каждая комбинация уровней исходной матрицы встречается дважды в сочетании с нижним (-1) и верхним (+1) уровнями нового фактора, т.е. первые 2 столбца идентично повторяются, а последний столбец изменяется для половины опытов на нижнем (-
1) уровне, а для другой половины – на верхнем уровне (+1):
N
x
1
x
2
x
3
y
1
-1
-1
-1
Y
1 2
-1
+1
-1
Y
2
N x
1
x
2
x
3
Y
3 3
+1
-1
-1
Y
4 4
+1
+1
-1
Y
5 5
-1
-1
+1
Y
6 6
-1
+1
+1
Y
7
22
N
x
1
x
2
x
3
y
7
+1
-1
+1
Y
8 8
+1
+1
+1
Y
1 3. Достройка k-факторного плана до более высокого порядка (например, 2-х факторного до 3-х факторного) осуществляется перемножением всех столбцов матрицы в исходном плане друг на друга, и в последующий столбец заносятся результаты данного перемножения для первой половины опытов, а для второй половины эти результаты берутся с обратным знаком:
N
x
1
x
2
x
3
y
1
-1
-1
+1
Y
1 2
-1
+1
-1
Y
2 3
+1
-1
-1
Y
3 4
+1
+1
+1
Y
4 5
-1
-1
-1
Y
5 6
-1
+1
+1
Y
6 7
+1
-1
+1
Y
7 8
+1
+1
-1
Y
8
Геометрическая интерпретация полного факторного эксперимента 2
k
представляет собой гиперкуб, центром которого является центр области экспериментирования. Например, для 3-х факторного эксперимента это будет куб (рис. 3).
Рис. 3. Графическое представление 3-х факторного эксперимента
Опыты соответствуют вершинам куба и пронумерованы для матрицы, составленной по 1-ому правилу.
В результате проведения эксперимента в соответствии с построенной матрицей строится полиномиальная модель вида: где k– количество рассматриваемых факторов.
23
Расчет коэффициентов полиномиальных моделей. Для построения полиномиальных моделей необходимо выполнить следующие условия:
1. Отклик y должен быть случайной величиной, распределенной по нормальному закону. Гипотезу о нормальности распределения y можно проверить стандартными методами.
2. Дисперсия величин y не должна зависеть от абсолютной величины y. Это условие проверяется с помощью критериев однородности дисперсии в разных точках факторного пространства.
3. Значения факторов не должны быть случайными величинами. Это условие означает, что фиксация и поддержание каждого фактора на заданном уровне осуществляется с точностью меньше ошибки воспроизводимости результатов.
Расчет коэффициентов, чаще всего, осуществляется методом регрессионного анализа на основе матричной алгебры. При этом осуществляется минимизация невязок истинных значений функции отклика y (экспериментальных данных) и значений y, предсказанных с помощью модели (расчетные данные). Для этого используется какая-либо целевая функция, например (чаще всего), сумма квадратов отклонения расчетных и экспериментальных значений откликов (метод наименьших квадратов): где i - номер опыта (в случае без дублирования опытов);
– расчетные (предсказанные) значения отклика;
– экспериментальные значения отклика.
Одномерная линейная регрессия и корреляция. Любой технологический процесс может быть охарактеризован определенным числом факторов или входных параметров, которые в различной мере влияют на выходные параметры, т.е. на качественные или количественные характеристики продукта, получаемые в ходе реализации процесса.
Целью моделирования любого технологического процесса является установление количественной зависимости выходного параметра какого-либо процесса от одного или группы входных факторов в условиях колеблемости значений входных и выходных параметров, обусловленной влиянием случайных и в большинстве своем не поддающихся учету факторов.
Мера зависимости и взаимного влияния случайных величин оценивается связью, называемой корреляционной. Корреляция между парой переменных называется парной.
Измеряет степень линейных связей между переменными коэффициент корреляции Пирсона
r. Значение коэффициента корреляции r не зависит от масштаба измерения. Коэффициенты корреляции изменяются в пределах от -1,00 до +1,00. Значение -1,00 означает, что переменные имеют строгую отрицательную корреляцию (при возрастании значений одной из них значения другой убывают). Значение +1.00 означает, что переменные имеют строгую положительную корреляцию (когда значения одной переменной возрастают, значения другой переменной также возрастают). Значение 0,00 означает отсутствие корреляции.
Если между независимой (входной) величиной x и зависимой (выходной) величиной y имеется или предполагается корреляционная связь, то ее можно оценить и исследовать с помощью методов регрессионного анализа.
Рассмотрим линейную регрессию от одного параметра. Пусть для произвольного фиксированного значения x получено несколько значений у переменных в пределах областей их определений. При статистической обработке экспериментальных данных предполагается, что зависимость выхода у входных факторов x линейна и имеет вид:
1 0
x
b
b
y
(2)
В этом уравнении коэффициенты регрессии (или B-коэффициенты) представляют независимые вклады каждой независимой переменной в зависимую переменную. Однако, их значения не сравнимы, поскольку зависят от единиц измерения и диапазонов измерения соответствующих переменных.
24
Диаграмма рассеяния визуализирует зависимость между двумя переменными x и y
(рис. 4). Данные изображаются точками в двумерном пространстве, где оси соответствуют переменным x – горизонтальной, а y – вертикальной оси. Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленная по оси y) от наблюдаемых точек до прямой является минимальной из всех возможных:
1 1
0
n
i
i
i
x
b
b
y
(3)
Рис. 4. Корреляционное поле зависимости y = f (x)
Если возвести в квадрат коэффициента корреляции R, то полученное значение R
2
(коэффициент детерминации) выражает количество дисперсии, общей между двумя переменными (иными словами, представляет "степень" зависимости или связанности двух переменных). Величина R
2
, называемая также мерой определенности, характеризует качество полученной регрессионной прямой. Это качество выражается степенью соответствия между исходными данными и регрессионной моделью (расчетными данными). Мера определенности всегда находится в пределах интервала [0;1]. Значения коэффициента детерминации близкие к единице, говорят о хорошем приближении линии регрессии к наблюдаемым данным и о возможности построения качественного прогноза. Например, значение R
2
, равное 0,6, говорит об относительно хорошей подгонке регрессионной прямой к исходным данным, хотя косвенно свидетельствует и о большом количестве неучтённых факторов.
Чтобы оценить зависимость между переменными, нужно знать, как "величину" корреляции, так и ее значимость. Уровень значимости, вычисленный для каждой корреляции, представляет собой главный источник информации о надежности корреляции.
Обычно в статистике используют уровень надежности или доверия равным 95 %, что означает, что событие вероятность которого составляет 1-0,95 = 0,05 исследователь считает маловероятным или невозможным. Уровень значимости обозначается греческой буквой α.
Значимость проверяется по показателям t-статистики (критерий Стьюдента) и F-статистики
(критерий Фишера).
F-статистикой проверяется гипотеза о том, что коэффициенты регрессии одновременно равны нулю b
0
= 0 и b
1
= 0. Иначе, ответить на вопрос: можно ли уравнение регрессии использовать для дальнейшего анализа и прогнозов?
Фактическое значение критерия Фишера:
(4) где m – число факторов в модели; n – число наблюдений. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости или через функцию
Excel FРАСПОБР(вероятность;m;n-m-1). Если фактическое значение
F-статистики превосходит ее критическое табличное значение F > F
кр
, то гипотеза о равенстве b
0
= 0 и b
1
=
0 отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент коэффициент значимо отличается от нуля.
25
Проверка значимости отдельных коэффициентов уравнения регрессии производится с помощью критерия Стьюдента, определяемого как отношение найденного значения коэффициента к стандартной ошибке оценки коэффициента. Их необходимо сравнить с критическим значением t
кр
, найденным для уровня значимости α = 0,05 и числа степеней свободы f = n-m-1. Для этого можно использовать таблицы математической статистики или встроенную статистическую функцию Excel СТЬЮДРАСПОБР(вероятность; n-m-1). Если наблюдаемые значения t-статистики больше критического значения по модулю | t
b0
| или | t
b1
|
> t
кр
, то коэффициенты значимы, в противном случае с вероятностью ошибки, равной 0,05 коэффициенты не значимы.
Также значимость коэффициентов проверяют по «p-значению». Если «р-значение» меньше 0,05, то с вероятностью 95 % можно считать, что соответствующий коэффициент модели значим (т.е. его нельзя считать равным нулю и y значимо зависит от соответствующего х).
Интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности 95 % показывают, что если нижние и верхние границы имеют одинаковый знак
(ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае – незначимым
При рассмотрении множественной регрессии, согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, после первичного анализа необходимо исключить из рассмотрения переменную, имеющую незначимый коэффициент регрессии. В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t- статистика минимальна по модулю.
Значимость определенного коэффициента корреляции зависит от объема выборок.
Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной y является нормальным (с постоянной дисперсией для всех значений независимой переменной x).
Так как при построении прямой регрессии используется сумма квадратоврасстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента корреляции. Поэтому единичный выброс
(значение которого возводится в квадрат) способен существенно изменить наклон прямой и, следовательно, значение корреляции. Если размер выборки относительно мал, то добавление или исключение некоторых данных (которые, возможно, не являются "выбросами", а экстремальными значениями) способно оказать существенное влияние на прямую регрессии
(и коэффициент корреляции). Выбросы могут не только искусственно увеличить значение коэффициента корреляции, но также реально уменьшить существующую корреляцию.
Обычно считается, что выбросы представляют собой случайную ошибку, которую следует контролировать. К сожалению, не существует общепринятого метода автоматического удаления выбросов. Чтобы не быть введенными в заблуждение полученными значениями, необходимо проверить на диаграмме рассеяния каждый важный случай значимой корреляции.
Вопросы для самоконтроля
1. В каких случаях прибегают к построению статистических моделей?
2. 2 На чем базируется построение статистических моделей?
3. 3 Каков общий вид статистических моделей?
4. 4 Приведите два вида эксперимента, используемые для построения статистических моделей.
5. 5 В чем разница между пассивным и активным экспериментом?
6. 6 Для чего проводят корреляционный анализ?
8 Какова основная характеристика корреляционного анализа?
9 Какова суть регрессионного анализа?
26 10 Перечислите виды регрессии, привести примеры.
11 Назовите метод, применяемый для оценки коэффициентов уравнения регрессии.
12 Какова последовательность статистического (регрессионного) анализа?
Литература
1 Шорохова, И.С. Статистические методы анализа: учебное пособие / И.С.
Шорохова, Н.В. Кисляк, О.С. Мариев ; Министерство образования и науки Российской
Федерации,Уральский федеральный университет им. первого Президента России Б. Н.
Ельцина. - 2-е изд., стер. - Москва: ФЛИНТА: УрФУ, 2017. - 301 с. : табл., граф., схем. - ISBN
978-5-9765-3279-3. - ISBN 978-5-7996-1633-5 (Изд-во Урал. ун-та); То же [Электронный ресурс]. - URL:
http://biblioclub.ru/index.php?page=book&id=482354 2 Дворецкий С.И. Моделирование систем: учебник для вузов /С.И. Дворецкий, Ю.Л.
Муромцев, В.А. Погонин, А.Г. Схиртладзе. - Москва: ИЦ "Академия", 2009. - 316 с.
3 Методические указания к практическим занятиям по курсу "Основы научных исследований": учебно-методическое пособие по спец.150106 Обработка металлов давлением / Сост. Н.Л. Болобанова. - Череповец: ГОУ ВПО ЧГУ, 2005. - 26 с. - Библиогр:
С.24-25.
–
URL: https://edu.chsu.ru/portal/site/2b8bf354-4354-4064-b37d- c969252342ef/page/1aaee60d-6db4-46d2-a887-082c586466be
1 2 3 4 5 6