Файл: Расчетнографическая работа Обработка экспериментальных данных.pdf
Добавлен: 18.03.2024
Просмотров: 21
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
30 7 Шаг - нажимаем «Пуск» и ждем, пока в графе «Название процесса» не отобразится «Успешное завершение», а в графе «Процент выполнения текущего процесса» - 100%, после чего нажимаем «Далее».
8 Шаг – ставим галочку напротив значащих факторов и выбираем порог значимости равный 0,05% .
9 Шаг – выбирая способ отображения данных, ставим галочку напротив
«Матрица корреляции. Отображение матрицы корреляции», нажимаем далее
(рисунок 32). Присваиваем имя и метку, нажимаем «Готово».
Рисунок 32 - Корреляционный анализ (выбор способа отображения данных)
В открывшемся окне отображается коэффициент корреляции (рис. 33).
Рисунок 33 - Корреляционный анализ (отображение коэффициента корреляции)
31
Для показателей P9 и P4 он равен 0,697, аналогичное значение было получено с помощью MS Excel (табл. 3). Делаем выводы, что оба приложения могут быть использованы для построения матрицы парной корреляции.
32
5 Регрессионный анализ данных
5.1 Основные понятия и определения
Регрессионный анализ используется для нахождения уравнения, которое связывает зависимую переменную (отклик) с одной или несколькими независимыми переменными (предикторами).
Суть регрессионного анализа заключается в нахождении наиболее важных факторов, которые влияю на зависимую переменную.
Коэффициент детерминации R
2
– показатель, насколько качественными являются данные, изменяется от 0 до 1 и чем ближе к 1, тем лучше регрессионная модель.
В общем виде регрессионная модель имеет вид уравнения (2):
Y = a
0
+ X
1
·a
1
+ X
2
·a
2
+...+ X
n
·a n
+ ɛ (1) где Y – зависимая переменная (отклик);
X
1
, X
2
,…X
n
– независимые переменные (регрессоры);
ɛ - ошибка, учитывающая суммарное влияние факторов на модель;
а
0
, а
1
,…а
n
- коэффициенты модели (параметры);
Таким образом, задача сводится к подбору коэффициентов a i
. Он производится методом наименьших квадратом (МНК). [6]
!!! Опишите что такое множественная регрессия, понятие порядок регрессиии, коэффициент детерминации, его назначение и содержательный смысл, содержательная интерпретация построенной модели!!!!!!!!
5.2 Линейная регрессия
5.2.1 Построение линейно-регрессионной модели
Результаты, полученные при корреляционном анализе, используем для построения линейных регрессионных моделей.
1 Шаг - на панели «Сценарии» выбираем соответствующий обработчик.
2 Шаг – в открывшемся окне для показателя P4 устанавливаем как
«Входное», для показателя P9 «Выходное», нажимаем «Далее» (рисунок 34).
33
Рисунок 34 - Линейная регрессия (выбор входных и выходных параметров)
3 Шаг – производим разбиение исходного набора данных на подмножества, нажимаем «Далее» (рисунок 35).
Рисунок 35 - Линейная регрессия (разбиение исходного набора данных на подмножества)
4 Шаг – при необходимости производим настройку диапазона выходных значений, нажимаем «Далее» (рисунок 36).
34
Рисунок 36 - Линейная регрессия (настройка диапазона выходных значений)
5 Шаг – производим настройку отбора переменных в регрессионную модель, для этого выбираем «Полное включение (Enter)», нажимаем «далее»
(рисунок 37).
Рисунок 37 - Линейная регрессия
(настройка параметров отбора переменных в регрессионную модель)
6 Шаг – запускаем процесс построения линейной модели, нажимаем «Пуск» и ждем, пока в графе «Название процесса» не отобразится «Успешное завершение», а в графе «Процент выполнения текущего процесса» - 100%, после чего нажимаем «Далее».
35 7 Шаг – способы отображения данных «Коэффициенты регрессии», «Отчет по регрессии», «Диаграмма рассеяния) отображены на рисунке 38, назначаем имя и метку, нажимаем «Готово».
Рисунок 38 - Линейная регрессия (выбор способа отображения данных)
Полученные коэффициенты регрессии отражены на рисунке 39 и в формуле
(3), но нужно помнить, что значение коэффициента корреляции не близко к 1, следовательно, гипотеза о линейности не подтвердилась.
Рисунок 39 - Коэффициенты линейной регрессии
36
P9
P4
Рисунок 40 – Модель «Линейная регрессия (1 x 1)» для показателей P4 и P9
Формула регрессии отражена в формуле (2):
???? = 0,032 − 1,467????
1
(2)
Вкладка «Отчет по регрессии» (рисунок 41) позволяет увидеть значение коэффициента детерминации, равного 0,4817. Это говорит о том, что качество регрессионной модели является низким.
Рисунок 41 - Отчет по линейной регрессии 1x1
Далее выполним построение модели «Линейная регрессия 2x1» для показателей P4, P9 и P11. Выполним предыдущие шаги, описанные выше, для этой модели и сравним результаты.
Полученные коэффициенты регрессии отражены на рисунке 42 и в формуле
(3), но нужно помнить, что значение коэффициента корреляции не близко к 1, следовательно, гипотеза о линейности не подтвердилась.
37
Рисунок 42 - Коэффициенты линейной регрессии
P9
P4
P11
Рисунок 43 – Модель «Линейная регрессия (2 x 1)» для показателей P4, P9 и P11.
Формула регрессии отражена в формуле (3):
???? = 0,032 − 1,437????
1
− 1,927????
2
(3)
Вкладка «Отчет по регрессии» (рисунок 44) позволяет увидеть значение коэффициента детерминации, равного 0,481. Это говорит о том, что качество регрессионной модели является низким.
38
Рисунок 44 - Отчет по линейной регрессии 2x1
Существенность вклада переменной в объясняющую способность регрессионной модели определяется величиной значимости. Данное значение для переменной P11 не сумело превысить требуемый уровень t-критерия, ввиду чего соответствующий признак "Ток электродинамической стойкости" нельзя признать значимым. Иначе говоря, следует принять гипотезу, требующую не включать рассматриваемую переменную в модель с вероятностью 1−α правильности этого решения.
Вкладка
«Диаграмма рассеяния» позволяет графически увидеть распределение данных согласно регрессионной модели (рисунок 45). Прямая диагональная синяя линия представляет собой ориентир (линию идеальных значений). Чем ближе точка к этой линии, тем меньше ошибка модели. Также на диаграмме рассеяния отображаются две пунктирные линии – верхняя и нижняя границы доверительного интервала. Его ширина определяется допустимой ошибкой, которая вводится в поле «Ошибка». Если она (величина в столбце
<Имя_поля>_ERR) меньше допустимой, то точка попадает в доверительный интервал.
39
Рисунок 45 - Диаграмма рассеяния линейной регрессии
Вид построенной диаграммы рассеяния говорит о том, что лишь незначительная часть данных лежит в пределах регрессионной модели. Ввиду этого не целесообразно строить нелинейную регрессию, так как расположение данных не обеспечит достоверной регрессионной модели.
!!!! Дайте содержательную интерпретацию построенных моделей!!!!!
40
Заключение
В рамках данной работы было необходимо провести обработку полученных экспериментальных данных.
Под «данными» понимаются фиксированные воспринимаемые факты окружающего мира. В работе в качестве данных были использованы результаты исследований 16-ти показателей 50-ти образцов высоковольтных выключателей
110 кВ, они были сведены в матрицу данных.
Информация используется при решения конкретных задач, когда известен метод преобразования данных. Знания – результаты решения задач, истинная информация, обобщенная в виде законов, теорий, совокупностей взглядов и представлений. Исходя из определения, можем сделать вывод, что каждый примененный метод позволил получить некоторые знания об этой совокупности образцов выключателей.
Например, корреляционный анализ позволил определить взаимосвязи между каждой парой показателей, которые в большинстве своем оказались слабыми (максимальное значение 0,697).
Регрессионный анализ позволил определить, что между показателя P4 и P9, которые имели самое высокое значение коэффициента корреляции, нет линейной связи и связи более высокого порядка.
Все эти методы позволили установить новые связи и закономерности, существующие в полученной экспериментальным путем базе данных. ПАП
«Deductor» доступная и простая в использовании, а также позволяет решать сложные задачи, связанные с обработкой больших объемов информации.
41
Список использованных источников
1 ГОСТ Р 52565-2006 "Выключатели переменного тока на напряжения от 3 до 750 кВ. Общие технические условия"
2 http://www.zeto.ru
3 http://forca.ru
4 http://www.vsoyuz.com
5Бююль А. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль, П. Цёфель. –
Москва::DiaSoft, 2002. – 605 с.
6 Дорогонько, Е.В. Обрабтка и анализ социологически данных с помощью пакета SPSS: учебно-методическое пособие / Е.В. Дорогонько. – Сургут:
Издательский центр СрГУ, 2010. – 60 с.
!!!! Список использованных источников не менее десяти! Оформление в соответствии с требованиями!!!!!