Файл: Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 28.03.2024
Просмотров: 25
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Министерство образования и науки РФ
Федеральное государственное автономное образовательное
учреждения высшего образования
«Национальный исследовательский технологический университет «МИСиС»
Институт информационных технологий и компьютерных наук
Кафедра бизнес-информатики и систем управления производством
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
к выполнению раздела КНИР1
по курсу «Анализ данных и аналитика в принятии решений»
Направление подготовки: 38.03.05 Бизнес-информатика
Профиль: Архитектура предприятия и
Направление подготовки:38.03.03 Прикладная информатика
Профиль: Прикладная информатика в экономике
Семестр 5
Согласованно: | | Утвердил: |
Консультант по анализу данных Доцент каф. БИСУП Баздарева З.В. | | Руководитель программы обучения, зав.кафедрой БИСУП Пятецкий В.Е |
Подпись: _________ | | Подпись: _________ |
| Москва 2021 | |
| | |
Содержание
-
Цели и задачи раздела КНИР1 по курсу «Анализ данных и аналитика в принятии решений»…………………………………………………………...................................3 -
Постановка задачи раздела КНИР1 с полным набором числовых данных…………3 -
Методы анализа информации и прогнозирования показателей функционирования систем……………………………………………………………………………………4
-
Множественная регрессия………………………………………………………….4
3.1.1.Отбор факторов для построения множественной регрессии……………….4
3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов……………………………………………………………….5.
3.1.3.Прогнозирование на основе разработанной эконометрической модели….5
3.1.4 Примеры к разделу 3.1……………………………………………………….5
3.2 Временные ряды…………………………………………………………………….12
3.2.1. Задачи анализа временных рядов……………………………………………12
3.2.2. Пример к разделу 3.2…………………………………………………………13
3.2.3. Анализ аддитивной и мультипликативной моделей временных
рядов……………………………………………………………………………………………17
3.3 Дисперсионный анализ информации……………………………………………….22
3.3.1. Однофакторный дисперсионный анализ……………………………………..22
3.3.2. Примеры к разделу 3.2………………………………………………………. 23
3.3.3. Двухфакторный дисперсионный анализ……………………………………..27
3.4 Кластерный анализ…………………………………………………………………...27
-
Заключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»..28 -
Библиографический список……………………………………………………………...28
1. Цели и задачи раздела КНИР1 «Анализ данных и аналитика в принятии решений»
-
Получение информации о показателях состояния и эффективности исследуемого объекта, бизнес-процесса, системы, предприятия по имеющимся статистическим данным; -
Выявление на фоне случайных отклонений основных закономерностей, присущих исследуемому объекту, бизнес-процессу, рынку, исходя из накопленной информации; -
Количественная оценка факторов, влияющих на исследуемые результативные экономические показатели; -
Построение модели исследуемого бизнес-процесса или системы; -
Количественная оценка показателей модели; -
Интерпретация результатов анализа данных; -
Оценка достоверности и точности модели и, получаемых на её основе, выводов и заключений. -
Выводы на основе полученных результатов с рекомендуемыми управленческими решениями
2. Постановка задачи раздела КНИР1
Реальная бизнес статистика в качестве отдельного наблюдения содержит как исследуемый показатель Y, так и значения тех факторов, для которых соответствующее значение Y было зафиксировано. В разделе должна быть дана ссылка на сайты из которых собрана информация для анализа
Требуется обработать данные о показателях исследуемого бизнес-процесса или системы, выявить существующие закономерности для того, чтобы в дальнейшем прогнозировать результативные экономические показатели с требующейся достоверностью. Для этой цели использовать модель множественной регрессии или (и) модели временных рядов: аддитивного или мультипликативного, в зависимости от исходной информации. Для систематизации и группировки данных, например, когда требуется определить наиболее эффективные методы управления персоналом, следует ставить задачу и использовать методы дисперсионного и(или) кластерного анализа.
3. Методы анализа информации и прогнозирования показателей функционирования систем
3. 1. Множественная регрессия
Подробно построение множественной и парной линейной и нелинейной регрессии изложено в [2], [3].
3.1.1. Отбор факторов при построении множественной регрессии.
Отбор факторов производится на основе качественного теоретико-экономического анализа и обычно осуществляется в две стадии:
– на первой стадии факторы подбираются исходя из сущности проблемы;
– на второй стадии применяются формальные статистические критерии
№ наблюдения | Y | Х1 | Х2 |
| | | |
Таблица 1
Факторы Х1 и Х2 и др. не должны быть взаимно коррелированы. По исходным данным вычисляется матрица выборочных парных коэффициентов корреляции и выявляются пары переменных, имеющих высокие коэффициенты корреляции. Если такие переменные существуют, то говорят о мультиколлинеарности между ними.
В уравнение регрессии, как правило, включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.
После исключения коллинеарных факторов осуществляется процедура отбора факторов
, наиболее влияющих на изменение результативного признака (факторов, включаемых в регрессию). Ранжирование факторов выполняется на основе значений частных коэффициентов корреляции.
Значимость факторов, включенных в уравнение регрессии, проверяется с помощью частного критерия Фишера.
Кроме точности модели, для исследователя наиболее важными качествами модели являются простота модели и возможность наглядной интерпретации параметров модели.
По этой причине наиболее широко используются линейная и степенная модели.
3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов
Для оценки параметров уравнения множественной регрессии применяется метод наименьших квадратов (МНК), в EXCEL можно использовать также надстройку АНАЛИЗ ДАННЫХ.
Величина коэффициента детерминации используется для оценки качества регрессионной модели. Чем его величина больше, тем лучше данная модель согласуется с данными наблюдений.
Низкое значение коэффициента (индекса) множественной корреляции означает, что, либо в регрессионную модель не включены существенные факторы, либо рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.
Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера. Статистическая значимость коэффициентов уравнения множественной регрессии и интервальная оценка параметров уравнения производится с помощью t-критерия Стьюдента.
Оценки параметров, полученные МНК, являются эффективными только при выполнении предпосылок МНК. После построения модели следует вычислить остатки регрессии и проверить, удовлетворяются ли предпосылки. В частности, определить, какая ситуация – гомоскедастичность или гетероскедастичность имеет место. Для оценки гетероскедастичности можно использовать тест Гольдфельда–Квандта.
При нарушении гомоскедастичности рекомендуется заменять традиционный метод наименьших квадратов обобщенным методом [3].
3.1.3. Оценка неизвестных значений зависимой переменной
На основе полученной модели осуществляется точечный и интервальный прогноз значений исследуемого показателя, анализ особенностей влияния учтенных в модели факторов на исследуемый показатель.
3.1.4 Примеры к разделу 3.1
Пример 1. По четырнадцати филиалам страховой компании ПАО «САК «Энергогарант» имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (млн руб.) (таблица 1). Объем привлеченных средств составляет менее 10% и в расчете не рассматривается. По исходным данным необходимо построить и исследовать уравнение множественной линейной регрессии.
Таблица 2 – Исходные данные
№ филиала | Годовая прибыль | Собственные средства | Страховые резервы | Страховые премии | Страховые выплаты |
1 | 92 | 3444 | 9563 | 11456 | 1659 |
2 | 42 | 2658 | 6354 | 5249 | 2625 |
3 | 186 | 9723 | 10245 | 12968 | 4489 |
4 | 48 | 4526 | 6398 | 7589 | 6896 |
5 | 38 | 5369 | 5692 | 7256 | 5698 |
6 | 74 | 2248 | 6359 | 4963 | 4321 |
7 | 48 | 5671 | 6892 | 7259 | 6692 |
8 | 82 | 4312 | 7256 | 6935 | 756 |
9 | 45 | 2226 | 8256 | 2693 | 5532 |
10 | 46 | 3654 | 5982 | 6324 | 3235 |
11 | 65 | 2635 | 6359 | 7853 | 5325 |
12 | 29 | 2463 | 7532 | 8253 | 6862 |
13 | 34 | 3265 | 5632 | 7564 | 6325 |
14 | 66 | 7546 | 7625 | 9638 | 4569 |