Файл: Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 28.03.2024

Просмотров: 29

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Министерство образования и науки РФ

Федеральное государственное автономное образовательное

учреждения высшего образования

«Национальный исследовательский технологический университет «МИСиС»

Институт информационных технологий и компьютерных наук

Кафедра бизнес-информатики и систем управления производством

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к выполнению раздела КНИР1

по курсу «Анализ данных и аналитика в принятии решений»

Направление подготовки: 38.03.05 Бизнес-информатика

Профиль: Архитектура предприятия и

Направление подготовки:38.03.03 Прикладная информатика

Профиль: Прикладная информатика в экономике
Семестр 5



Согласованно:




Утвердил:

Консультант по анализу данных

Доцент каф. БИСУП Баздарева З.В.




Руководитель программы обучения,

зав.кафедрой БИСУП

Пятецкий В.Е


Подпись: _________




Подпись: _________





Москва 2021














Содержание

  1. Цели и задачи раздела КНИР1 по курсу «Анализ данных и аналитика в принятии решений»…………………………………………………………...................................3

  2. Постановка задачи раздела КНИР1 с полным набором числовых данных…………3

  3. Методы анализа информации и прогнозирования показателей функционирования систем……………………………………………………………………………………4

    1. Множественная регрессия………………………………………………………….4

3.1.1.Отбор факторов для построения множественной регрессии……………….4

3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов……………………………………………………………….5.

3.1.3.Прогнозирование на основе разработанной эконометрической модели….5

3.1.4 Примеры к разделу 3.1……………………………………………………….5


3.2 Временные ряды…………………………………………………………………….12

3.2.1. Задачи анализа временных рядов……………………………………………12

3.2.2. Пример к разделу 3.2…………………………………………………………13

3.2.3. Анализ аддитивной и мультипликативной моделей временных

рядов……………………………………………………………………………………………17

3.3 Дисперсионный анализ информации……………………………………………….22

3.3.1. Однофакторный дисперсионный анализ……………………………………..22

3.3.2. Примеры к разделу 3.2………………………………………………………. 23

3.3.3. Двухфакторный дисперсионный анализ……………………………………..27

3.4 Кластерный анализ…………………………………………………………………...27

  1. Заключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»..28

  2. Библиографический список……………………………………………………………...28


1. Цели и задачи раздела КНИР1 «Анализ данных и аналитика в принятии решений»


  1. Получение информации о показателях состояния и эффективности исследуемого объекта, бизнес-процесса, системы, предприятия по имеющимся статистическим данным;

  2. Выявление на фоне случайных отклонений основных закономерностей, присущих исследуемому объекту, бизнес-процессу, рынку, исходя из накопленной информации;

  3. Количественная оценка факторов, влияющих на исследуемые результативные экономические показатели;

  4. Построение модели исследуемого бизнес-процесса или системы;

  5. Количественная оценка показателей модели;

  6. Интерпретация результатов анализа данных;

  7. Оценка достоверности и точности модели и, получаемых на её основе, выводов и заключений.

  8. Выводы на основе полученных результатов с рекомендуемыми управленческими решениями



2. Постановка задачи раздела КНИР1
Реальная бизнес статистика в качестве отдельного наблюдения содержит как исследуемый показатель Y, так и значения тех факторов, для которых соответствующее значение Y было зафиксировано. В разделе должна быть дана ссылка на сайты из которых собрана информация для анализа



Требуется обработать данные о показателях исследуемого бизнес-процесса или системы, выявить существующие закономерности для того, чтобы в дальнейшем прогнозировать результативные экономические показатели с требующейся достоверностью. Для этой цели использовать модель множественной регрессии или (и) модели временных рядов: аддитивного или мультипликативного, в зависимости от исходной информации. Для систематизации и группировки данных, например, когда требуется определить наиболее эффективные методы управления персоналом, следует ставить задачу и использовать методы дисперсионного и(или) кластерного анализа.
3. Методы анализа информации и прогнозирования показателей функционирования систем
3. 1. Множественная регрессия

Подробно построение множественной и парной линейной и нелинейной регрессии изложено в [2], [3].
3.1.1. Отбор факторов при построении множественной регрессии.

Отбор факторов производится на основе качественного теоретико-экономического анализа и обычно осуществляется в две стадии:

– на первой стадии факторы подбираются исходя из сущности проблемы;

– на второй стадии применяются формальные статистические критерии

№ наблюдения

Y

Х1

Х2













Таблица 1

Факторы Х1 и Х2 и др. не должны быть взаимно коррелированы. По исходным данным вычисляется матрица выборочных парных коэффициентов корреляции и выявляются пары переменных, имеющих высокие коэффициенты корреляции. Если такие переменные существуют, то говорят о мультиколлинеарности между ними.

В уравнение регрессии, как правило, включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

После исключения коллинеарных факторов осуществляется процедура отбора факторов
, наиболее влияющих на изменение результативного признака (факторов, включаемых в регрессию). Ранжирование факторов выполняется на основе значений частных коэффициентов корреляции.

Значимость факторов, включенных в уравнение регрессии, проверяется с помощью частного критерия Фишера.

Кроме точности модели, для исследователя наиболее важными качествами модели являются простота модели и возможность наглядной интерпретации параметров модели.

По этой причине наиболее широко используются линейная и степенная модели.

3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов

Для оценки параметров уравнения множественной регрессии применяется метод наименьших квадратов (МНК), в EXCEL можно использовать также надстройку АНАЛИЗ ДАННЫХ.

Величина коэффициента детерминации используется для оценки качества регрессионной модели. Чем его величина больше, тем лучше данная модель согласуется с данными наблюдений.

Низкое значение коэффициента (индекса) множественной корреляции означает, что, либо в регрессионную модель не включены существенные факторы, либо рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера. Статистическая значимость коэффициентов уравнения множественной регрессии и интервальная оценка параметров уравнения производится с помощью t-критерия Стьюдента.

Оценки параметров, полученные МНК, являются эффективными только при выполнении предпосылок МНК. После построения модели следует вычислить остатки регрессии и проверить, удовлетворяются ли предпосылки. В частности, определить, какая ситуация – гомоскедастичность или гетероскедастичность имеет место. Для оценки гетероскедастичности можно использовать тест Гольдфельда–Квандта.

При нарушении гомоскедастичности рекомендуется заменять традиционный метод наименьших квадратов обобщенным методом [3].
3.1.3. Оценка неизвестных значений зависимой переменной
На основе полученной модели осуществляется точечный и интервальный прогноз значений исследуемого показателя, анализ особенностей влияния учтенных в модели факторов на исследуемый показатель.

3.1.4 Примеры к разделу 3.1

Пример 1. По четырнадцати филиалам страховой компании ПАО «САК «Энергогарант» имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (млн руб.) (таблица 1). Объем привлеченных средств составляет менее 10% и в расчете не рассматривается. По исходным данным необходимо построить и исследовать уравнение множественной линейной регрессии.
Таблица 2 – Исходные данные

№ филиала

Годовая прибыль

Собственные средства

Страховые резервы

Страховые премии

Страховые выплаты

1

92

3444

9563

11456

1659

2

42

2658

6354

5249

2625

3

186

9723

10245

12968

4489

4

48

4526

6398

7589

6896

5

38

5369

5692

7256

5698

6

74

2248

6359

4963

4321

7

48

5671

6892

7259

6692

8

82

4312

7256

6935

756

9

45

2226

8256

2693

5532

10

46

3654

5982

6324

3235

11

65

2635

6359

7853

5325

12

29

2463

7532

8253

6862

13

34

3265

5632

7564

6325

14

66

7546

7625

9638

4569