Файл: Проведение анализа данных Выполнил студент группы саиумо221.pptx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 10

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Проведение анализа данных

Выполнил студент

группы САИУМ-О-22/1: Железин В.А.

Построение гистограммы, визуализирующая исходные данные

После проведения визуального анализа данных на предыдущем слайде на предмет "выбросов" - данных, значения которых, существенно отличаются от других данных выборки, сформировали новый столбец данных, исключив из него "выбросы« и снова построили гистограмму.

Сформировали частотное распределение данных выборки по интервалам (карманам)


Карман

Частота

9

2

13.6428571

7

18.2857143

15

22.9285714

15

27.5714286

18

32.2142857

11

36.8571429

19

41.5

15

46.1428571

14

50.7857143

9

55.4285714

14

60.0714286

16

64.7142857

13

69.3571429

16

Еще

14

Построение гистограммы частотного распределения 


Минимум (9)

Медиана (40)

Мода (36)

Максимум (74)

Среднее (41,78)

 Сформировали таблицу с описанием основных характеристик распределения (параметр "Итоговая статистика»)


Итоговая статистика

Столбец1



 

 

Среднее

41,78894472

Стандартная ошибка

1,323390057

Медиана

40

Мода

36

Стандартное отклонение

18,66871413

Дисперсия выборки

348,5208873

Эксцесс

-1,20939658

Асимметричность

0,073461027

Интервал

65

Минимум

9

Максимум

74

Сумма

8316

Счет

199

Описание результатов

  • Среднее: представляет собой среднее арифметическое всех значений массива;
  • Стандартная ошибка: это оценка стандартного отклонения распределения выборочного среднего;
  • Медиана: это число, которое является серединой множества чисел (в данном случае выборки): половина чисел множества больше, чем медиана , а половина чисел меньше, чем медиана;
  • Мода: это наиболее часто встречающееся (повторяющееся) значение в выборке;
  • Стандартное отклонение: это мера того, насколько широко разбросаны значения в выборке относительно их среднего;
  • Дисперсия выборки: характеризует разброс значений в массиве, отклонение от среднего. Дисперсия выборки это сумма квадратов отклонений каждого значения в массиве от среднего , деленная на размер выборки минус 1;
  • Эксцесс: показывает относительный вес «хвостов» распределения относительно его центральной части;
  • Асимметричность: характеризует степень несимметричности распределения (плотности распределения) относительно его среднего. Положительное значение коэффициента асимметрии указывает, что размер правого «хвоста» распределения больше, чем левого (относительно среднего). Отрицательная асимметрия, наоборот, указывает на то, что левый хвост распределения больше правого;
  • Интервал: разница между максимальным и минимальным значениями;
  • Минимум: минимальное значение в диапазоне ячеек, указанном во входном интервале;
  • Максимум: максимальное значение;
  • Сумма: сумма всех значений;
  • Счет: количество значений во входном интервале.