Файл: Проведение анализа данных Выполнил студент группы саиумо221.pptx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 9
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Проведение анализа данных
Выполнил студент
группы САИУМ-О-22/1: Железин В.А.
Построение гистограммы, визуализирующая исходные данные
После проведения визуального анализа данных на предыдущем слайде на предмет "выбросов" - данных, значения которых, существенно отличаются от других данных выборки, сформировали новый столбец данных, исключив из него "выбросы« и снова построили гистограмму.Сформировали частотное распределение данных выборки по интервалам (карманам)
Карман | Частота |
9 | 2 |
13.6428571 | 7 |
18.2857143 | 15 |
22.9285714 | 15 |
27.5714286 | 18 |
32.2142857 | 11 |
36.8571429 | 19 |
41.5 | 15 |
46.1428571 | 14 |
50.7857143 | 9 |
55.4285714 | 14 |
60.0714286 | 16 |
64.7142857 | 13 |
69.3571429 | 16 |
Еще | 14 |
Построение гистограммы частотного распределения
Минимум (9)
Медиана (40)
Мода (36)
Максимум (74)
Среднее (41,78)
Сформировали таблицу с описанием основных характеристик распределения (параметр "Итоговая статистика»)
Итоговая статистика | |
Столбец1 | |
| |
Среднее | 41,78894472 |
Стандартная ошибка | 1,323390057 |
Медиана | 40 |
Мода | 36 |
Стандартное отклонение | 18,66871413 |
Дисперсия выборки | 348,5208873 |
Эксцесс | -1,20939658 |
Асимметричность | 0,073461027 |
Интервал | 65 |
Минимум | 9 |
Максимум | 74 |
Сумма | 8316 |
Счет | 199 |
Описание результатов
- Среднее: представляет собой среднее арифметическое всех значений массива;
- Стандартная ошибка: это оценка стандартного отклонения распределения выборочного среднего;
- Медиана: это число, которое является серединой множества чисел (в данном случае выборки): половина чисел множества больше, чем медиана , а половина чисел меньше, чем медиана;
- Мода: это наиболее часто встречающееся (повторяющееся) значение в выборке;
- Стандартное отклонение: это мера того, насколько широко разбросаны значения в выборке относительно их среднего;
- Дисперсия выборки: характеризует разброс значений в массиве, отклонение от среднего. Дисперсия выборки это сумма квадратов отклонений каждого значения в массиве от среднего , деленная на размер выборки минус 1;
- Эксцесс: показывает относительный вес «хвостов» распределения относительно его центральной части;
- Асимметричность: характеризует степень несимметричности распределения (плотности распределения) относительно его среднего. Положительное значение коэффициента асимметрии указывает, что размер правого «хвоста» распределения больше, чем левого (относительно среднего). Отрицательная асимметрия, наоборот, указывает на то, что левый хвост распределения больше правого;
- Интервал: разница между максимальным и минимальным значениями;
- Минимум: минимальное значение в диапазоне ячеек, указанном во входном интервале;
- Максимум: максимальное значение;
- Сумма: сумма всех значений;
- Счет: количество значений во входном интервале.