Файл: Библиотеки Python. Pandas. Библиотеки в python Библиотеки для анализа данных.pptx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.03.2024
Просмотров: 34
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Библиотеки Python. Pandas.
Библиотеки в python Библиотеки для анализа данных
- Инструменты для обмена данными между структурами в памяти и файлами различных форматов
- Встроенные средства совмещения данных и способы обработки отсутствующей информации
- Переформатирование наборов данных, в том числе создание сводных таблиц
- Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
- Вставка и удаление столбцов данных
- Слияние и объединение наборов данных
Структуры данных
Series - это структура данных, которая сочетает свойства одномерного массива NumPy и словаря Python, т.е. доступ к каждому элементу может быть получен, либо с помощью индекса, либо с помощью идентификатора (ключа). DataFrame - это объект, который сочетает свойства структурированных массивов NumPy и словарей Python. Самая простая аналогия для DataFrame - это таблица, столбцами которой являются объекты Series.Основными рабочими структурами данных в Pandas являются объекты Series и DataFrame.
Series
Создание
s = pd.Series([1, 3, 5, np.nan, 6, 8])
Подключение
import numpy as np
import pandas as pd
Использование
series.values series.index
DataFrame
Создание
Подключение
import numpy as np
import pandas as pd
Pandas
Pandas поддерживает операции чтения и записи для: CSV, Excel 2007+, SQL, HTML, JSON и т.д.
Например:
CSV. Используется функция read_csv(). Аргумент file является строкой, в которой записан путь до файла с датасетом. Для записи данных из DataFrame в CSV-файл используется метод to_csv(file).Excel. Используется функция read_excel(). Для записи данных из DataFrame в Excel-файл используется метод to_excel().
Работа с данными
Обработка дынных
Обработка DataFrame и series
Чтение данных
Чтение данных в машиночитаемом формате
Результаты
Построение графиков, сохранение данных