Панды (программное обеспечение) - Pandas (software)

панды
Панды logo.svg
Оригинальный автор (ы)Уэс МакКинни
Разработчики)Сообщество
изначальный выпуск11 января 2008 г.; 12 лет назад (2008-01-11)
Стабильный выпуск
1.1.4[1] / 30 октября 2020; 33 дней назад (30 октября 2020 г.)
Репозиторий Отредактируйте это в Викиданных
Написано вPython, Cython, C
Операционная системаКроссплатформенность
ТипТехнические вычисления
ЛицензияНовая лицензия BSD
Интернет сайтпанды.pydata.org

В компьютерное программирование, панды это библиотека программного обеспечения написано для Язык программирования Python для обработки и анализа данных. В частности, он предлагает структуры данных и операции для управления числовыми таблицами и Временные ряды. это бесплатно программное обеспечение выпущен под лицензия BSD с тремя пунктами.[2] Название происходит от термина "данные панели ", эконометрика термин для наборов данных, которые включают наблюдения за несколько периодов времени за одними и теми же людьми.[3] Его название - игра от самой фразы «анализ данных Python».[4] Уэс МакКинни начал строить то, что впоследствии станет пандами AQR Capital в то время как он был там исследователем с 2007 по 2010 год.[5]

Особенности библиотеки

  • Объект DataFrame для обработки данных со встроенной индексацией.
  • Инструменты для чтения и записи данных между структурами данных в памяти и различными форматами файлов.
  • Согласование данных и интегрированная обработка недостающих данных.
  • Изменение формы и изменение наборов данных.
  • Нарезка на основе меток, необычное индексирование и разделение больших наборов данных на подмножества.
  • Вставка и удаление столбца структуры данных.
  • Группировка по механизму, позволяющая выполнять операции разделения-применения-объединения над наборами данных.
  • Объединение и объединение наборов данных.
  • Иерархическая индексация оси для работы с многомерными данными в низкоразмерной структуре данных.
  • Функциональность временных рядов: создание диапазона дат[6] и преобразование частоты, статистика движущегося окна, линейная регрессия движущегося окна, сдвиг даты и запаздывание.
  • Обеспечивает фильтрацию данных.

Библиотека оптимизирована для производительности, критические пути кода написаны на Cython или же C.[7]

Фреймы данных

Панды в основном используются для анализ данных. Pandas позволяет импортировать данные из файлов различных форматов, таких как значения, разделенные запятыми, JSON, SQL, Майкрософт Эксель.[8] Pandas позволяет выполнять различные операции с данными, такие как слияние,[9] изменение формы[10] выбор,[11] а также очистка данных, и обработка данных Особенности.

История

Разработчик Уэс МакКинни начал работать над пандами в 2008 году, когда AQR Capital Management из-за необходимости в высокопроизводительном и гибком инструменте для выполнения количественный анализ по финансовым данным. Перед тем как покинуть AQR, он смог убедить руководство разрешить ему Открытый исходный код библиотека.

Другой сотрудник AQR, Чанг Ше, присоединился к работе в 2012 году в качестве второго крупного сотрудника библиотеки.

В 2015 году панды подписались на финансово спонсируемый проект NumFOCUS, а 501 (c) (3) некоммерческая благотворительная организация В Соединенных Штатах.[12]

Смотрите также

Рекомендации

  1. ^ «Выпуск 1.1.4». 30 октября 2020 г.. Получено 16 ноября 2020.
  2. ^ «Лицензия - Обзор пакета - документация pandas 1.0.0». панды. 28 января 2020 г.. Получено 30 января 2020.
  3. ^ Уэс МакКинни (2011). "pandas: основополагающая библиотека Python для анализа данных и статистики" (PDF). Получено 2 августа 2018.
  4. ^ Маккинни, Уэс (2017). Python для анализа данных, второе издание. O'Reilly Media. п. 5. ISBN  9781491957660.
  5. ^ Копф, Дэн. «Познакомьтесь с человеком, который стоит за самым важным инструментом в области науки о данных». Кварцевый. Получено 17 ноября 2020.
  6. ^ "pandas.date_range - документация pandas 1.0.0". панды. 29 января 2020 г.. Получено 30 января 2020.
  7. ^ "Библиотека анализа данных Python - pandas: Библиотека анализа данных Python". панды. Получено 13 ноября 2017.
  8. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html
  9. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
  10. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
  11. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
  12. ^ «NumFOCUS - pandas: проект, спонсируемый финансами». NumFOCUS. Получено 3 апреля 2018.

дальнейшее чтение

  • Чен, Дэниел Ю. (2018). Панды для всех: анализ данных Python. Бостон: Эддисон-Уэсли. ISBN  978-0-13-454693-3.
  • Маккинни, Уэс (2017). Python для анализа данных: обработка данных с помощью Pandas, NumPy и IPython (2-е изд.). Севастополь: О'Рейли. ISBN  978-1-4919-5766-0.
  • Вандерплас, Джейк (2016). «Манипуляции с данными с помощью Pandas». Справочник Python по науке о данных: основные инструменты для работы с данными. О'Рейли. С. 97–216. ISBN  978-1-4919-1205-8.
  • Патхак, Чанки (2018). "Поваренная книга панд". Поваренная книга панд. С. 1–8.

внешняя ссылка