# pandas-dev/pandas

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/pandas-dev-pandas).**

47,918 stars · 19,685 forks · Python · bsd-3-clause

## Links

- GitHub: https://github.com/pandas-dev/pandas
- Homepage: https://pandas.pydata.org
- awesome-repositories: https://awesome-repositories.com/repository/pandas-dev-pandas.md

## Topics

`alignment` `data-analysis` `data-science` `flexible` `pandas` `python`

## Description

Pandas is a high-performance data analysis library that provides a comprehensive framework for manipulating, cleaning, and transforming structured datasets. It centers on labeled one-dimensional and two-dimensional data structures, allowing users to construct, filter, and reshape tabular information while performing complex arithmetic and logical operations.

The library distinguishes itself through a sophisticated indexing engine that enables automatic data alignment during calculations and relational merges. By utilizing a block-based memory layout, it optimizes cache locality for vectorized operations across columns. Its capabilities extend to a robust split-apply-combine pattern for grouping, as well as specialized tools for time series analysis that handle calendar-aware offsets, frequency resampling, and time zone management.

Beyond core manipulation, the project offers extensive support for data lifecycle management, including ingestion and serialization across diverse file formats and database systems. It provides advanced features for hierarchical multi-index mapping, relational joins, and flexible missing data handling, ensuring that datasets are normalized and ready for statistical or analytical workflows.

## Tags

### Data & Databases

- [Data Analysis Libraries](https://awesome-repositories.com/f/data-databases/data-analysis-libraries.md) — Offers a comprehensive suite for cleaning and transforming structured data.
- [Data Manipulation Frameworks](https://awesome-repositories.com/f/data-databases/data-manipulation-frameworks.md) — Provides high-level structures for manipulating and transforming two-dimensional labeled datasets.
- [Dataframe Constructors](https://awesome-repositories.com/f/data-databases/dataframe-constructors.md) — Constructs two-dimensional labeled data structures from inputs like dictionaries or arrays. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html))
- [Series Constructors](https://awesome-repositories.com/f/data-databases/series-constructors.md) — Initializes one-dimensional labeled arrays that hold any data type. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html))
- [Data Alignments](https://awesome-repositories.com/f/data-databases/data-alignments.md) — Performs arithmetic operations by automatically aligning values on row and column labels. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html))
- [Data I/O](https://awesome-repositories.com/f/data-databases/data-i-o.md) — Reads from and writes to various file formats and database systems.
- [Relational Merges](https://awesome-repositories.com/f/data-databases/relational-merges.md) — Performs relational database-style joins between data objects using common keys. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html))
- [Tabular Data Frameworks](https://awesome-repositories.com/f/data-databases/tabular-data-frameworks.md) — Provides a robust environment for managing heterogeneous tabular data.
- [Time Series Analysis Tools](https://awesome-repositories.com/f/data-databases/time-series-analysis-tools.md) — Enables complex temporal data operations including resampling and calendar-aware calculations.
- [Column Manipulations](https://awesome-repositories.com/f/data-databases/column-manipulations.md) — Adds, selects, deletes, or inserts columns using dictionary-like syntax with automatic alignment. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html))
- [Data Joins](https://awesome-repositories.com/f/data-databases/data-joins.md) — Combines columns from multiple data objects by matching on indexes or specified columns. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html))
- [Grouped Aggregations](https://awesome-repositories.com/f/data-databases/grouped-aggregations.md) — Reduces grouped data to scalar values by applying summary functions to each column. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html))
- [Memory Layouts](https://awesome-repositories.com/f/data-databases/memory-layouts.md) — Provides contiguous memory block storage to optimize cache locality and vectorized operations.
- [Relational Data Processors](https://awesome-repositories.com/f/data-databases/relational-data-processors.md) — Implements database-style join and merge operations for flexible data alignment.
- [Relational Integrations](https://awesome-repositories.com/f/data-databases/relational-integrations.md) — Combines multiple disparate datasets using database-style joins and merges.
- [Split-Apply-Combine Patterns](https://awesome-repositories.com/f/data-databases/split-apply-combine-patterns.md) — Implements the split-apply-combine pattern for independent group processing and reassembly.
- [Data Cleaning Utilities](https://awesome-repositories.com/f/data-databases/data-cleaning-utilities.md) — Cleans, transforms, and normalizes messy raw datasets into structured formats.
- [Data Concatenations](https://awesome-repositories.com/f/data-databases/data-concatenations.md) — Combines multiple data objects along a specified axis with optional index logic. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html))
- [Data Grouping Utilities](https://awesome-repositories.com/f/data-databases/data-grouping-utilities.md) — Organizes data into groups using columns, index levels, or arrays for subsequent operations. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html))
- [Lazy Evaluation Engines](https://awesome-repositories.com/f/data-databases/lazy-evaluation-engines.md) — Optimizes filtering operations by parsing queries into expression trees before execution.
- [Long-to-Wide Reshaping](https://awesome-repositories.com/f/data-databases/long-to-wide-reshaping.md) — Reorganizes data from long to wide format to create a readable matrix structure. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html))
- [Text File Parsers](https://awesome-repositories.com/f/data-databases/text-file-parsers.md) — Converts delimited text files into structured data with custom separator and column handling. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html))
- [Time Series Resampling](https://awesome-repositories.com/f/data-databases/time-series-resampling.md) — Enables flexible frequency conversion and aggregation of temporal data. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html))
- [Time Series Toolkits](https://awesome-repositories.com/f/data-databases/time-series-toolkits.md) — Provides specialized functions for indexing and calendar-aware temporal sequences.
- [Wide-to-Long Reshaping](https://awesome-repositories.com/f/data-databases/wide-to-long-reshaping.md) — Converts wide-format data into long-format by unpivoting measured variables. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html))
- [Grouped Transformations](https://awesome-repositories.com/f/data-databases/grouped-transformations.md) — Performs operations on grouped data that return objects indexed identically to the original. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html))
- [Hierarchical Reshaping](https://awesome-repositories.com/f/data-databases/hierarchical-reshaping.md) — Transforms data between wide and long formats by stacking or unstacking hierarchical levels. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html))
- [Indexing Engines](https://awesome-repositories.com/f/data-databases/indexing-engines.md) — Facilitates automatic data alignment during arithmetic and merging operations via label-to-offset mapping.
- [Label-Based Data Selection](https://awesome-repositories.com/f/data-databases/label-based-data-selection.md) — Provides intuitive access to data rows and columns via index labels. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html))
- [Missing Data Imputation](https://awesome-repositories.com/f/data-databases/missing-data-imputation.md) — Enables replacing missing values with scalars or propagating existing values to fill gaps. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/missing_data.html))
- [Multi-Dimensional Indexing](https://awesome-repositories.com/f/data-databases/multi-dimensional-indexing.md) — Organizes and accesses hierarchical data structures to efficiently query complex information.
- [Position-Based Data Selection](https://awesome-repositories.com/f/data-databases/position-based-data-selection.md) — Supports standard integer-based slicing for precise data retrieval. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html))
- [SQL Database Connectors](https://awesome-repositories.com/f/data-databases/sql-database-connectors.md) — Retrieves and writes data to relational databases using flexible query execution. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html))
- [Time Series Representations](https://awesome-repositories.com/f/data-databases/time-series-representations.md) — Defines robust structures for representing time-indexed data. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html))
- [Boolean Data Filtering](https://awesome-repositories.com/f/data-databases/boolean-data-filtering.md) — Enables precise data selection using boolean vectors and logical expressions. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html))
- [Calendar-Aware Date Offsets](https://awesome-repositories.com/f/data-databases/calendar-aware-date-offsets.md) — Provides calendar-aware date adjustments that respect daylight savings time. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html))
- [Categorical Encodings](https://awesome-repositories.com/f/data-databases/categorical-encodings.md) — Converts categorical variables into boolean indicator columns for statistical or machine learning models. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html))
- [Grouped Filters](https://awesome-repositories.com/f/data-databases/grouped-filters.md) — Subsets grouped data by keeping only groups or rows that satisfy defined criteria. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html))
- [Hierarchical Data Indexing](https://awesome-repositories.com/f/data-databases/hierarchical-data-indexing.md) — Enables complex data selection within multi-level hierarchical structures. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/advanced.html))
- [Missing Data Removal](https://awesome-repositories.com/f/data-databases/missing-data-removal.md) — Provides methods to remove rows or columns containing missing values based on flexible parameters. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/missing_data.html))
- [Multi-Index Mappings](https://awesome-repositories.com/f/data-databases/multi-index-mappings.md) — Supports complex data slicing and grouping through hierarchical multi-level index structures.
- [Parquet Data Parsers](https://awesome-repositories.com/f/data-databases/parquet-data-parsers.md) — Converts data structures to and from compressed columnar storage formats. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html))
- [Time Zone Management](https://awesome-repositories.com/f/data-databases/time-zone-management.md) — Supports localization and conversion of timestamps using standard time zone identifiers. ([source](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html))