Why is ibis-project/ibis a recommended Dataframe Format Conversion GitHub Repositories repository?

Implements a bridge to convert query execution results between SQL backends and formats like Pandas, Polars, and PyArrow.

Why is rapidsai/cuml a recommended Dataframe Format Conversion GitHub Repositories repository?

Processes data directly from various in-memory dataframe and tensor formats without requiring manual conversion.

Why is awslabs/gluonts a recommended Dataframe Format Conversion GitHub Repositories repository?

Transforms tabular Pandas dataframes into structured formats suitable for time series modeling.

3 Repos

Awesome GitHub RepositoriesDataframe Format Conversion

Converting query results between different in-memory dataframe and tensor formats.

Distinct from Object Result Fetches: Candidates focus on caching or API transformers; this is specifically about interop between Pandas, Polars, and PyArrow.

Explore 3 awesome GitHub repositories matching data & databases · Dataframe Format Conversion. Refine with filters or upvote what's useful.

Finde die besten Repos mit KI.Wir suchen mit KI nach den am besten passenden Repositories.

ibis-project/ibis
ibis-project/ibis
6,574Auf GitHub ansehen
Ibis is a portable Python dataframe library and multi-backend query engine that provides a unified interface for executing data transformations across diverse compute engines. It functions as a Python SQL expression compiler and dialect transpiler, allowing users to define data logic once and execute it across cloud warehouses, embedded databases, and distributed clusters without rewriting code. The project distinguishes itself through a database backend abstraction that decouples transformation logic from the underlying execution engine. It enables polyglot data workflows by mixing raw SQL s
Implements a bridge to convert query execution results between SQL backends and formats like Pandas, Polars, and PyArrow.
Pythonbigqueryclickhousedatabase
Auf GitHub ansehen6,574
rapidsai/cuml
rapidsai/cuml
5,209Auf GitHub ansehen
cuml ist eine GPU-beschleunigte Machine-Learning-Bibliothek und ein Framework, das CUDA nutzt, um die Vorverarbeitung tabellarischer Daten und die Modellausführung zu beschleunigen. Es bietet eine Suite von Tools zum Trainieren und Bereitstellen von Klassifizierungs-, Regressions- und Clustering-Modellen auf NVIDIA-GPUs und GPU-Clustern. Die Bibliothek ist auf Skalierbarkeit ausgelegt und bietet eine verteilte GPU-Machine-Learning-Umgebung, die Berechnungen und Daten über mehrere Hardware-Beschleuniger und Knoten hinweg verteilen kann, um Datensätze zu verarbeiten, die den Speicher eines einzelnen Geräts überschreiten. Sie spiegelt Standard-Estimator-Schnittstellen wider, um den Austausch von CPU-basierten Modellen durch GPU-beschleunigte Versionen innerhalb bestehender Workflows zu ermöglichen. Das Projekt deckt ein breites Spektrum an Machine-Learning-Funktionen ab, einschließlich überwachtem Lernen, unüberwachtem Clustering, Nearest-Neighbor-Suche und hochdimensionaler Dimensionsreduktion. Es enthält zudem hardwarebeschleunigte Vorverarbeitung tabellarischer Daten für Feature-Skalierung und -Kodierung, Text-Feature-Extraktion, Zeitreihenanalyse und Erklärbarkeit von Modellvorhersagen. Unterstützende Hilfsmittel umfassen Tools zur Generierung synthetischer Datensätze, zur Serialisierung des Modellzustands und zur Berechnung von Modell-Performance-Metriken.
Processes data directly from various in-memory dataframe and tensor formats without requiring manual conversion.
Python
Auf GitHub ansehen5,209
awslabs/gluonts
awslabs/gluonts
5,199Auf GitHub ansehen
GluonTS ist eine probabilistische Zeitreihenbibliothek und ein Deep-Learning-Prognose-Framework. Es bietet ein Toolkit zum Aufbau, Training und zur Evaluierung neuronaler Netzwerkarchitekturen, die zukünftige Werte als Wahrscheinlichkeitsverteilungen vorhersagen, um Unsicherheit zu quantifizieren. Das Projekt zeichnet sich durch die Unterstützung von Zero-Shot-Forecasting und die Integration diverser Modellierungsansätze aus, einschließlich tiefer probabilistischer neuronaler Netze und Wrapper für externe statistische Bibliotheken wie Prophet und R forecast. Es implementiert spezialisierte architektonische Primitiven wie kausale Konvolutionen und invertierbare Residual-Netzwerke, um Informationslecks zu verhindern und latente Repräsentationen in gültige Wahrscheinlichkeitsverteilungen abzubilden. Das Framework deckt eine umfassende Data-Engineering-Oberfläche ab, einschließlich Zeitreihenskalierung, bijektiver Transformationen und hierarchischer Modellierung. Es nutzt Apache Arrow und Parquet für hochperformantes Datensatz-Streaming und Random-Access-Management. Zur Modellbewertung enthält es eine Evaluierungssuite zur Messung von Prognosegenauigkeit und probabilistischer Abdeckung unter Verwendung von Metriken wie Quantile Loss und Continuous Rank Probability Scores. Die Bibliothek unterstützt die Modellbereitstellung durch Integration mit Amazon SageMaker.
Transforms tabular Pandas dataframes into structured formats suitable for time series modeling.
Pythonartificial-intelligenceawsdata-science
Auf GitHub ansehen5,199

Awesome Dataframe Format Conversion GitHub Repositories

ibis-project/ibis

rapidsai/cuml

awslabs/gluonts