5 dépôts
Libraries for manipulating and analyzing tabular datasets using GPU acceleration.
Distinct from GPU Acceleration Libraries: Existing candidates focus on general acceleration or plotting, not the specific dataframe API identity.
Explore 5 awesome GitHub repositories matching data & databases · GPU DataFrame Libraries. Refine with filters or upvote what's useful.
cuDF is a GPU-accelerated dataframe library and data processing engine designed for manipulating and analyzing large tabular datasets. It provides a high-level API for executing filtering, joining, and aggregating operations directly on GPU hardware. The project integrates the Apache Arrow memory format to enable zero-copy data transfers and includes a just-in-time compiler for executing custom user-defined functions on the GPU. The library features specialized acceleration for existing workflows by redirecting standard Pandas dataframe calls and Polars query plans to a GPU backend. It also p
Provides a GPU-accelerated library for manipulating and analyzing large tabular datasets.
Accelerates pandas, Polars, and Apache Spark DataFrame operations on NVIDIA GPUs with no code changes.
AliSQL is a fork of MySQL by Alibaba that extends the relational database management system with enhancements for high performance, scalability, and enterprise-grade availability. It retains the core MySQL identity as a SQL-based database for storing, organizing, and retrieving structured data, while adding optimizations for large-scale transactional and analytical workloads. The project differentiates itself through a set of Alibaba-specific improvements, including a columnar engine for accelerating analytical queries directly on MySQL tables, and a distributed, shared-nothing NDB Cluster en
Offloads analytical queries to a columnar engine for faster execution than the standard row-based engine.
Pigsty is a full-stack orchestration suite for deploying, monitoring, and managing high-availability PostgreSQL clusters and their supporting infrastructure. It functions as a cluster management platform and high-availability suite that automates failover, manages virtual IPs, and ensures data consistency through distributed consensus. The project distinguishes itself by providing a comprehensive database infrastructure-as-code framework and a dedicated observability stack. It incorporates a backup and recovery manager supporting point-in-time recovery via S3-compatible object storage, alongs
Accelerates OLAP queries through columnar storage, distributed processing, and GPU acceleration.
Jetson Containers est un système de gestion de conteneurs qui construit et exécute des images Docker accélérées par GPU pour les charges de travail d'apprentissage automatique sur du matériel ARM64 edge. Il fonctionne comme un orchestrateur de conteneurs CUDA, détectant automatiquement la version du toolkit CUDA de l'hôte et les capacités du GPU pour assurer la compatibilité des conteneurs au moment de l'exécution, tout en sélectionnant l'image de conteneur correcte en faisant correspondre la version JetPack ou L4T de l'hôte au moment du lancement. Le projet fournit des conteneurs pré-configurés pour l'exécution de grands modèles de langage quantifiés et des pipelines de génération augmentée par récupération (RAG) optimisés pour les appareils edge, ainsi que des conteneurs ROS et de framework d'IA intégrés pour le déploiement d'agents autonomes et le traitement multimodal. Son système de construction modulaire en couches assemble des images Docker à partir de couches réutilisables et pré-construites, compilant les frameworks AI/ML à partir de la source pour les optimiser pour des architectures GPU edge spécifiques et des versions CUDA, avec une mise en cache locale des wheels pour accélérer les constructions ultérieures. La plateforme fournit des conteneurs Docker pré-construits avec des versions accélérées par GPU de PyTorch, TensorFlow, JAX et ONNX Runtime pour les plateformes Jetson, prenant en charge des capacités telles que l'exécution de LLM, de modèles de parole, de modèles vision-langage et de traduction neuronale automatique sur du matériel edge. Il permet également de construire des conteneurs personnalisés avec des packages d'IA accélérés par GPU, d'exécuter des conteneurs Triton Inference Server et Transformer Engine, et d'accélérer les flux de travail de science des données avec les bibliothèques RAPIDS.
Use a cuDF-based DataFrame library that runs on NVIDIA GPUs for accelerated data manipulation and analysis.