17 dépôts
Techniques for merging rows from multiple tables using various join types based on related columns.
Distinct from Table Data Processing: Specifically focuses on table joins and data combination, rather than general row-level processing.
Explore 17 awesome GitHub repositories matching data & databases · Table Joining Operations. Refine with filters or upvote what's useful.
Perspective is a columnar data analytics engine and high-performance visualization component powered by WebAssembly. It provides a system for analyzing and visualizing large or streaming datasets through interactive data grids and charts, utilizing a compiled binary to achieve near-native performance within the browser. The project distinguishes itself through a WebSocket-based data streaming interface and deep Apache Arrow integration, which minimize memory overhead when synchronizing tables between servers and clients. It acts as a remote query proxy capable of translating visualization con
Combines two source tables on a shared key to create a reactive read-only joined table.
pysheeet est une bibliothèque de référence technique fournissant une collection organisée d'extraits de code et de modèles d'implémentation pour le développement Python avancé, l'intégration système et le calcul haute performance. Il sert de guide complet pour implémenter la programmation réseau de bas niveau, les extensions C natives, et la programmation asynchrone et concurrente. Le projet fournit des frameworks spécialisés pour le développement et le déploiement de grands modèles de langage, y compris des outils pour l'inférence GPU distribuée et le service haute performance. Il inclut également des modèles détaillés pour l'orchestration de clusters de calcul haute performance, couvrant l'allocation des ressources GPU et la gestion des charges de travail multi-nœuds. La bibliothèque couvre une large surface de capacités, y compris la communication réseau sécurisée et la cryptographie, l'ORM et la gestion de base de données, et l'implémentation de structures de données et d'algorithmes complexes. Elle fournit également des utilitaires pour la gestion de la mémoire, l'interopérabilité native via des interfaces de fonctions étrangères (FFI) et l'intégration au niveau du système d'exploitation.
Implements data combination from multiple tables using inner and outer joins based on foreign keys.
Jeesite is a full-stack low-code development framework designed for building enterprise administrative portals using Spring Boot, MyBatis, and Vue. It functions as a comprehensive platform for creating administrative dashboards with integrated role-based access control and organizational data permission systems. The framework distinguishes itself through a combination of automated CRUD code generation and an integrated RAG platform that connects large language models to enterprise data via vector stores. It further incorporates a BPMN-based workflow engine to automate complex business process
Retrieves data from associated tables and maps results back to primary entities using various join types.
xorm is a relational mapper and object-relational mapping tool for Go. It translates Go structures into SQL queries and maps database rows back into native objects, providing a multi-dialect database driver that supports MySQL, PostgreSQL, SQLite, Oracle, SQL Server, and TiDB. The project features a read-write splitting manager that routes modification requests to a primary database and read requests to replicas. It includes a database schema synchronizer to automatically align table structures and indexes with application data models, as well as a fluent SQL query builder for constructing co
Combines data from multiple tables using various join types based on related columns.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Optimizes join performance by ensuring data is partitioned identically across tables to eliminate network shuffling.
pg is a PostgreSQL object-relational mapper (ORM) for Go that maps Go structs to database tables and provides a fluent query builder for constructing SQL statements programmatically. At its core, it automatically generates CREATE TABLE statements from Go struct definitions using struct tags and naming conventions, and builds queries through method chaining with placeholder-based parameter binding to prevent SQL injection. The library distinguishes itself through relation-aware join generation that automatically constructs JOIN clauses for has-one, has-many, many-to-many, and polymorphic assoc
Adds JOIN clauses with custom conditions to SELECT queries.
Ce projet est une antisèche de base de données relationnelle et un guide de référence SQL. Il fournit une collection d'exemples de syntaxe et de documentation de requêtes pour gérer des bases de données relationnelles en utilisant le langage de requête structuré (SQL). L'outil est implémenté sous forme de site statique avec une documentation interrogeable côté client, permettant un filtrage immédiat du contenu technique via un index basé sur le navigateur. La référence couvre la gestion de bases de données relationnelles, incluant la récupération de données, la gestion de schémas de base de données et la maintenance des enregistrements. Elle inclut également des conseils sur la manipulation de données relationnelles via des jointures de tables et la génération de rapports agrégés.
Provides syntax examples for combining data from multiple tables using various SQL join types.
Ce projet est un tutoriel complet d'analyse de données pandas et un guide pédagogique conçu pour apprendre la manipulation et l'analyse de données. Il sert de guide de traitement de données tabulaires et de manuel pour l'analyse de séries temporelles, fournissant une approche structurée pour nettoyer, fusionner et transformer les jeux de données. Le dépôt fonctionne comme un cours d'ingénierie de caractéristiques de données, fournissant des tutoriels sur la construction et la sélection de caractéristiques de jeu de données pour améliorer les performances des modèles d'apprentissage automatique. Il inclut également un guide d'opérations de données vectorisées pour effectuer des calculs mathématiques élément par élément et des manipulations de matrices. Le matériel couvre un large éventail de capacités, notamment les flux de travail de nettoyage de données, les tâches d'intégration de données et l'analyse de données tabulaires. Il fournit des conseils sur le traitement des informations textuelles, la gestion des données catégorielles et l'optimisation de la vitesse d'exécution pour les grands jeux de données. Le projet est livré sous forme d'une série de Jupyter Notebooks contenant des exercices pratiques et des problèmes d'entraînement ciblés.
Provides tutorials on merging rows from multiple tables using various relational join types.
dplyr est une bibliothèque de manipulation de données pour R qui fournit une grammaire pour transformer les data frames tabulaires. Elle fonctionne comme un processeur de data frames en mémoire et un outil d'algèbre relationnelle, utilisant un ensemble cohérent de verbes pour filtrer, sélectionner et résumer les données. Le projet inclut un moteur de traduction SQL qui convertit des expressions de manipulation de données de haut niveau en requêtes optimisées. Cela permet aux utilisateurs d'effectuer des transformations directement sur des bases de données relationnelles distantes et du stockage cloud sans rapatrier les données localement. La bibliothèque couvre une large gamme d'opérations tabulaires, incluant la mutation de colonnes, le sous-ensemble de lignes et la jointure de données relationnelles. Elle offre également des capacités pour l'analyse de données groupées, permettant de partitionner les jeux de données pour des agrégations et des résumés indépendants.
Combines tables using equality, inequality, or rolling joins to find the closest matches.
Sequel is a relational database toolkit for Ruby that provides object-relational mapping, a fluent SQL query builder, and schema migration capabilities. It maps database tables to Ruby classes with support for associations, validations, lifecycle hooks, and eager loading, offering a comprehensive ORM layer for building data-centric applications. Sequel distinguishes itself through a plugin-based extension architecture that allows composable customization of models, databases, and datasets without relying on deep inheritance hierarchies. It includes a thread-safe connection pool with support f
Supports inner, left, and other join types to combine data from multiple tables.
Bun est un ORM (Object Relational Mapper) typé pour Go qui privilégie la construction de requêtes SQL-first et le mappage des résultats. Il fonctionne comme un constructeur de requêtes SQL programmable, un gestionnaire de connexion de base de données et un outil pour mapper les tables de base de données aux structs Go. Le projet se distingue par un système de prise en charge SQL multi-dialecte, permettant à une seule base de code d'interagir avec différents moteurs de base de données via une interface cohérente. Il inclut un outil d'observabilité de base de données intégré pour l'interception de requêtes, le traçage distribué et la journalisation, ainsi qu'un outil de migration de schéma pour le versioning des changements structurels. La bibliothèque couvre un large éventail d'opérations de données, incluant le traitement par lots, les upserts, les suppressions logiques (soft deletes) et la gestion des données relationnelles telles que les associations polymorphes. Elle fournit des capacités pour l'analyse SQL avancée en utilisant des expressions de table communes (CTE) et des fonctions de fenêtre, parallèlement à la gestion des transactions atomiques et au pooling de connexions. La gestion des schémas est prise en charge via une interface en ligne de commande pour appliquer des scripts de migration versionnés.
Provides capabilities for combining rows from multiple tables using various SQL join types.
PostgREST is a tool that automatically transforms a PostgreSQL database schema into a production-ready RESTful API. It serves as a database access layer and query engine that maps HTTP requests directly to SQL queries, providing a low-code interface for executing create, read, update, and delete operations without requiring manual boilerplate code. The project distinguishes itself by using schema-driven API generation and metadata-based discovery to expose database tables as navigable resources. It extends standard CRUD capabilities through the execution of custom and templated SQL, a plugin-
Combines data from two tables in one request using specified join types and conditional operators.
FreeSql is a .NET object-relational mapper and data access layer that translates object-oriented code into SQL for multiple relational database providers. It functions as a fluent SQL query builder and database schema synchronizer, allowing developers to align database table and index structures with entity class definitions. The framework is specifically optimized for .NET Native AOT to ensure reduced memory footprints and faster startup times. It includes a database traffic manager to distribute load through read-write splitting, dynamic table sharding, and tenant-based data isolation. Bro
Modifies data in one table based on matching values found in another related table through a join.
test_db is a collection of tools for validating database integrity, benchmarking system throughput, and generating synthetic schemas and datasets. It includes a sample corporate employee database for MySQL, a SQL dataset generator for creating representative records, and an integrity validator that uses checksums and record counts to verify data consistency across different database engines. The project provides a database performance benchmark consisting of complex queries and stored procedures designed to measure system response times and throughput. These tools simulate real-world workload
Evaluates system throughput by executing complex aggregation queries that force heavy resource usage across multiple tables.
Velox est un moteur d'exécution de requêtes C++ haute performance et une bibliothèque de traitement de données colonnaires. Il sert de framework composable pour implémenter des moteurs de requêtes analytiques, fournissant un évaluateur d'expressions vectorisées et une boîte à outils pour les systèmes de gestion de données. Le projet se distingue par son utilisation de l'exécution colonnaire vectorisée et de l'allocation mémoire basée sur des arènes pour traiter des jeux de données à grande échelle. Il propose des optimisations spécialisées telles que la mise en cache des tables de jointure broadcast, le push-down de filtres dynamiques et l'encodage par dictionnaire pour réduire la surcharge mémoire et accélérer les lectures analytiques. Le moteur couvre un large éventail de capacités analytiques, incluant l'implémentation de jointures hash, merge et semi, ainsi que l'agrégation parallèle multi-étapes et le calcul de fonctions de fenêtre. Il fournit des primitives pour le stockage colonnaire en mémoire, le décodage de données Parquet et l'intégration avec le stockage cloud. L'extensibilité est assurée par un système d'enregistrement de fonctions pour des fonctions scalaires et d'agrégation personnalisées, avec des bindings de haut niveau disponibles pour connecter la logique C++ à Python.
Stores hash tables in a global cache to let subsequent tasks reuse data without rebuilding it.
Ce projet est un framework de traitement de données tabulaires haute performance pour R, conçu pour gérer des jeux de données massifs avec efficacité mémoire et vitesse. Il fournit une structure de données améliorée qui utilise la sémantique de référence et la modification sur place pour effectuer des transformations complexes sans la surcharge de copies d'objets inutiles. La bibliothèque se distingue par ses optimisations architecturales de bas niveau, incluant le traitement parallèle multi-threadé, le tri basé sur radix et l'analyse de fichiers mappés en mémoire. En déchargeant les routines critiques de manipulation et d'agrégation de données vers du code C compilé, elle permet une exécution rapide des tâches qui seraient autrement coûteuses en calcul. Son moteur principal prend en charge des opérations relationnelles avancées, telles que les jointures non-équi, glissantes et à intervalles chevauchants, parallèlement à l'indexation secondaire automatique pour accélérer l'accès répété aux données. Au-delà de ses capacités de traitement principales, le projet offre une suite complète d'outils pour la gestion du cycle de vie des données. Cela inclut des utilitaires d'ingestion et de sérialisation à haute vitesse avec détection automatique de type, ainsi qu'un support spécialisé pour l'analyse de séries temporelles et l'agrégation multidimensionnelle. Le framework est conçu pour évoluer, permettant aux utilisateurs d'effectuer des opérations complexes de regroupement, de filtrage et de remodelage sur des jeux de données contenant des milliards de lignes tout en maintenant la stabilité et les performances du système.
Combines multiple datasets using equi, non-equi, rolling, range, or interval join methods.
Drift is a type-safe SQL persistence library and relational mapper that provides a structured way to map database tables to classes and execute SQL queries with build-time validation. It functions as a type-safe query builder and a wrapper for SQLite and PostgreSQL, eliminating manual result set parsing by binding query outputs to native objects. The project distinguishes itself through a build-time code generation system that produces type-safe APIs and validates raw SQL statements against database versions before execution. It features reactive query streaming, which transforms SQL queries
Supports merging rows from multiple tables using various join types to filter results based on referenced table conditions.