17 repositorios
Techniques for merging rows from multiple tables using various join types based on related columns.
Distinct from Table Data Processing: Specifically focuses on table joins and data combination, rather than general row-level processing.
Explore 17 awesome GitHub repositories matching data & databases · Table Joining Operations. Refine with filters or upvote what's useful.
Perspective is a columnar data analytics engine and high-performance visualization component powered by WebAssembly. It provides a system for analyzing and visualizing large or streaming datasets through interactive data grids and charts, utilizing a compiled binary to achieve near-native performance within the browser. The project distinguishes itself through a WebSocket-based data streaming interface and deep Apache Arrow integration, which minimize memory overhead when synchronizing tables between servers and clients. It acts as a remote query proxy capable of translating visualization con
Combines two source tables on a shared key to create a reactive read-only joined table.
pysheeet es una biblioteca de referencia técnica que proporciona una colección curada de fragmentos de código y patrones de implementación para el desarrollo avanzado en Python, integración de sistemas y computación de alto rendimiento. Sirve como una guía completa para implementar programación de red de bajo nivel, extensiones nativas en C y programación asíncrona y concurrente. El proyecto proporciona frameworks especializados para el desarrollo y despliegue de modelos de lenguaje de gran tamaño, incluyendo herramientas para inferencia distribuida en GPU y servicio de alto rendimiento. También incluye patrones detallados para la orquestación de clústeres de computación de alto rendimiento, cubriendo la asignación de recursos de GPU y la gestión de cargas de trabajo en múltiples nodos. La biblioteca cubre una amplia superficie de capacidades, incluyendo comunicación de red segura y criptografía, mapeo objeto-relacional y gestión de bases de datos, y la implementación de estructuras de datos y algoritmos complejos. También proporciona utilidades para la gestión de memoria, interoperabilidad nativa a través de interfaces de funciones externas e integración de sistemas operativos a nivel de sistema.
Implements data combination from multiple tables using inner and outer joins based on foreign keys.
Jeesite is a full-stack low-code development framework designed for building enterprise administrative portals using Spring Boot, MyBatis, and Vue. It functions as a comprehensive platform for creating administrative dashboards with integrated role-based access control and organizational data permission systems. The framework distinguishes itself through a combination of automated CRUD code generation and an integrated RAG platform that connects large language models to enterprise data via vector stores. It further incorporates a BPMN-based workflow engine to automate complex business process
Retrieves data from associated tables and maps results back to primary entities using various join types.
xorm is a relational mapper and object-relational mapping tool for Go. It translates Go structures into SQL queries and maps database rows back into native objects, providing a multi-dialect database driver that supports MySQL, PostgreSQL, SQLite, Oracle, SQL Server, and TiDB. The project features a read-write splitting manager that routes modification requests to a primary database and read requests to replicas. It includes a database schema synchronizer to automatically align table structures and indexes with application data models, as well as a fluent SQL query builder for constructing co
Combines data from multiple tables using various join types based on related columns.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Optimizes join performance by ensuring data is partitioned identically across tables to eliminate network shuffling.
pg is a PostgreSQL object-relational mapper (ORM) for Go that maps Go structs to database tables and provides a fluent query builder for constructing SQL statements programmatically. At its core, it automatically generates CREATE TABLE statements from Go struct definitions using struct tags and naming conventions, and builds queries through method chaining with placeholder-based parameter binding to prevent SQL injection. The library distinguishes itself through relation-aware join generation that automatically constructs JOIN clauses for has-one, has-many, many-to-many, and polymorphic assoc
Adds JOIN clauses with custom conditions to SELECT queries.
Este proyecto es una hoja de trucos de bases de datos relacionales y una guía de referencia de SQL. Proporciona una colección de ejemplos de sintaxis y documentación de consultas para gestionar bases de datos relacionales utilizando lenguaje de consulta estructurado. La herramienta está implementada como un sitio estático con documentación buscable en el lado del cliente, lo que permite el filtrado inmediato de contenido técnico a través de un índice basado en navegador. La referencia cubre la gestión de bases de datos relacionales, incluyendo la recuperación de datos, la gestión de esquemas de bases de datos y el mantenimiento de registros. También incluye orientación sobre la manipulación de datos relacionales mediante uniones de tablas (joins) y la generación de informes agregados.
Provides syntax examples for combining data from multiple tables using various SQL join types.
Este proyecto es un tutorial completo de análisis de datos de pandas y guía de instrucción diseñada para aprender la manipulación y el análisis de datos. Sirve como una guía de procesamiento de datos tabulares y un manual para el análisis de series temporales, proporcionando un enfoque estructurado para limpiar, fusionar y transformar conjuntos de datos. El repositorio funciona como un curso de ingeniería de características de datos, proporcionando tutoriales sobre la construcción y selección de características de conjuntos de datos para mejorar el rendimiento del modelo de aprendizaje automático. También incluye una guía de operaciones de datos vectorizadas para realizar cálculos matemáticos elemento a elemento y manipulaciones de matrices. El material cubre una amplia gama de capacidades, incluyendo flujos de trabajo de limpieza de datos, tareas de integración de datos y análisis de datos tabulares. Proporciona orientación sobre el procesamiento de información textual, el manejo de datos categóricos y la optimización de la velocidad de ejecución para grandes conjuntos de datos. El proyecto se entrega como una serie de Jupyter Notebooks que contienen ejercicios prácticos y problemas de práctica específicos.
Provides tutorials on merging rows from multiple tables using various relational join types.
dplyr es una librería de manipulación de datos en R que proporciona una gramática para transformar data frames tabulares. Funciona como un procesador de data frames en memoria y una herramienta de álgebra de datos relacionales, utilizando un conjunto consistente de verbos para filtrar, seleccionar y resumir datos. El proyecto incluye un motor de traducción SQL que convierte expresiones de manipulación de datos de alto nivel en consultas optimizadas. Esto permite a los usuarios realizar transformaciones directamente en bases de datos relacionales remotas y almacenamiento en la nube sin necesidad de descargar los datos localmente. La librería cubre una amplia gama de operaciones tabulares, incluyendo la mutación de columnas, el subconjunto de filas y la unión de datos relacionales. También proporciona capacidades para el análisis de datos agrupados, permitiendo particionar conjuntos de datos para realizar agregaciones y resúmenes independientes.
Combines tables using equality, inequality, or rolling joins to find the closest matches.
Sequel is a relational database toolkit for Ruby that provides object-relational mapping, a fluent SQL query builder, and schema migration capabilities. It maps database tables to Ruby classes with support for associations, validations, lifecycle hooks, and eager loading, offering a comprehensive ORM layer for building data-centric applications. Sequel distinguishes itself through a plugin-based extension architecture that allows composable customization of models, databases, and datasets without relying on deep inheritance hierarchies. It includes a thread-safe connection pool with support f
Supports inner, left, and other join types to combine data from multiple tables.
Bun es un mapeador objeto-relacional (ORM) con seguridad de tipos para Go que prioriza la construcción de consultas SQL primero y el mapeo de resultados. Funciona como un constructor de consultas SQL programable, un gestor de conexiones de base de datos y una herramienta para mapear tablas de bases de datos a structs de Go. El proyecto se distingue por un sistema de soporte SQL multi-dialecto, permitiendo que una única base de código interactúe con diferentes motores de base de datos a través de una interfaz consistente. Incluye una herramienta de observabilidad de base de datos incorporada para la interceptación de consultas, rastreo distribuido y registro, así como una herramienta de migración de esquemas para el versionado de cambios estructurales. La biblioteca cubre una amplia gama de operaciones de datos, incluyendo procesamiento por lotes, upserts, eliminaciones lógicas (soft deletes) y la gestión de datos relacionales como asociaciones polimórficas. Proporciona capacidades para análisis SQL avanzados utilizando expresiones de tabla comunes (CTE) y funciones de ventana, junto con la gestión de transacciones atómicas y agrupación de conexiones (connection pooling). La gestión de esquemas es compatible a través de una interfaz de línea de comandos para aplicar scripts de migración versionados.
Provides capabilities for combining rows from multiple tables using various SQL join types.
PostgREST es una herramienta que transforma automáticamente un esquema de base de datos PostgreSQL en una API RESTful lista para producción. Sirve como capa de acceso a base de datos y motor de consultas que mapea solicitudes HTTP directamente a consultas SQL, proporcionando una interfaz low-code para ejecutar operaciones de creación, lectura, actualización y eliminación (CRUD) sin requerir código boilerplate manual. El proyecto se distingue por utilizar la generación de API basada en esquemas y el descubrimiento basado en metadatos para exponer las tablas de la base de datos como recursos navegables. Extiende las capacidades CRUD estándar mediante la ejecución de SQL personalizado y con plantillas, un sistema de middleware basado en plugins para inyectar lógica de negocio y la capacidad de cargar librerías compartidas externas en tiempo de ejecución. El sistema cubre una amplia gama de capacidades, incluyendo consultas de datos complejas con joins de tablas, agregaciones y búsqueda de texto completo. Implementa un framework de seguridad integral que incluye autenticación basada en tokens, permisos granulares a nivel de tabla y gestión de CORS. Las características operativas adicionales incluyen caché de resultados local, monitoreo de salud del servidor y conectividad para SQL distribuido y Amazon Redshift. La instalación es compatible con múltiples entornos, incluyendo como binario independiente o mediante plantillas de automatización de Docker Compose y Heroku.
Combines data from two tables in one request using specified join types and conditional operators.
FreeSql es un mapeador objeto-relacional (ORM) y capa de acceso a datos para .NET que traduce código orientado a objetos a SQL para múltiples proveedores de bases de datos relacionales. Funciona como un constructor de consultas SQL fluido y sincronizador de esquemas de base de datos, permitiendo a los desarrolladores alinear las estructuras de tablas e índices de la base de datos con las definiciones de clases de entidad. El framework está optimizado específicamente para .NET Native AOT para garantizar huellas de memoria reducidas y tiempos de inicio más rápidos. Incluye un gestor de tráfico de base de datos para distribuir la carga a través de división de lectura-escritura, fragmentación de tablas dinámica y aislamiento de datos basado en inquilinos. Las capacidades amplias incluyen ingesta de datos de alto rendimiento utilizando mecanismos de copia masiva específicos del proveedor, consultas avanzadas con funciones de ventana y CTEs recursivos, y monitoreo basado en AOP para auditar cambios de datos. El sistema también proporciona herramientas de gestión de esquemas para migraciones automatizadas y utilidades de desarrollo para generar clases de entidad a partir de metadatos de base de datos.
Modifies data in one table based on matching values found in another related table through a join.
test_db is a collection of tools for validating database integrity, benchmarking system throughput, and generating synthetic schemas and datasets. It includes a sample corporate employee database for MySQL, a SQL dataset generator for creating representative records, and an integrity validator that uses checksums and record counts to verify data consistency across different database engines. The project provides a database performance benchmark consisting of complex queries and stored procedures designed to measure system response times and throughput. These tools simulate real-world workload
Evaluates system throughput by executing complex aggregation queries that force heavy resource usage across multiple tables.
Velox es un motor de ejecución de consultas en C++ de alto rendimiento y biblioteca de procesamiento de datos columnares. Sirve como un framework componible para implementar motores de consulta analíticos, proporcionando un evaluador de expresiones vectorizadas y un toolkit para sistemas de gestión de datos. El proyecto se distingue por su uso de ejecución columnar vectorizada y asignación de memoria basada en arena para procesar conjuntos de datos a gran escala. Cuenta con optimizaciones especializadas como caché de tablas de broadcast join, push-down de filtros dinámicos y codificación de diccionario para reducir la sobrecarga de memoria y acelerar las lecturas analíticas. El motor cubre una amplia gama de capacidades analíticas, incluyendo la implementación de hash, merge y semi joins, así como agregación paralela multietapa y cálculo de funciones de ventana. Proporciona primitivas para almacenamiento columnar en memoria, decodificación de datos Parquet e integración con almacenamiento en la nube. La extensibilidad se proporciona a través de un sistema de registro de funciones para funciones escalares y agregadas personalizadas, con bindings de alto nivel disponibles para conectar la lógica de C++ a Python.
Stores hash tables in a global cache to let subsequent tasks reuse data without rebuilding it.
This project is a high-performance tabular data processing framework for R, designed to handle massive datasets with memory efficiency and speed. It provides an enhanced data structure that utilizes reference semantics and in-place modification to perform complex transformations without the overhead of unnecessary object copying. The library distinguishes itself through its low-level architectural optimizations, including multi-threaded parallel processing, radix-based sorting, and memory-mapped file parsing. By offloading critical data manipulation and aggregation routines to compiled C code
Combines multiple datasets using equi, non-equi, rolling, range, or interval join methods.
Drift is a type-safe SQL persistence library and relational mapper that provides a structured way to map database tables to classes and execute SQL queries with build-time validation. It functions as a type-safe query builder and a wrapper for SQLite and PostgreSQL, eliminating manual result set parsing by binding query outputs to native objects. The project distinguishes itself through a build-time code generation system that produces type-safe APIs and validates raw SQL statements against database versions before execution. It features reactive query streaming, which transforms SQL queries
Supports merging rows from multiple tables using various join types to filter results based on referenced table conditions.