8 Repos
Techniques for improving database execution plans, such as injecting literal values into SQL statements.
Distinct from Deterministic Value Injection: The candidates focus on language literals or test injection, not database-specific execution plan optimization.
Explore 8 awesome GitHub repositories matching data & databases · Query Plan Optimizations. Refine with filters or upvote what's useful.
Dapper is a high-performance micro-ORM and SQL object mapper for .NET. It functions as an ADO.NET extension library that adds data mapping capabilities directly to database connections, allowing SQL query results to be transformed into typed objects. The project prioritizes execution speed and low memory overhead by using intermediate language generation to map database columns to object properties. It further optimizes performance through the use of concurrent caching for mapping functions and literal value injection to improve database execution plans. The library covers a broad range of d
Allows embedding numeric or boolean constants directly into queries to improve database index efficiency.
Apache DataFusion is an extensible, columnar SQL query engine that runs embedded within a host application without requiring a separate server process. It processes data in columnar batches using Apache Arrow for memory-efficient analytics, and can scale analytic workloads across multiple nodes for parallel execution. The engine supports both SQL and DataFrame queries through a modular, streaming architecture that allows custom operators, data sources, functions, and optimizer rules. The engine distinguishes itself through its modular extension framework, which enables building custom query e
Applies advanced optimizations like filter pushdown, join reordering, and expression simplification automatically.
Soar is a suite of specialized tools designed for analyzing MySQL performance, advising on indexing, and optimizing SQL syntax. It functions as a performance analyzer, index advisor, and query optimizer to identify bottlenecks and suggest structural improvements for faster execution. The project distinguishes itself through a system for rewriting SQL statements into optimized equivalent versions using custom heuristic rules and patterns. It also features a dedicated index advisor that evaluates query patterns and database metadata to recommend the creation of new indexes. Its broader capabil
Applies a fixed set of rewrite rules to transform logical plans and improve execution speed.
Calcite ist ein Framework zum Parsen, Optimieren und Übersetzen von SQL-Abfragen in relationale Algebra für die Ausführung über verschiedene Datenquellen hinweg. Es fungiert als Cross-Source-Query-Engine, SQL-Parsing-Bibliothek und Optimierer für relationale Algebra. Das Projekt bietet eine kostenbasierte Optimierungs-Engine, die logische Abfragepläne mittels pluggbarer Regeln in effiziente physische Ausführungspläne umwandelt. Es nutzt Übersetzungsadapter, um Standard-SQL-Anfragen in die nativen Formate externer Datenbanken und Messaging-Systeme zu konvertieren, was Datenföderation über heterogene Speichersysteme hinweg ermöglicht. Das System deckt den gesamten Abfrage-Lebenszyklus ab, einschließlich SQL-Parsing und Validierung gegen Schemata, die Übersetzung von Ausdrücken in algebraische Operatoren sowie die Auswahl effizienter Ausführungspläne. Es enthält zudem ein Command-Line-Interface zum Ausführen von Abfragen und Verwalten von Verbindungen zu Datenquellen.
Transforms logical plans into efficient physical plans using pluggable rules and cost-based functions.
Redka ist ein SQL-basierter Key-Value-Store, der eine Redis-kompatible Schnittstelle implementiert. Er fungiert als relationale Datenbrücke, die nicht-relationale Protokollbefehle in relationale Abfragen übersetzt, um Persistenz und ACID-Transaktionen unter Verwendung eines SQL-Datenbank-Backends bereitzustellen. Das System ermöglicht die relationale Datenintrospektion, indem es interne Key-Value-Daten als SQL-Views offenlegt, was direkte Abfragen und Analysen mittels relationaler Syntax ermöglicht. Es kann als eigenständiger Netzwerkserver oder als eingebettete Bibliothek innerhalb einer Go-Anwendung bereitgestellt werden. Das Projekt unterstützt eine Vielzahl von Datenstrukturen, einschließlich Strings, Listen, Hashes, ungeordneten Sets und sortierten Sets. Es bietet Funktionen für das Key-Lifecycle-Management mit Time-to-Live-Metadaten, atomare numerische Operationen und Set-Algebra. Zur Verwaltung von Performance und Zugriff enthält es einen In-Memory-Speichermodus und einen Read-Only-Verbindungsmodus.
Exposes internal key-value data as SQL views to enable direct querying and analysis via relational syntax.
Dieses Projekt ist ein chinesisches Lokalisierungs-Repository und technisches Übersetzungsprojekt, das darauf ausgelegt ist, prägnante Programmierprojekte und technische Dokumentationen für chinesischsprachige Personen zugänglich zu machen. Es bietet eine Sammlung übersetzter Ressourcen und kuratierter Mappings von Informatik-Terminologie, um eine konsistente Übersetzung technischer Konzepte zu gewährleisten. Das Projekt implementiert einen Software-Lokalisierungs-Workflow, der englischsprachige technische Leitfäden und Codebase-Dokumentationen in das Chinesische konvertiert. Dieser Prozess nutzt eine technische Glossar-Ressource und ein ressourcengesteuertes Lokalisierungsmodell, um die ursprüngliche Bedeutung und den technischen Kontext des Quellmaterials beizubehalten. Das Repository deckt die Übersetzung technischer Dokumentationen und die Verwaltung standardisierter Übersetzungs-Mappings ab, um eine konsistente technische Wortwahl über diverse Softwareprojekte hinweg sicherzustellen.
Transforms query programs into more efficient versions using priority-based restructuring functions.
MiniOB is an open-source educational relational database kernel designed for learning the internals of database systems. It implements a dual-engine storage architecture combining B+ Tree and LSM-Tree, supports SQL parsing and query execution, and provides transactional processing with multi-version concurrency control. The system communicates with clients using the MySQL wire protocol and includes a vector database extension for storing and querying high-dimensional vectors. The project distinguishes itself through its comprehensive coverage of core database concepts in a single, learnable c
Rewrites query syntax trees using rules and statistics to produce faster execution plans.
This project is an educational resource and technical manual for Apache Spark, focused on the architecture and practical application of large-scale data processing. It serves as a guide for big data engineering and distributed computing, covering the principles of parallel processing and fault-tolerant data distribution. The material provides instructional content on designing distributed ETL pipelines and implementing data analysis workflows. It includes tutorials for polyglot data processing, offering patterns and examples for using Python, Scala, and Java within a unified environment. The
Provides detailed explanations of the Catalyst optimizer's rule-based and cost-based relational query transformation.