# questdb/questdb

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/questdb-questdb).**

16,704 stars · 1,539 forks · Java · apache-2.0

## Links

- GitHub: https://github.com/questdb/questdb
- Homepage: https://questdb.com
- awesome-repositories: https://awesome-repositories.com/repository/questdb-questdb.md

## Topics

`capital-markets` `cpp` `database` `financial-analysis` `grafana` `java` `kdb` `low-latency` `market-data` `olap` `parquet` `postgresql` `questdb` `real-time-analytics` `simd` `sql` `tick-data` `time-series` `time-series-database` `tsdb`

## Description

QuestDB is a high-performance, distributed time-series database designed for the ingestion, storage, and analysis of massive datasets. It functions as a real-time analytics platform that utilizes a columnar storage engine to optimize disk input and output, enabling efficient analytical scans and complex windowing operations on streaming data.

The platform distinguishes itself through specialized capabilities for handling asynchronous time-series streams, including advanced join algorithms that align disparate data sets based on precise timestamp lookups. It supports high-volume ingestion through non-blocking data structures, allowing for simultaneous data entry and analytical querying without performance degradation. By decoupling compute from storage, the system enables independent scaling and utilizes shared object storage to maintain a consistent source of truth across distributed replicas.

The system provides a comprehensive suite of tools for data lifecycle management, including automated partitioning, tiered storage, and incremental materialized views that update as new information arrives. It supports standard SQL for data exploration and offers granular security controls, including role-based access and encrypted communication, to ensure data governance. The platform is built to operate across diverse environments, ranging from on-premises setups to cloud-native deployments.

## Tags

### Data & Databases

- [Time Series Databases](https://awesome-repositories.com/f/data-databases/time-series-databases.md) — Functions as a high-performance database engine optimized for ingesting, storing, and querying massive volumes of timestamped data.
- [As-of Merges](https://awesome-repositories.com/f/data-databases/as-of-merges.md) — Aligns disparate time-series data sets using efficient nearest-timestamp matching algorithms.
- [Distributed Data Warehouses](https://awesome-repositories.com/f/data-databases/distributed-data-warehouses.md) — Decouples compute from storage to provide a scalable, distributed infrastructure for multi-tiered data lifecycles.
- [High-Volume Data Ingestion](https://awesome-repositories.com/f/data-databases/high-volume-data-ingestion.md) — Processes millions of incoming data points per second while maintaining integrity for out-of-order event streams.
- [Real-time Analytics Platforms](https://awesome-repositories.com/f/data-databases/real-time-analytics-platforms.md) — Provides a real-time analytics platform for low-latency processing and complex windowing operations on streaming data.
- [Columnar Storage Engines](https://awesome-repositories.com/f/data-databases/columnar-storage-engines.md) — Utilizes a columnar storage architecture to accelerate analytical scans and improve compression for massive datasets.
- [Time Series Data Storage](https://awesome-repositories.com/f/data-databases/data-engineering-infrastructure/data-persistence-storage/data-storage/specialized-database-engines/time-series-data-storage.md) — Manages massive historical datasets across tiered storage systems for efficient long-term retention and analytical querying.
- [Financial Analytics](https://awesome-repositories.com/f/data-databases/financial-analytics.md) — Computes complex market metrics by applying window functions and specialized joins directly to incoming raw tick data streams. ([source](https://questdb.com/capital-markets))
- [Time-Series SQL Querying](https://awesome-repositories.com/f/data-databases/time-series-sql-querying.md) — Executes complex analytical queries using standard SQL extensions for time-bucketed aggregation and multi-horizon joins. ([source](https://questdb.com/compare/questdb-vs-kdb))
- [Data Lifecycle Management](https://awesome-repositories.com/f/data-databases/data-governance-modeling/data-management-governance/data-lifecycle-retention/data-lifecycle-management.md) — Automates data retention, downsampling, and archival to tiered cloud object storage using time-to-live policies. ([source](https://questdb.com/enterprise))
- [Multi-Tier Data Lifecycles](https://awesome-repositories.com/f/data-databases/data-governance-modeling/data-management-governance/data-lifecycle-retention/multi-tier-data-lifecycles.md) — Automates the movement of data partitions between high-performance local storage and cost-effective object storage based on retention policies.
- [High Availability Architectures](https://awesome-repositories.com/f/data-databases/high-availability-architectures.md) — Ensures continuous database availability through multi-region read replicas and automated failover mechanisms. ([source](https://questdb.com/download))
- [High-Throughput Ingestion Pipelines](https://awesome-repositories.com/f/data-databases/high-throughput-ingestion-pipelines.md) — Uses non-blocking data structures to ingest high-volume streaming records without stalling analytical query operations.
- [Materialized Views](https://awesome-repositories.com/f/data-databases/materialized-views.md) — Refreshes downstream aggregates and time-series metrics incrementally as new data arrives to ensure up-to-date analytical insights. ([source](https://questdb.com/capital-markets))
- [Storage-Compute Architectures](https://awesome-repositories.com/f/data-databases/storage-compute-architectures.md) — Decouples storage from compute resources to allow independent scaling of processing power and data capacity. ([source](https://questdb.com/download))
- [Storage Tiering](https://awesome-repositories.com/f/data-databases/storage-tiering.md) — Automates data movement across storage tiers to provide seamless query access across hot and cold data. ([source](https://questdb.com/compare/questdb-vs-kdb))
- [Vectorized Execution Engines](https://awesome-repositories.com/f/data-databases/vectorized-execution-engines.md) — Processes data batches using SIMD instructions to maximize CPU throughput during complex time-series aggregations.
- [Backup and Recovery](https://awesome-repositories.com/f/data-databases/backup-and-recovery.md) — Performs incremental snapshots to object storage and supports point-in-time recovery for disaster resilience. ([source](https://questdb.com/enterprise))
- [Data Replication](https://awesome-repositories.com/f/data-databases/data-replication.md) — Uses shared object storage as a consistent source of truth to synchronize data across standby nodes and read-only replicas. ([source](https://questdb.com/enterprise))
- [Concurrent Query Processing](https://awesome-repositories.com/f/data-databases/high-performance-ingestion/concurrent-query-processing.md) — Supports simultaneous high-throughput ingestion and parallel analytical queries to maintain consistent performance under heavy workloads. ([source](https://questdb.com/compare/questdb-vs-kdb))
- [Write-Ahead Logging](https://awesome-repositories.com/f/data-databases/write-ahead-logging.md) — Appends incoming data to a sequential log to ensure durability and crash recovery before merging into main storage.
- [Deduplication](https://awesome-repositories.com/f/data-databases/data-engineering-infrastructure/data-extraction-ingestion/data-ingestion/deduplication.md) — Identifies and removes redundant records based on primary keys or timestamps to ensure data integrity during high-volume ingestion. ([source](https://questdb.com/blog/2023-11-16-solving-duplicate-data-performant-deduplication))
- [Data Export](https://awesome-repositories.com/f/data-databases/data-export.md) — Streams raw data directly into external analysis tools without creating unnecessary memory copies. ([source](https://questdb.com/capital-markets))
- [Catalog Integration](https://awesome-repositories.com/f/data-databases/data-export/catalog-integration.md) — Publishes table metadata to open catalog formats to enable direct data access from external analytical tools. ([source](https://questdb.com/compare/questdb-vs-kdb))

### Business & Productivity Software

- [Financial Analysis Tools](https://awesome-repositories.com/f/business-productivity-software/financial-operational-management/billing-financial-systems/financial-analysis-tools.md) — Calculates complex financial metrics like volatility and order book depth using high-frequency tick data.

### Security & Cryptography

- [Role-Based Access Controls](https://awesome-repositories.com/f/security-cryptography/role-based-access-controls.md) — Enforces granular security through role-based access control, column-level permissions, and encrypted communication channels. ([source](https://questdb.com/capital-markets))
- [Compliance and Governance](https://awesome-repositories.com/f/security-cryptography/governance-policy-frameworks/compliance-governance.md) — Provides granular security controls and audit logging to ensure data governance and regulatory compliance.

### DevOps & Infrastructure

- [Object Storage Integration](https://awesome-repositories.com/f/devops-infrastructure/object-storage-integration.md) — Synchronizes state across distributed replicas by utilizing centralized cloud object storage as the primary source of truth.
- [Deployment Models](https://awesome-repositories.com/f/devops-infrastructure/deployment-models.md) — Supports flexible deployment across on-premises, cloud-native, and managed environments to accommodate diverse infrastructure requirements. ([source](https://questdb.com/enterprise))

### System Administration & Monitoring

- [Latency Monitoring](https://awesome-repositories.com/f/system-administration-monitoring/log-analysis-tools/latency-monitoring.md) — Measures end-to-end message travel time to identify performance bottlenecks and ensure operational reliability. ([source](https://questdb.com/capital-markets))
- [Real-Time Monitoring Systems](https://awesome-repositories.com/f/system-administration-monitoring/real-time-monitoring-systems.md) — Tracks system latency and event streams to detect performance anomalies in distributed environments.