4 مستودعات
Execution of differential computations like aggregations and joins to maintain up-to-date streaming views.
Distinct from Incremental Data Streaming: Focuses on the execution of differential logic (joins/aggs) rather than just memory-efficient streaming of data.
Explore 4 awesome GitHub repositories matching data & databases · Incremental Computation. Refine with filters or upvote what's useful.
RisingWave is a cloud-native streaming database and real-time analytics engine that uses standard SQL to process continuous data streams. It functions as a streaming data lakehouse, combining the capabilities of a streaming SQL database with a platform that integrates streaming ingestion with open table formats. The system is distinguished by its use of the PostgreSQL wire protocol, allowing it to integrate with existing SQL tools and drivers. It employs a decoupled compute and storage architecture, persisting streaming state and materialized views in cloud object storage to enable independen
Executes incremental aggregations and joins to maintain real-time views of streaming data.
Fast n-dimensional filtering and grouping of records.
Computes histograms and top-K lists incrementally as filter conditions change, avoiding full recomputation.
Cocoindex is an incremental data processing engine that builds and maintains live indexes for AI agents, with a core focus on codebase indexing and knowledge graph extraction. The engine uses a function-graph execution model where user-defined Python functions are composed into a directed acyclic graph, and it processes data incrementally so only changed source records or code paths are re-computed, avoiding full recomputation at any scale. It supports automatic schema inference from transformation pipeline type annotations and provides full data lineage tracing, tagging every output record wi
Processes data changes incrementally so only modified content is re-computed, keeping large corpora fresh without full recomputation.
Stumpy هي مكتبة Python لتحليل السلاسل الزمنية القابلة للتوسع تركز على تنفيذ خوارزميات ملف تعريف المصفوفة (matrix profile). توفر إطار عمل لحساب ملفات تعريف المسافة لتحديد الأنماط المتكررة والشذوذ داخل بيانات السلاسل الزمنية. يتميز المشروع بقدرته على توسيع نطاق الحسابات الثقيلة عبر أجهزة GPU والمجموعات الموزعة باستخدام Dask. ويدعم التحليل متعدد الأبعاد لاكتشاف الزخارف عبر تدفقات البيانات المتزامنة ويوفر حساباً تزايدياً لتحليل التدفق في الوقت الفعلي. تغطي المكتبة مجموعة واسعة من تقنيات تعدين السلاسل الزمنية، بما في ذلك اكتشاف الزخارف، واكتشاف الشذوذ، ومطابقة أنماط التسلسل. كما توفر أدوات للتجزئة الدلالية لاكتشاف تغيرات النظام واستخراج سلاسل مرتبة زمنياً من أنماط التسلسل الفرعي المتشابهة.
Calculates matrix profiles incrementally as new data arrives to monitor time series in real time.