14 مستودعات
Systems for maintaining data consistency by replicating changes between database instances.
Distinguishing note: Focuses on continuous synchronization and incremental replication, distinct from one-time migration.
Explore 14 awesome GitHub repositories matching data & databases · Database Replication Tools. Refine with filters or upvote what's useful.
TiDB is a horizontally scalable, distributed SQL database designed to provide consistent transactional storage and high-performance analytical processing within a single unified architecture. It utilizes a decoupled compute-storage design and a distributed key-value storage layer to ensure horizontal scalability and efficient range-based queries. By employing a consensus-based replication algorithm, the system maintains high availability and automatic failover across multiple nodes and geographical regions. The platform distinguishes itself through its hybrid transactional and analytical proc
TiDB transfers full datasets and replicates incremental changes from external database systems into the cluster to support seamless data integration and synchronization.
Dokploy is a self-hosted platform-as-a-service designed to simplify the deployment and management of containerized applications and databases. It provides a centralized control plane that decouples administrative management from application workloads, allowing users to oversee infrastructure across multiple server nodes through a unified web interface or a command-line tool. The platform distinguishes itself through an extensive library of pre-configured application templates, enabling the rapid deployment of databases, identity providers, and various productivity or development tools. It sup
Facilitates real-time data synchronization and replication between databases.
This project is a reactive, offline-first NoSQL database engine designed for JavaScript applications. It provides a robust framework for managing application state by synchronizing data across browsers, mobile devices, and server-side runtimes. By treating local storage as the primary source of truth, it enables applications to remain functional without network connectivity, automatically reconciling changes with remote backends once a connection is restored. The database distinguishes itself through a modular architecture that supports cross-environment synchronization and high-performance d
Implements control logic to dynamically update authentication headers during active replication sessions.
RisingWave is a cloud-native streaming database and real-time analytics engine that uses standard SQL to process continuous data streams. It functions as a streaming data lakehouse, combining the capabilities of a streaming SQL database with a platform that integrates streaming ingestion with open table formats. The system is distinguished by its use of the PostgreSQL wire protocol, allowing it to integrate with existing SQL tools and drivers. It employs a decoupled compute and storage architecture, persisting streaming state and materialized views in cloud object storage to enable independen
Streams database changes in real-time using embedded engines and logical replication.
This project is a PostgreSQL client library and SQL query builder for JavaScript and TypeScript. It provides a low-level database driver and connection manager to handle database sessions, along with a logical replication client for monitoring real-time changes. The library distinguishes itself with a high-performance bulk data streamer that utilizes the database copy command for importing and exporting large datasets. It also implements a logical replication protocol to facilitate real-time database synchronization through change subscriptions and channel-based notifications. The toolset co
Implements the logical replication protocol to stream real-time database change notifications and row-level updates.
ParadeDB is a database extension that integrates full-text search, vector database capabilities, and real-time analytics directly into a relational engine. It functions as a plugin that adds new storage and query execution capabilities to an existing database architecture. The project distinguishes itself by supporting hybrid search workflows that combine lexical keyword matching with dense and sparse vector similarity in a single query. It utilizes reciprocal rank fusion to merge these ranked result sets and employs logical replication to synchronize data from external instances, removing th
Ingests data changes from external database instances using logical replication protocols to eliminate manual ETL processes.
Otter is a distributed database synchronization system and change data capture tool designed to replicate data between databases across multiple geographic regions. It functions as a synchronization orchestrator and ETL data pipeline that mirrors records and associated files in real time. The system employs incremental log parsing to capture database changes and utilizes a consistency-based convergence algorithm and loop-avoidance logic to manage bi-directional replication. It processes data through a pipeline of selection, extraction, transformation, and loading to handle joins and format co
A distributed system designed for replicating database records across remote data centers with built-in loop avoidance.
Pigsty هي منصة تنسيق بنية تحتية لقاعدة بيانات شاملة مصممة لأتمتة دورة الحياة الكاملة لمجموعات PostgreSQL عالية التوافر. تعمل كإطار عمل للبنية التحتية ككود يدير تنسيق المجموعة، وتوفير العقد، واكتشاف الخدمة من خلال دفاتر تشغيل متطابقة. من خلال دمج آليات الإجماع الموزعة، تضمن المنصة تجاوز الفشل الآلي وإنفاذ الحالة المتسقة عبر بيئات متنوعة، بما في ذلك الأجهزة المعدنية والبنية التحتية الافتراضية. تتميز المنصة بمجموعة قوية من القدرات التشغيلية التي تمتد إلى ما وراء إدارة قاعدة البيانات القياسية. تتميز بخط أنابيب مراقبة مدمج يجمع المقاييس والسجلات والآثار في لوحات تحكم مركزية لمراقبة الأداء في الوقت الفعلي والتحليل التشخيصي. بالإضافة إلى ذلك، توفر إطار عمل ترحيل يحاكي بروتوكولات الأسلاك المملوكة وصيغة SQL، مما يسمح بدمج أعباء عمل قاعدة بيانات المؤسسات القديمة في بيئات علائقية حديثة. يغطي النظام مساحة وظيفية واسعة، بما في ذلك إدارة التخزين المتقدمة مع استنساخ النسخ عند الكتابة للنشر السريع، وتنسيق قواعد البيانات المتعددة الذي ينسق المحركات العلائقية مع التخزين المؤقت وتخزين الكائنات. كما يدمج تقوية الأمان، والنسخ الاحتياطي والاستعادة الآلي، وتوجيه حركة المرور من خلال وكلاء طبقيين لفصل اتصالات العميل عن طوبولوجيا المجموعة الأساسية. يتم توزيع المشروع كنموذج مرآة حزمة مكتفٍ ذاتياً، مما يتيح النشر المتسق وإدارة التبعية في البيئات الآمنة أو المعزولة.
Moves data between database instances using logical replication and failover slots.
go-mysql هو مجموعة أدوات للغة البرمجة Go مصممة لتنفيذ معالجات بروتوكول MySQL، وأنظمة نسخ السجل الثنائي، والخوادم الوهمية، وأدوات تحليل المخططات. توفر المكتبات اللازمة للتفاعل مع خوادم MySQL من خلال بروتوكولات الشبكة الأصلية وتدفقات السجل الثنائي. يمكن المشروع من إنشاء وكلاء قاعدة بيانات مخصصين أو خوادم وهمية عن طريق تحليل وفك تشفير حزم الشبكة منخفضة المستوى. كما يتضمن أداة نسخ متماثل لبث ومعالجة السجلات الثنائية لمزامنة البيانات عبر أنظمة تخزين مختلفة، إلى جانب محلل مخططات لاستخراج وتحليل تعريفات هيكل قاعدة البيانات. تغطي مجموعة الأدوات مجموعة واسعة من قدرات تكامل قاعدة البيانات، بما في ذلك إدارة الاتصال، وتنفيذ الاستعلام، وإدارة سير عمل نسخ البيانات في الوقت الفعلي. كما تدعم أتمتة ترحيلات المخططات ومزامنة السجلات مع أنظمة التخزين الخارجية.
Maintains data consistency by replicating incremental changes between MySQL database instances.
هذا المشروع عبارة عن مشغل (operator) لـ Kubernetes مصمم لنشر وإدارة مجموعات قواعد بيانات PostgreSQL للإنتاج باستخدام تكوينات تعريفية. يعمل كوحدة تحكم تقوم بمزامنة الحالة الفعلية لمجموعات قواعد البيانات مع الحالة المطلوبة، مما يوفر نظاماً لتنسيق التوافر العالي، والنسخ الاحتياطي والاستعادة التلقائي، وإدارة قواعد البيانات داخل الحاويات. يتميز المشغل بمجموعة شاملة لحماية البيانات تدعم الاستعادة في نقطة زمنية محددة، والنسخ الاحتياطي متعدد الأنماط إلى تخزين الكائنات السحابي، واستنساخ المجموعات. يضمن التوافر المستمر باستخدام الإجماع الموزع (distributed consensus) للفشل التلقائي (failover) ويدعم إدارة حركة مرور متطورة من خلال مجمع اتصالات (connection pooler) متكامل. يغطي المشروع مجموعة واسعة من القدرات التشغيلية، بما في ذلك النسخ المتماثل المتزامن وغير المتزامن، وجمع القياسات عن بُعد (telemetry) عبر مجموعة مراقبة مخصصة، وإدارة الهوية الآمنة مع تدوير تلقائي لشهادات TLS. كما يوفر أدوات لتوسيع حجم التخزين، وتحديثات محرك قاعدة البيانات، ودمج إضافات قواعد البيانات المختلفة. يتم تثبيت وحدة التحكم في مجموعة باستخدام ملفات بيان قابلة للتخصيص لتمكين التنسيق التعريفي لبيئة قاعدة البيانات.
Supports moving data between active database clusters using logical replication publications and subscriptions.
RedisShake هي أداة لترحيل ومزامنة بيانات Redis و Valkey. تسهل الأداة نقل البيانات بين النماذج المستقلة (standalone)، وsentinel، وcluster، وتعمل كأداة ترحيل لقواعد البيانات عبر إصدارات مختلفة، بالإضافة إلى كونها أداة لاستعادة البيانات من ملفات النسخ الاحتياطي. يوفر المشروع خط معالجة بيانات قابل للبرمجة يسمح بتصفية المفاتيح (keys)، وإعادة تعيين فهارس قواعد البيانات، وتنفيذ نصوص Lua البرمجية لتعديل الأوامر والمفاتيح أثناء النقل. كما تدعم الأداة المزامنة بدون توقف (zero-downtime) عبر نسخ اللقطات (snapshots) وبث التغييرات التزايدية في الوقت الفعلي. تغطي الأداة مجموعة واسعة من طرق الاستخراج، بما في ذلك الترحيل القائم على النسخ المتماثل، والترحيل القائم على المسح (scan)، واستعادة ملفات النسخ الاحتياطي. وتتضمن إمكانيات لاكتشاف عقد العناقيد (cluster nodes)، وتحديد العقدة الرئيسية في sentinel، والتحقق من توافق الإصدارات لضمان الاستقرار أثناء عمليات النقل بين الإصدارات المختلفة.
Synchronizes data from a source instance by mimicking a slave node using replication protocols to ensure minimal downtime.
Nominatim is a self-hosted geospatial search engine and geocoding server that utilizes OpenStreetMap data. It provides a complete infrastructure for forward geocoding, converting addresses or place names into geographic coordinates, and reverse geocoding, translating coordinates into human-readable physical addresses. The project features a dedicated data importer that parses raw map data into a PostgreSQL geospatial database. It distinguishes itself through a configurable import pipeline that uses style files to filter map features and an importance-based ranking system to prioritize search
Connects to a replication service to download and apply incremental updates to the local dataset.
pgdog is a PostgreSQL sharding proxy, distributed SQL router, and connection pooler. It is designed to enable horizontal data distribution by splitting tables and indices across multiple independent servers to scale storage and processing capacity. The project distinguishes itself through online resharding capabilities, using logical replication to move data between shards without application downtime. It supports multiple routing strategies, including hash, list, and range-based query routing, and manages distributed atomic transactions using a two-phase commit process to ensure consistency
Implements online resharding by streaming row changes between shards using logical replication protocols.
pgeasyreplicate هي أداة سطر أوامر مصممة لتنسيق ترحيلات قاعدة البيانات والنسخ المتماثل المنطقي بين مثيلات PostgreSQL. تعمل كمنسق ترحيل يدير دورة حياة مزامنة البيانات بأكملها، من نشر المخطط الأولي إلى الانتقال النهائي لحركة مرور التطبيق. تتميز الأداة بمنطق تبديل مدرك للحالة، والذي ينسق حركة العمليات عن طريق التحقق من تأخير النسخ المتماثل وفرض أقفال الكتابة لمنع فقدان البيانات. توفر تحكماً دقيقاً في حركة البيانات من خلال السماح للمستخدمين بتنظيم الجداول في مجموعات نسخ متماثل محددة، مما يضمن مزامنة السجلات المقصودة فقط بين بيئات المصدر والهدف. بعيداً عن مهام الترحيل الأساسية، يتضمن المشروع إمكانيات مراقبة شاملة لتتبع صحة المزامنة وتأخير النسخ المتماثل في الوقت الفعلي. يدعم التكامل مع الأنظمة الخارجية عن طريق دفع تحديثات الحالة ومقاييس النسخ المتماثل إلى نقاط نهاية خطاف الويب المكونة، مما يسهل المراقبة المؤتمتة داخل سير عمل البنية التحتية الحالية.
Automates data synchronization between source and target databases to ensure seamless migrations.