4 مستودعات
Horizontally scalable systems for managing large-scale vector embeddings with replication.
Distinct from Vector Memory Stores: Focuses on the distributed architectural nature rather than AI agent memory specifically
Explore 4 awesome GitHub repositories matching data & databases · Distributed Vector Stores. Refine with filters or upvote what's useful.
Weaviate is a cloud-native vector database and distributed vector store designed to save high-dimensional vectors alongside structured data. It functions as a hybrid search engine that combines vector similarity, keyword matching, and structured metadata filtering within a single query. The system is optimized for retrieval-augmented generation, integrating vector search with generative AI and reranking to power question-and-answer workflows. It distinguishes itself through the ability to merge semantic search with traditional keyword queries and structured metadata filters to improve result
Implements a horizontally scalable, replicated data system for managing large-scale vector embeddings.
DeepLake is AI data infrastructure consisting of a multimodal data lake, a hybrid search engine, and a serverless vector database. It provides a PostgreSQL-based AI data runtime that combines multimodal storage with streaming pipelines to load and shuffle datasets from cloud storage directly into deep learning training pipelines. The system utilizes lazy indexing to store and slice images, audio, and video without loading entire files into memory. It enables retrieval-augmented generation by persisting high-dimensional embeddings in a serverless vector store and implementing hybrid search tha
Provides a serverless vector database for storing high-dimensional embeddings to enable scalable retrieval for language models.
SPTAG هي مكتبة بحث عن أقرب جار تقريبي للمتجهات ومحرك بحث متجه موزع. توفر فهرس متجهات واسع النطاق مصمم لتنظيم واسترجاع المتجهات المتشابهة من مجموعات بيانات ضخمة باستخدام بحث التشابه عالي الأداء واستعلامات القرب. يعمل النظام كمدير فهرس متجهات ديناميكي، يدعم التحديثات التزايدية، والإدراج، وحذف المتجهات دون الحاجة إلى إعادة بناء الفهرس بالكامل. يقوم بتوسيع نطاق عمليات البحث عبر أجهزة متعددة للتعامل مع مجموعات البيانات واسعة النطاق وأحجام كبيرة من الطلبات عبر الإنترنت من خلال معالجة طلبات البحث الموزعة. ينفذ المشروع قدرات البحث والفهرسة باستخدام أشجار تقسيم المساحة ورسوم بيانية للجوار النسبي. يقوم بإجراء عمليات بحث عن أقرب جار تقريبي عبر اجتياز الرسم البياني التكراري وحسابات مقياس المسافة لتحديد أقرب المتجهات إلى نقطة الاستعلام.
Scales vector search operations across multiple machines to handle extremely large datasets and online requests.
هذا المستودع عبارة عن موقع توثيق تقني ومجموعة من الأدلة والمراجع لتنفيذ خدمات الشبكات والأمن والبنية التحتية السحابية. يعمل كبوابة لموقع ثابت ومحرك محتوى بدون واجهة (headless)، حيث يفصل ملفات المصدر عن طبقة العرض لتمكين عرض مرن. يستخدم المشروع توثيقاً قائماً على markdown مخزناً في مستودع Git خاضع للتحكم في الإصدارات. يوفر محتوى تقنياً متخصصاً بما في ذلك توثيق منصة ذكاء اصطناعي لبناء الوكلاء وإدارة الاستنتاج، ودليل بنية تحتية سحابية لتكوين DNS و CDN، ومرجع حوسبة الحافة للنشر بدون خادم، وتوثيق أمن الشبكات لـ Zero Trust وإدارة جدار الحماية.
Provides globally distributed SQL and key-value stores for direct querying from serverless functions.