Why is semi-technologies/weaviate a recommended Distributed Vector Stores GitHub Repositories repository?

Implements a horizontally scalable, replicated data system for managing large-scale vector embeddings.

Why is activeloopai/deeplake a recommended Distributed Vector Stores GitHub Repositories repository?

Provides a serverless vector database for storing high-dimensional embeddings to enable scalable retrieval for language models.

Why is microsoft/sptag a recommended Distributed Vector Stores GitHub Repositories repository?

Scales vector search operations across multiple machines to handle extremely large datasets and online requests.

Why is cloudflare/cloudflare-docs a recommended Distributed Vector Stores GitHub Repositories repository?

Provides globally distributed SQL and key-value stores for direct querying from serverless functions.

4 مستودعات

Awesome GitHub RepositoriesDistributed Vector Stores

Horizontally scalable systems for managing large-scale vector embeddings with replication.

Distinct from Vector Memory Stores: Focuses on the distributed architectural nature rather than AI agent memory specifically

Explore 4 awesome GitHub repositories matching data & databases · Distributed Vector Stores. Refine with filters or upvote what's useful.

اعثر على أفضل المستودعات باستخدام الذكاء الاصطناعي.سنبحث عن أفضل المستودعات المطابقة باستخدام الذكاء الاصطناعي.

semi-technologies/weaviate
semi-technologies/weaviate
16,337عرض على GitHub
Weaviate is a cloud-native vector database and distributed vector store designed to save high-dimensional vectors alongside structured data. It functions as a hybrid search engine that combines vector similarity, keyword matching, and structured metadata filtering within a single query. The system is optimized for retrieval-augmented generation, integrating vector search with generative AI and reranking to power question-and-answer workflows. It distinguishes itself through the ability to merge semantic search with traditional keyword queries and structured metadata filters to improve result
Implements a horizontally scalable, replicated data system for managing large-scale vector embeddings.
Go
عرض على GitHub16,337
activeloopai/deeplake
activeloopai/deeplake
9,175عرض على GitHub
DeepLake is AI data infrastructure consisting of a multimodal data lake, a hybrid search engine, and a serverless vector database. It provides a PostgreSQL-based AI data runtime that combines multimodal storage with streaming pipelines to load and shuffle datasets from cloud storage directly into deep learning training pipelines. The system utilizes lazy indexing to store and slice images, audio, and video without loading entire files into memory. It enables retrieval-augmented generation by persisting high-dimensional embeddings in a serverless vector store and implementing hybrid search tha
Provides a serverless vector database for storing high-dimensional embeddings to enable scalable retrieval for language models.
C++agentagentic-ragai
عرض على GitHub9,175
microsoft/sptag
microsoft/SPTAG
5,004عرض على GitHub
SPTAG هي مكتبة بحث عن أقرب جار تقريبي للمتجهات ومحرك بحث متجه موزع. توفر فهرس متجهات واسع النطاق مصمم لتنظيم واسترجاع المتجهات المتشابهة من مجموعات بيانات ضخمة باستخدام بحث التشابه عالي الأداء واستعلامات القرب. يعمل النظام كمدير فهرس متجهات ديناميكي، يدعم التحديثات التزايدية، والإدراج، وحذف المتجهات دون الحاجة إلى إعادة بناء الفهرس بالكامل. يقوم بتوسيع نطاق عمليات البحث عبر أجهزة متعددة للتعامل مع مجموعات البيانات واسعة النطاق وأحجام كبيرة من الطلبات عبر الإنترنت من خلال معالجة طلبات البحث الموزعة. ينفذ المشروع قدرات البحث والفهرسة باستخدام أشجار تقسيم المساحة ورسوم بيانية للجوار النسبي. يقوم بإجراء عمليات بحث عن أقرب جار تقريبي عبر اجتياز الرسم البياني التكراري وحسابات مقياس المسافة لتحديد أقرب المتجهات إلى نقطة الاستعلام.
Scales vector search operations across multiple machines to handle extremely large datasets and online requests.
C++
عرض على GitHub5,004
cloudflare/cloudflare-docs
cloudflare/cloudflare-docs
4,859عرض على GitHub
هذا المستودع عبارة عن موقع توثيق تقني ومجموعة من الأدلة والمراجع لتنفيذ خدمات الشبكات والأمن والبنية التحتية السحابية. يعمل كبوابة لموقع ثابت ومحرك محتوى بدون واجهة (headless)، حيث يفصل ملفات المصدر عن طبقة العرض لتمكين عرض مرن. يستخدم المشروع توثيقاً قائماً على markdown مخزناً في مستودع Git خاضع للتحكم في الإصدارات. يوفر محتوى تقنياً متخصصاً بما في ذلك توثيق منصة ذكاء اصطناعي لبناء الوكلاء وإدارة الاستنتاج، ودليل بنية تحتية سحابية لتكوين DNS و CDN، ومرجع حوسبة الحافة للنشر بدون خادم، وتوثيق أمن الشبكات لـ Zero Trust وإدارة جدار الحماية.
Provides globally distributed SQL and key-value stores for direct querying from serverless functions.
MDXcloudflaredocshacktoberfest
عرض على GitHub4,859

Awesome Distributed Vector Stores GitHub Repositories

semi-technologies/weaviate

activeloopai/deeplake

microsoft/SPTAG

cloudflare/cloudflare-docs

استكشف الوسوم الفرعية