2 مستودعات
Securely extracting and processing information from unstructured documents like PDFs and images.
Distinct from Private Data Processing Environments: Focuses on document content extraction and analysis rather than just the network isolation of the processing environment.
Explore 2 awesome GitHub repositories matching security & cryptography · Document Analysis. Refine with filters or upvote what's useful.
DocsGPT is a retrieval-augmented generation platform and private knowledge base used to build AI agents that perform grounded search and analysis. It functions as a multi-model AI orchestrator and enterprise agent builder, allowing for the integration of various local and cloud language models to customize reasoning and text generation. The project provides a visual environment for developing automated assistants using conditional logic and third-party API connectivity. It enables the creation of private AI agents capable of performing enterprise search and detailed document analysis using pr
Enables detailed analysis and insight extraction from private PDFs, office files, and images.
هذا المشروع عبارة عن أداة خاصة لتحليل المستندات تمكن من التفاعل الحواري مع ملفات PDF عن طريق تنفيذ جميع عمليات استنتاج ومعالجة نماذج اللغة بالكامل على الجهاز المحلي. من خلال تشغيل النماذج مباشرة داخل المتصفح أو البيئة المحلية، فإنه يضمن بقاء بيانات المستخدم الحساسة دون اتصال بالإنترنت وغير قابلة للوصول إلى الخوادم الخارجية أو موفري السحابة التابعين لجهات خارجية. يستخدم النظام التوليد المعزز بالاسترجاع (RAG) لتقديم إجابات واعية بالسياق، مدعوماً باستخراج نص المستند المحلي وفهرسة تضمين المتجهات (vector embedding). تسمح هذه البنية بالبحث الدلالي واسترجاع المعلومات دون الاعتماد على خدمات قواعد البيانات الخارجية أو الاتصال بالإنترنت. بعيداً عن القدرات الحوارية الأساسية، تتضمن الأداة ميزات مراقبة تسجل الخطوات الداخلية لمنطق النموذج وسلاسل الاسترجاع. يسمح تتبع التنفيذ هذا بتصحيح مشكلات الأداء وتحسين جودة الاستجابة أثناء عملية تحليل المستند.
Processes sensitive PDF files locally to answer questions without sending data to external servers.