2 مستودعات
Tools that validate the correctness and reliability of a model's function calling and API triggering capabilities.
Distinct from Function Calling Interfaces: Focuses on the evaluation/verification of the calls, whereas the parent focuses on the interface that enables the calls.
Explore 2 awesome GitHub repositories matching artificial intelligence & ml · Function Call Verifiers. Refine with filters or upvote what's useful.
Giskard هو إطار عمل للتقييم، ومكتبة للاختبار، ونظام لمراقبة الجودة لنماذج اللغات الكبيرة (LLM) ووكلاء الذكاء الاصطناعي. يعمل كأداة لقياس أداء النماذج وموثوقيتها، ويوفر قدرات متخصصة للتحقق من خطوط أنابيب توليد الاسترجاع المعزز (RAG). يتميز المشروع بأداة آلية للاختبار الهجومي (red teaming) وماسح أمني مصمم لتحديد الثغرات، وحقن الأوامر (prompt injections)، ومخاطر السلامة. يستخدم الفحص العدائي وتوليد حالات الحافة الاصطناعية لقياس متانة النموذج واكتشاف تسريب المعلومات. يغطي النظام مجموعة واسعة من القدرات، بما في ذلك اكتشاف الدقة الواقعية والهلوسة، وقياس الأداء المنطقي والاستدلالي، واكتشاف التحيز. يوفر أدوات لاختبار الانحدار، وتقييم مكونات RAG، والتوليد الآلي لحالات الاختبار من قواعد المعرفة. يتضمن النظام ميزات إدارية لمساحات عمل الفريق التعاونية، والتحكم في الوصول القائم على الأدوار، وخطوط أنابيب التقييم المجدولة لمراقبة انحراف الأداء بمرور الوقت.
Validates the ability to trigger correct functions and APIs across multiple languages, including parallel execution.
ACI هي منصة لاستدعاء الأدوات ونظام مركزي لإدارة وتنفيذ عمليات الخدمات الخارجية والنصوص البرمجية المخصصة لسير عمل الوكلاء (agentic workflows). تعمل كخادم بروتوكول سياق النموذج (Model Context Protocol) موحد يتيح لوكلاء الذكاء الاصطناعي وبيئات التطوير (IDEs) اكتشاف وتنفيذ مجموعات أدوات متنوعة ديناميكياً. تتميز المنصة بفهرس قدرات باللغة الطبيعية ومطابقة النوايا للبحث عن الأدوات المتاحة بناءً على متطلبات المهام. توفر المنصة مصادقة للخدمات الخارجية وربط الحسابات عبر إدارة بيانات الاعتماد المستندة إلى OAuth للسماح بتنفيذ الأدوات بشكل آمن نيابة عن المستخدمين. يغطي النظام مجموعة واسعة من القدرات بما في ذلك تعيين استدعاء الوظائف، وتنسيق الخدمات الخارجية، ووقت تشغيل قابل للتوصيل لدمج النصوص البرمجية المحلية كإضافات أدوات قابلة للتنفيذ. كما يتضمن إدارة تكوين التطبيقات للتحكم في كيفية تواصل الوكلاء مع تكاملات خارجية محددة.
Translates natural language intent and agent requests into specific executable function calls for external services.