2 Repos
Generic base classes and hooks for implementing, benchmarking, and sharing new attribution methods.
Distinct from Model Interpretability Frameworks: Distinct from Model Interpretability Frameworks: focuses on the extensibility mechanism for adding new attribution algorithms, not the full interpretability workflow.
Explore 2 awesome GitHub repositories matching artificial intelligence & ml · Custom Attribution Algorithm Frameworks. Refine with filters or upvote what's useful.
Captum is an open-source library for explaining model predictions by attributing them to input features, neurons, and layers using gradient-based and perturbation-based methods. It provides a modular framework for implementing, evaluating, and combining a range of explanation techniques, including gradient-based attribution, perturbation-based analysis, game-theoretic Shapley value approximation, and surrogate model explanations, with support for parallelization and noise stabilization. The library distinguishes itself through its breadth of attribution methods and its support for advanced in
Provides a generic framework for implementing, benchmarking, and sharing new attribution methods.
Transformers-interpret ist eine Diagnosebibliothek, die für die Interpretierbarkeit von Transformer-basierten Machine-Learning-Modellen entwickelt wurde. Sie fungiert als Attributions-Framework, das den Beitrag einzelner Eingabe-Token zu den endgültigen Vorhersagen eines Modells quantifiziert, was es Benutzern ermöglicht, Entscheidungsmuster zu prüfen und NLP-Aufgaben zu debuggen. Die Bibliothek nutzt Gradienten-basierte Analyse und Hook-basierte Introspektion, um nachzuvollziehen, wie spezifische Eingabefeatures die Modellausgaben beeinflussen. Durch die Abbildung abstrakter numerischer Attributions-Scores auf menschenlesbare linguistische Einheiten bietet sie einen klaren Einblick in die Textverarbeitung von Modellen. Das Framework unterstützt gezielte Analysen, die es Benutzern ermöglichen, Vorhersagen für bestimmte Klassen zu erklären oder paarweise Eingabebeziehungen zu untersuchen. Über die Kern-Attribution hinaus enthält das Tool Visualisierungsfunktionen, die grafische und tabellarische Darstellungen der Feature-Wichtigkeit generieren. Diese Ausgaben helfen bei der Verifizierung, dass Modelle auf relevanten Daten basieren und nicht auf unbeabsichtigten Mustern, was ein tieferes Verständnis des Modellverhaltens über verschiedene Transformer-Architekturen hinweg ermöglicht.
Provides a framework-agnostic engine that decouples attribution logic from specific transformer model architectures.