2 Repos
Tools for analyzing internal activations and feature importance to diagnose errors in vision models.
Distinct from Computer Vision Debugging Tools: Focuses on the internal XAI-driven debugging process rather than general CV model architectures or 3D visualizers.
Explore 2 awesome GitHub repositories matching artificial intelligence & ml · Computer Vision Model Debugging. Refine with filters or upvote what's useful.
Dieses Projekt ist eine Computer-Vision-Bibliothek für erklärbare KI und ein Framework für PyTorch, das eine Suite von Tools zur Visualisierung und Prüfung der internen Entscheidungsprozesse tiefer neuronaler Netze bereitstellt. Es dient als Attributions-Tool für neuronale Netze und Debugging-Dienstprogramm, um zu identifizieren, welche Bildregionen Modellvorhersagen steuern. Die Bibliothek zeichnet sich durch ihre Unterstützung sowohl für gradientenbasierte als auch für gradientenfreie Attributionsmethoden aus, was die Generierung visueller Heatmaps und Attributionskarten ermöglicht, ohne dass Änderungen am ursprünglichen Modellquellcode erforderlich sind. Sie differenziert sich zudem durch die Entdeckung visueller Konzepte, wobei Matrixfaktorisierung verwendet wird, um interne Aktivierungen in interpretierbare Muster zu zerlegen und latente Einbettungen auf Pixelwichtigkeit abzubilden. Das Framework deckt ein breites Spektrum an Fähigkeiten ab, einschließlich Heatmap-Generierung und -Verfeinerung, räumlicher Transformation für Architekturen wie Vision-Transformer und Anpassungen für multimodale Vision-Ziele wie Objekterkennung und semantische Segmentierung. Es enthält zudem eine Suite zur Bewertung der Modelltreue, die Störungsanalysen, Ablationsstudien und Lokalisierungsmessungen verwendet, um die Genauigkeit generierter Erklärungen zu quantifizieren. Das Projekt bietet Mechanismen für dynamisches Aktivierungs-Hooking, benutzerdefinierte Architektur-Anpassung und zielorientierte Zielkonfiguration, um Erklärbarkeits-Tools mit verschiedenen Modellausgaben zu verbinden.
Analyzes internal activations and feature importance to diagnose and debug classification or detection errors in vision models.
Vit-explain ist ein Diagnose-Framework zur Interpretation der Entscheidungsprozesse von Vision-Transformer-Modellen. Es fungiert als Toolkit zur Inspektion interner Modellzustände, das es Benutzern ermöglicht, visuelle Aufmerksamkeit abzubilden und zu analysieren, wie spezifische Bildmerkmale Klassifizierungsergebnisse beeinflussen. Das Projekt zeichnet sich durch die Bereitstellung einer Post-hoc-Modellinterpretation aus, die die Analyse trainierter neuronaler Netze ohne architektonische Modifikationen oder erneutes Training ermöglicht. Es verwendet Techniken wie Hook-basierte Merkmalsextraktion, um interne Aktivierungen während des Forward-Passes abzufangen, neben Methoden wie Transformer-Attention-Rollout und Layer-wise Relevance Propagation, um den Informationsfluss vom Eingang zum Ausgang nachzuverfolgen. Durch die Generierung von Heatmaps, die Aufmerksamkeitsfluss und Gewichtsverteilung verfolgen, visualisiert das Framework, welche spezifischen Pixel und Muster die Vorhersagen eines Modells steuern. Es unterstützt klassenspezifische Erklärungen durch das Filtern von Attention-Maps mit Zielklassen-Gradienten und bietet ein Diagnose-Tool zum Debuggen von Deep-Learning-Modellen und zur Identifizierung der visuellen Elemente, die zu Klassifizierungsergebnissen beitragen.
Visualizes internal decision-making processes by highlighting specific pixels and patterns that drive classification results.