1 dépôt
Using LLMs to refine the accuracy and readability of decompiled pseudo-code output.
Distinct from Decompiled Code Explainers: Focuses on improving the code itself rather than providing plain-English summaries of its behavior.
Explore 1 awesome GitHub repository matching artificial intelligence & ml · Pseudo-Code Readability Improvement. Refine with filters or upvote what's useful.
LLM4Decompile est un ensemble d'outils et un framework pour la traduction de code binaire vers code source. Il utilise des grands modèles de langage pour transformer le code machine en code source lisible et récupérer la logique originale des exécutables compilés. Le projet inclut un pipeline spécialisé pour générer des datasets d'entraînement synthétiques en convertissant le code source en paires d'assembleur. Il fournit un framework de fine-tuning pour optimiser les modèles de deep learning sur ces datasets binaire-vers-source, augmentant la précision de la récupération de code. Le système propose également des capacités pour raffiner le pseudo-code décompilé. Ce processus se concentre sur la restauration du squelette structurel et des noms de variables d'un binaire pour améliorer la lisibilité de la logique désassemblée.
Employs a language model to improve the readability and accuracy of existing decompiled pseudo-code.