1 dépôt
Improving the readability and correctness of decompiled pseudo-code using iterative models.
Distinct from Code Refinement: Focuses on refining output from decompilers rather than general source code generation or review.
Explore 1 awesome GitHub repository matching part of an awesome list · Pseudo-Code Refinement. Refine with filters or upvote what's useful.
LLM4Decompile est un ensemble d'outils et un framework pour la traduction de code binaire vers code source. Il utilise des grands modèles de langage pour transformer le code machine en code source lisible et récupérer la logique originale des exécutables compilés. Le projet inclut un pipeline spécialisé pour générer des datasets d'entraînement synthétiques en convertissant le code source en paires d'assembleur. Il fournit un framework de fine-tuning pour optimiser les modèles de deep learning sur ces datasets binaire-vers-source, augmentant la précision de la récupération de code. Le système propose également des capacités pour raffiner le pseudo-code décompilé. Ce processus se concentre sur la restauration du squelette structurel et des noms de variables d'un binaire pour améliorer la lisibilité de la logique désassemblée.
Provides iterative refinement of raw decompilation output to correct syntax and improve variable names.