1 Repo
Improving the readability and correctness of decompiled pseudo-code using iterative models.
Distinct from Code Refinement: Focuses on refining output from decompilers rather than general source code generation or review.
Explore 1 awesome GitHub repository matching part of an awesome list · Pseudo-Code Refinement. Refine with filters or upvote what's useful.
LLM4Decompile ist ein Toolset und Framework für die Übersetzung von Binärcode in Quellcode. Es nutzt Large Language Models (LLMs), um Maschinencode in lesbaren Quellcode umzuwandeln und die ursprüngliche Logik kompilierter ausführbarer Dateien wiederherzustellen. Das Projekt enthält eine spezialisierte Pipeline zur Generierung synthetischer Trainingsdatensätze durch die Konvertierung von Quellcode in Assembly-Paare. Es bietet ein Fine-Tuning-Framework zur Optimierung von Deep-Learning-Modellen auf diesen Binär-zu-Quellcode-Datensätzen, um die Genauigkeit der Code-Wiederherstellung zu erhöhen. Das System bietet zudem Funktionen zur Verfeinerung von dekompiliertem Pseudocode. Dieser Prozess konzentriert sich auf die Wiederherstellung des strukturellen Skeletts und der Variablennamen einer Binärdatei, um die Lesbarkeit der disassemblierten Logik zu verbessern.
Provides iterative refinement of raw decompilation output to correct syntax and improve variable names.