1 Repo
Using LLMs to refine the accuracy and readability of decompiled pseudo-code output.
Distinct from Decompiled Code Explainers: Focuses on improving the code itself rather than providing plain-English summaries of its behavior.
Explore 1 awesome GitHub repository matching artificial intelligence & ml · Pseudo-Code Readability Improvement. Refine with filters or upvote what's useful.
LLM4Decompile ist ein Toolset und Framework für die Übersetzung von Binärcode in Quellcode. Es nutzt Large Language Models (LLMs), um Maschinencode in lesbaren Quellcode umzuwandeln und die ursprüngliche Logik kompilierter ausführbarer Dateien wiederherzustellen. Das Projekt enthält eine spezialisierte Pipeline zur Generierung synthetischer Trainingsdatensätze durch die Konvertierung von Quellcode in Assembly-Paare. Es bietet ein Fine-Tuning-Framework zur Optimierung von Deep-Learning-Modellen auf diesen Binär-zu-Quellcode-Datensätzen, um die Genauigkeit der Code-Wiederherstellung zu erhöhen. Das System bietet zudem Funktionen zur Verfeinerung von dekompiliertem Pseudocode. Dieser Prozess konzentriert sich auf die Wiederherstellung des strukturellen Skeletts und der Variablennamen einer Binärdatei, um die Lesbarkeit der disassemblierten Logik zu verbessern.
Employs a language model to improve the readability and accuracy of existing decompiled pseudo-code.