1 repositorio
Neural processes that improve decompiled code by restoring structural skeletons and identifiers.
Distinct from Code Refinement: Focuses on restoring lost metadata in decompiled code rather than general code improvement.
Explore 1 awesome GitHub repository matching part of an awesome list · Pseudo-Code Refiners. Refine with filters or upvote what's useful.
LLM4Decompile es un conjunto de herramientas y framework para la traducción de código binario a código fuente. Utiliza modelos de lenguaje de gran tamaño (LLM) para transformar código máquina en código fuente legible y recuperar la lógica original de ejecutables compilados. El proyecto incluye un pipeline especializado para generar datasets de entrenamiento sintéticos convirtiendo código fuente en pares de ensamblador. Proporciona un framework de fine-tuning para optimizar modelos de deep learning en estos datasets de binario a fuente, aumentando la precisión de la recuperación de código. El sistema también cuenta con capacidades para refinar pseudocódigo descompilado. Este proceso se centra en restaurar el esqueleto estructural y los nombres de variables de un binario para mejorar la legibilidad de la lógica desensamblada.
Implements a language model process to polish disassembled code and restore variable names.