4 dépôts
Tools that send decompiled pseudocode to a language model and return plain-English summaries of what the code does.
Distinct from Code Explanation: Distinct from Code Explanation: specifically targets decompiled pseudocode from reverse engineering tools, not general source code.
Explore 4 awesome GitHub repositories matching artificial intelligence & ml · Decompiled Code Explainers. Refine with filters or upvote what's useful.
LLM4Decompile est un ensemble d'outils et un framework pour la traduction de code binaire vers code source. Il utilise des grands modèles de langage pour transformer le code machine en code source lisible et récupérer la logique originale des exécutables compilés. Le projet inclut un pipeline spécialisé pour générer des datasets d'entraînement synthétiques en convertissant le code source en paires d'assembleur. Il fournit un framework de fine-tuning pour optimiser les modèles de deep learning sur ces datasets binaire-vers-source, augmentant la précision de la récupération de code. Le système propose également des capacités pour raffiner le pseudo-code décompilé. Ce processus se concentre sur la restauration du squelette structurel et des noms de variables d'un binaire pour améliorer la lisibilité de la logique désassemblée.
Employs a language model to improve the readability and accuracy of existing decompiled pseudo-code.
Ce projet est une collection complète de matériel pédagogique de programmation Python, y compris des tutoriels, des exercices et des exemples de code organisés. Il sert de programme d'apprentissage et de boîte à outils d'ingénierie logicielle, utilisant des Jupyter Notebooks pour combiner du code exécutable avec un texte éducatif descriptif. Le dépôt fournit des guides d'implémentation pratiques pour construire des applications de grand modèle de langage, telles que des systèmes de génération augmentée par récupération, des agents IA avec état et des flux de travail d'apprentissage automatique. Il se distingue en offrant une approche structurée des flux de travail de codage agentique, couvrant la distillation de la fenêtre de contexte, le routage de modèle agnostique au fournisseur et les sorties structurées imposées par schéma. Le matériel couvre un large éventail de capacités d'ingénierie logicielle, notamment la programmation asynchrone avec des files d'attente de tâches distribuées, le développement d'applications web avec des API REST et les flux de travail d'analyse de données. Il inclut également des ressources pour maîtriser la conception orientée objet, implémenter des pipelines CI/CD et appliquer des normes professionnelles de linting et de formatage.
Provides detailed breakdowns of code logic to help users understand complex code blocks.
Ce projet est un utilitaire développeur qui fonctionne comme un assistant alimenté par l'intelligence artificielle pour la gestion de requêtes de base de données. Il fournit une interface interactive pour traduire entre le langage naturel et le code de base de données structuré, simplifiant les processus d'écriture, de débogage et de maintenance de requêtes complexes. L'outil se distingue en incorporant une injection de contexte consciente du schéma, ce qui lui permet d'aligner les requêtes générées avec des définitions de tables et des métadonnées de relation spécifiques. En maintenant un historique de conversation avec état et en utilisant le prompting de grands modèles de langage, il permet aux utilisateurs d'affiner de manière itérative les requêtes et de recevoir des explications qui tiennent compte de la logique et de la structure spécifiques de leur environnement de base de données. Au-delà de la traduction centrale, l'utilitaire prend en charge l'analyse du code existant pour identifier les erreurs de syntaxe et fournit des explications en anglais simple de la logique de requête complexe. Il inclut également des fonctionnalités pour formater le code de base de données et gérer un historique local des logs de traduction pour faciliter la réutilisation du travail passé.
Provides plain-English summaries and breakdowns of complex database query logic for better code understanding.
Gepetto is an IDA Pro plugin that integrates large language models directly into the reverse engineering workflow. It functions as a multi-provider LLM client, allowing users to explain decompiled functions, rename variables, and add comments to pseudocode, all while supporting multiple language model backends and a localized interface. The plugin distinguishes itself through a plugin-based architecture that abstracts multiple LLM providers behind a unified interface, enabling hot-swapping between providers and models without restarting IDA Pro. It also features a command-line interface bridg
Sends decompiled pseudocode to a language model and returns plain-English descriptions of what the code does.