17 dépôts
Agents that automate code generation, review, and iterative improvement.
Explore 17 awesome GitHub repositories matching part of an awesome list · Code Refinement. Refine with filters or upvote what's useful.
OpenHands is an autonomous AI software engineer and coding assistant designed to execute software engineering tasks by interacting directly with codebases and development environments. It functions as a platform for running AI agents that can write code and manage files to automate complex development workflows. The system distinguishes itself through a container-based execution environment that isolates agent actions within a sandboxed Linux environment. It employs an autonomous agent loop of observation, planning, and action, supported by a standardized communication protocol that allows it
Open platform for generalist AI software developers.
OpenUI is an AI design sandbox and natural language prototyping tool used to generate and render live user interface components from text descriptions. It functions as an LLM UI generator that translates natural language into executable HTML and CSS code. The system provides a pipeline for iterative refinement, allowing users to update existing interfaces by feeding previous code versions and new instructions back into the model. It also acts as a frontend framework converter, transforming HTML markup into different library formats to maintain styling consistency across various web frameworks
Allows users to incrementally update the user interface by refining natural language instructions.
bolt.new is an AI-powered full-stack web builder and browser-based IDE that generates, edits, and deploys web applications using natural language prompts. It functions as an AI-driven application orchestrator, managing the entire development lifecycle through a chat interface. The platform distinguishes itself by integrating a WebAssembly-based runtime and virtual terminal emulation directly in the browser. This allows an AI agent to execute tool calls, manage a virtual filesystem, install packages, and run servers without requiring a local development environment. The system covers a compre
Provides a mechanism for users to iteratively refine and edit natural language prompts to improve generated code quality.
KeepChatGPT is a browser extension designed to enhance the ChatGPT web experience by acting as a session manager, UI optimizer, and privacy guard. It focuses on maintaining active connections to prevent session timeouts and improving the overall interface for better readability and organization. The project distinguishes itself through privacy and security features that block tracking telemetry and use regular expressions to mask sensitive data before it is sent. It also includes tools to mitigate conversation auditing and bypass bot verification challenges to reduce the risk of account restr
Enables rapid iteration of instructions by cloning and editing previous prompts.
llm-universe is a structured learning resource and technical guide focused on the development of large language model applications. It serves as a curriculum for mastering model orchestration, the creation of autonomous conversational agents, and the implementation of retrieval-augmented generation systems. The project provides detailed instructions on connecting model APIs with memory and tools to create execution chains. It specifically covers the construction of retrieval pipelines, including the process of cleaning raw documents, generating embeddings, and integrating vector databases to
Teaches the iterative process of refining natural language instructions to improve the quality of model-generated outputs.
This project is an AI software engineering tool and framework for building autonomous coding agents. It provides a system for automating program synthesis and bug fixing by integrating large language models with codebase analysis and iterative refinement loops. The framework features an agentic development server that exposes task execution interfaces to remote agents through a structured protocol. This allows for the remote execution of development tasks and the embedding of autonomous program synthesis capabilities into external software projects. The toolset covers AI-driven project scaff
Updates generated code snippets iteratively based on new prompt instructions or error messages.
This project is an automated prompt engineering and optimization tool designed to iteratively create, test, and refine prompts using a language model to improve output quality. It functions as a framework for generating candidate prompts and ranking their performance through correctness matching and ELO-based ratings. The system includes capabilities for model distillation, generating high-quality example pairs from frontier models to create training data for smaller models. It also provides tools to condense prompts for smaller models and transform instruction-tuned prompts into completion-b
Analyzes performance failures to rewrite instructions and improve accuracy for classification tasks.
LLM4Decompile est un ensemble d'outils et un framework pour la traduction de code binaire vers code source. Il utilise des grands modèles de langage pour transformer le code machine en code source lisible et récupérer la logique originale des exécutables compilés. Le projet inclut un pipeline spécialisé pour générer des datasets d'entraînement synthétiques en convertissant le code source en paires d'assembleur. Il fournit un framework de fine-tuning pour optimiser les modèles de deep learning sur ces datasets binaire-vers-source, augmentant la précision de la récupération de code. Le système propose également des capacités pour raffiner le pseudo-code décompilé. Ce processus se concentre sur la restauration du squelette structurel et des noms de variables d'un binaire pour améliorer la lisibilité de la logique désassemblée.
Provides iterative refinement of raw decompilation output to correct syntax and improve variable names.
ChatGPT-AutoExpert is an AI prompt engineering framework and persona management system designed to improve the technical accuracy and nuance of large language model outputs. It provides a collection of curated system prompts and custom instructions to refine user queries and remove conversational filler. The system employs a persona framework to assign specialized expert roles based on the request context. It utilizes a command shortcut system that maps short text sequences to complex instructional sets, enabling the rapid execution of repetitive tasks. For software development, the project
Rewrites vague user inputs into structured prompts to improve the precision and quality of model outputs.
OpenEvolve est un framework d'algorithme évolutionnaire qui utilise des grands modèles de langage pour découvrir et optimiser de manière autonome des algorithmes de programmation. Il fonctionne comme un moteur de découverte d'algorithmes et un outil de recherche de code, faisant évoluer des populations de programmes candidats pour trouver des implémentations efficaces et des accélérations spécifiques au matériel. Le système traite à la fois le code et les instructions système comme des entités évolutives, utilisant un optimiseur de prompt automatisé pour raffiner itérativement la performance du modèle. Il maintient la stabilité de la recherche via une gestion de population basée sur des niches pour préserver la diversité et emploie un mécanisme de rétroaction en boucle fermée qui réinjecte les erreurs d'exécution et les logs dans le processus de génération pour une correction de bugs autonome. Le framework inclut également un orchestrateur d'agents qui agrège les réponses de multiples API de modèles en utilisant une logique pondérée et des stratégies de repli. Pour soutenir le calcul scientifique, il implémente une exécution déterministe en gérant des graines aléatoires cohérentes à travers tous les composants stochastiques. Le projet fournit un tableau de bord interactif pour visualiser la progression de l'évolution et les métriques de performance en temps réel.
Open-source evolutionary coding agent.
vibesdk est une plateforme et un framework de développement logiciel agentique conçu pour coordonner des agents autonomes qui écrivent, déboguent et affinent des applications full-stack à partir du langage naturel. Il sert d'orchestrateur d'applications cloud-native et de framework de génération de code alimenté par LLM qui convertit des prompts en code fonctionnel via des conversations itératives et des comportements d'agents multi-phases. Le projet se distingue en fournissant une chaîne d'outils complète pour construire des plateformes de développement IA. Cela inclut la capacité d'intégrer divers fournisseurs de modèles, de construire des toolkits LLM personnalisés et de gérer l'intégralité du cycle de vie des applications générées par IA via une chaîne d'outils de déploiement serverless et un SDK TypeScript programmatique. La plateforme couvre un large éventail de capacités, incluant l'orchestration de sandbox IA pour une exécution isolée et des prévisualisations en direct, des systèmes de fichiers virtuels basés sur Git pour le suivi des versions, et un déploiement cloud automatisé vers des plateformes serverless. Elle intègre également des systèmes pour la gestion de schémas de base de données, le chiffrement hiérarchique des secrets et la synchronisation d'état en temps réel via WebSockets. Les utilisateurs peuvent gérer les flux de travail des projets via une interface en ligne de commande ou par programmation en utilisant le SDK fourni.
Implements a conversational interface for iterating on features and fixing errors through AI-driven code refinement.
AlphaCodium est un framework de génération de code LLM et un benchmark de programmation automatisé conçu pour résoudre des problèmes de programmation via une génération et des tests itératifs. Il fonctionne comme un système de raffinement de code itératif qui améliore la précision du code généré en comparant les sorties aux résultats attendus et en re-promptant le modèle. Le projet implémente un pipeline d'ingénierie de flux, utilisant une séquence structurée d'étapes de prompting pour raffiner le code à travers un cycle de génération, d'évaluation et de correction. Cette approche permet au système de traiter des jeux de données de programmation et de mesurer la précision des solutions générées par rapport aux cas de test. Le framework couvre de larges capacités en génération de code automatisée, incluant le développement IA piloté par les tests et l'évaluation de jeux de données de programmation. Il gère ces tâches via un pipeline de synthèse multi-étapes qui intègre la planification, la rédaction et la révision.
Improves the quality of generated source code by cycling through generation, execution, and correction workflows.
Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents
Framework for open-ended evolution of self-improving agents.
With Self-Refine, LLMs can generate feedback on their work, use it to improve the output, and repeat this process.
Iterative code refinement using self-feedback.
AgentCoder is a novel multiagent-code generation framework that leverages the power of large language models (LLMs) to enhance the effectiveness of code generation. The framework consists of three specialized agents: the programmer agent, the test designer agent, and the test executor agent.…
Multi-agent code generation with iterative testing.
Code and data for paper "Self-Evolving Multi-Agent Collaboration Networks for Software Development".
Self-evolving multi-agent networks for software development.
please visit: https://zenodo.org/records/11666403
Autonomous communicative agents for code review.