# evalplus/evalplus

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/evalplus-evalplus).**

1,765 stars · 199 forks · Python · Apache-2.0

## Links

- GitHub: https://github.com/evalplus/evalplus
- Homepage: https://evalplus.github.io
- awesome-repositories: https://awesome-repositories.com/repository/evalplus-evalplus.md

## Description

Rigourous evaluation of LLM-synthesized code - NeurIPS 2023 & COLM 2024

## Tags

### Part of an Awesome List

- [Benchmarks and Datasets](https://awesome-repositories.com/f/awesome-lists/ai/benchmarks-and-datasets.md) — Rigorous testing framework for evaluating code generation correctness.
- [Evaluation Frameworks](https://awesome-repositories.com/f/awesome-lists/ai/evaluation-frameworks.md) — Rigorous evaluation framework specifically for code-generation models.
- [Model Evaluation and Benchmarking](https://awesome-repositories.com/f/awesome-lists/ai/model-evaluation-and-benchmarking.md) — Robust evaluation framework for LLM-based code generation.