awesome-repositories.comBlog

© 2026 Bringes Technology SRL·VAT RO45896025·hello@awesome-repositories.com

MCP Blog Curated searches Sitemap Privacy Terms

Evalplus | Awesome Repository

evalplusevalplus

0

View on GitHub↗

1,765 stars·199 forks·Python·Apache-2.0·1 viewevalplus.github.io↗

Evalplus

Features

Benchmarks and Datasets - Rigorous testing framework for evaluating code generation correctness.
Evaluation Frameworks - Rigorous evaluation framework specifically for code-generation models.
Model Evaluation and Benchmarking - Robust evaluation framework for LLM-based code generation.

AI search

Explore more awesome repositories

Describe what you need in plain English — the AI ranks thousands of curated open-source projects by relevance.

Start searching with AI

Rigourous evaluation of LLM-synthesized code - NeurIPS 2023 & COLM 2024