# maifoundations/humblebench

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/maifoundations-humblebench).**

9 stars · 0 forks · Python

## Links

- GitHub: https://github.com/maifoundations/HumbleBench
- Homepage: https://arxiv.org/pdf/2509.09658
- awesome-repositories: https://awesome-repositories.com/repository/maifoundations-humblebench.md

## Description

Overview Hallucinations in multimodal large language models (MLLMs)---where the model generates content inconsistent with the input image---pose significant risks in real-world applications, from misinformation in visual question answering to unsafe errors in decision-making. Existing benchmarks…

## Tags

### Part of an Awesome List

- [Evaluation Benchmarks](https://awesome-repositories.com/f/awesome-lists/ai/evaluation-benchmarks.md) — Measures epistemic humility in vision-language models.