# deepseek-ai/flashmla

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/deepseek-ai-flashmla).**

12,706 stars · 1,061 forks · C++ · MIT

## Links

- GitHub: https://github.com/deepseek-ai/FlashMLA
- awesome-repositories: https://awesome-repositories.com/repository/deepseek-ai-flashmla.md

## Description

FlashMLA: Efficient Multi-head Latent Attention Kernels

## Tags

### Part of an Awesome List

- [Attention Optimization](https://awesome-repositories.com/f/awesome-lists/ai/attention-optimization.md) — Hardware-aligned attention optimization for latent attention models.