# nvidia/fastertransformer

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/nvidia-fastertransformer).**

6,424 stars · 935 forks · C++ · Apache-2.0

## Links

- GitHub: https://github.com/NVIDIA/FasterTransformer
- awesome-repositories: https://awesome-repositories.com/repository/nvidia-fastertransformer.md

## Description

Transformer related optimization, including BERT, GPT

## Tags

### Part of an Awesome List

- [Inference and Serving](https://awesome-repositories.com/f/awesome-lists/ai/inference-and-serving.md) — NVIDIA framework for accelerated LLM inference.
- [Mixture of Experts](https://awesome-repositories.com/f/awesome-lists/ai/mixture-of-experts.md) — Optimizes MoE model execution for cloud-scale production.
- [Model Quantization Tools](https://awesome-repositories.com/f/awesome-lists/ai/model-quantization-tools.md) — Optimized transformer implementation for cloud-scale production.
- [Transformer Implementations](https://awesome-repositories.com/f/awesome-lists/ai/transformer-implementations.md) — Optimized transformer implementation for high-performance inference.