awesome-repositories.comBlog

© 2026 Bringes Technology SRL·VAT RO45896025·hello@awesome-repositories.com

MCP Blog Curated searches Sitemap Privacy Terms

FlexGen | Awesome Repository

FMInferenceFlexGenArchived

0

View on GitHub↗

9,366 stars·591 forks·Python·Apache-2.0·0 views

FlexGen

Features

Hardware Optimized Inference - High-throughput generative inference optimized for single GPU environments.
Inference Frameworks - High-throughput generative inference on single-GPU systems.
Model Serving Engines - Throughput-oriented inference engine for running models on single GPUs.

AI search

Explore more awesome repositories

Describe what you need in plain English — the AI ranks thousands of curated open-source projects by relevance.

Start searching with AI

Running large language models on a single GPU for throughput-oriented scenarios.