# raullenchai/rapid-mlx

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/raullenchai-rapid-mlx).**

2,862 stars · 342 forks · Python · Apache-2.0

## Links

- GitHub: https://github.com/raullenchai/Rapid-MLX
- Homepage: https://pypi.org/project/rapid-mlx
- awesome-repositories: https://awesome-repositories.com/repository/raullenchai-rapid-mlx.md

## Description

The fastest local AI engine for Apple Silicon. 4.2x faster than Ollama, 0.08s cached TTFT, 100% tool calling. 17 tool parsers, prompt cache, reasoning separation, cloud routing. Drop-in OpenAI replacement. Works with Claude Code, Cursor, Aider.

## Tags

### Part of an Awesome List

- [Model Serving Engines](https://awesome-repositories.com/f/awesome-lists/ai/model-serving-engines.md) — High-performance inference server for Apple Silicon hardware.