# openrlhf/openrlhf

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/openrlhf-openrlhf).**

9,010 stars · 882 forks · Python · apache-2.0

## Links

- GitHub: https://github.com/OpenRLHF/OpenRLHF
- Homepage: https://openrlhf.readthedocs.io/
- awesome-repositories: https://awesome-repositories.com/repository/openrlhf-openrlhf.md

## Topics

`large-language-models` `openai-o1` `proximal-policy-optimization` `raylib` `reinforcement-learning` `reinforcement-learning-from-human-feedback` `transformers` `vllm`

## Tags

### Part of an Awesome List

- [Critic-Free Algorithms](https://awesome-repositories.com/f/awesome-lists/ai/critic-free-algorithms.md) — Robust reinforcement learning algorithm for human feedback alignment.
- [Model Training](https://awesome-repositories.com/f/awesome-lists/ai/model-training.md) — Framework for scalable reinforcement learning from human feedback.
- [Model Training Frameworks](https://awesome-repositories.com/f/awesome-lists/ai/model-training-frameworks.md) — Scalable framework for high-performance reinforcement learning from human feedback.
- [Preference Alignment](https://awesome-repositories.com/f/awesome-lists/ai/preference-alignment.md) — Listed in the “Preference Alignment” section of the Llm Course awesome list.
- [Reinforcement Learning](https://awesome-repositories.com/f/awesome-lists/ai/reinforcement-learning.md) — Framework for reinforcement learning from human feedback.
- [Reinforcement Learning Frameworks](https://awesome-repositories.com/f/awesome-lists/ai/reinforcement-learning-frameworks.md) — Scalable and high-performance framework for reinforcement learning from human feedback.
- [Training and Fine-Tuning](https://awesome-repositories.com/f/awesome-lists/ai/training-and-fine-tuning.md) — High-performance RLHF framework.