awesome-repositories.comCategories

© 2026 Bringes Technology SRL·VAT RO45896025·hello@awesome-repositories.com

MCP Blog Curated searches Sitemap Privacy Terms

ReMix Reincarnated Mix Policy Proximal Policy Gradient | Awesome Repos

AnitaLeungxxReMix-Reincarnated-Mix-policy-Proximal-Policy-Gradient

0

View on GitHub↗

0 stars·0 forks·0 views

ReMix Reincarnated Mix Policy Proximal Policy Gradient

🧽 Squeeze the Soaked Sponge 🌊 Efficient Off-policy Reinforcement Finetuning for Large Language Model

Features

AI search

Explore more awesome repositories

Describe what you need in plain English — the AI ranks thousands of curated open-source projects by relevance.

Start searching with AI

Off-Policy Optimization - Efficient off-policy reinforcement fine-tuning for language models.

Star history

Star history chart for anitaleungxx/remix-reincarnated-mix-policy-proximal-policy-gradient

Star history chart for anitaleungxx/remix-reincarnated-mix-policy-proximal-policy-gradient