Why is dominikh/go-tools a recommended Memory Padding Optimizers GitHub Repositories repository?

Provides a greedy field reordering mechanism to minimize memory padding in Go structs.

Why is internlm/xtuner a recommended Memory Padding Optimizers GitHub Repositories repository?

Reduce GPU memory waste by packing variable-length data into single sequences to eliminate excessive padding.

2 Repos

Awesome GitHub RepositoriesMemory Padding Optimizers

Tools that reorder data structure fields to minimize memory padding and optimize alignment.

Distinct from Greedy Sorting Strategies: Closest candidates are greedy sorting algorithms or UI field layouts; this is about low-level memory layout optimization.

Explore 2 awesome GitHub repositories matching operating systems & systems programming · Memory Padding Optimizers. Refine with filters or upvote what's useful.

Finde die besten Repos mit KI.Wir suchen mit KI nach den am besten passenden Repositories.

dominikh/go-tools
dominikh/go-tools
6,818Auf GitHub ansehen
go-tools is a collection of utilities for Go static analysis and memory layout optimization. It provides a toolset designed to analyze source code to detect bugs and dead code, alongside specialized tools for optimizing how structs are arranged in memory. The project includes a memory alignment visualizer to display physical memory layouts and padding, as well as a struct layout optimizer that reorders fields to minimize memory padding. Additionally, it provides a boilerplate generator to automate the creation of registration and test files required for developing custom Go analyzers. The to
Provides a greedy field reordering mechanism to minimize memory padding in Go structs.
Go
Auf GitHub ansehen6,818
internlm/xtuner
InternLM/xtuner
5,150Auf GitHub ansehen
xtuner ist eine umfassende Trainings-Engine für Large Language Models und bietet ein Toolkit für Pre-Training, Supervised Fine-Tuning und die Optimierung von vision-sprachlichen multimodalen Modellen. Sie dient als verteilter Trainingsbeschleuniger und spezialisiertes Framework zur Skalierung von Mixture-of-Experts-Modellen sowie zur Ausrichtung von Modellverhalten durch Reinforcement Learning from Human Feedback. Das Projekt zeichnet sich durch fortgeschrittene Speicher- und Rechenoptimierungen aus, wie Sequence-Parallelism für ultra-lange Kontextfenster und Interleaved-Pipeline-Parallelism zur Reduzierung von GPU-Idle-Zeiten. Es bietet eine dedizierte Suite für Preference-Optimization und implementiert Techniken wie Group Relative Policy Optimization und Direct Preference Optimization, um Modell-Policies und Belohnungssysteme zu verfeinern. Breite Funktionsbereiche decken verteiltes Modelltraining über mehrere Knoten hinweg, multimodale Datensatzvorbereitung und die Verwaltung von Adapter-basiertem Fine-Tuning ab. Die Engine enthält zudem Tools für Modellevaluation, Weight-Merging und den Export trainierter Parameter in Inferenz-Engines. Das Training wird über standardisierte Konfigurationsdateien und verteilte Launcher verwaltet, um konsistente Ergebnisse über Rechencluster hinweg sicherzustellen.
Reduce GPU memory waste by packing variable-length data into single sequences to eliminate excessive padding.
Pythonagentdeepseek-v3gpt-oss
Auf GitHub ansehen5,150

Awesome Memory Padding Optimizers GitHub Repositories

dominikh/go-tools

InternLM/xtuner

Unter-Tags erkunden