3 Repos
Optimized mechanisms for reading large-scale datasets from binary files to minimize I/O overhead during model training.
Distinct from Binary Memory Loading: None of the candidates cover high-performance dataset loading for ML; they focus on memory emulation, native plugins, or specific file formats.
Explore 3 awesome GitHub repositories matching data & databases · Binary Record Data Loading. Refine with filters or upvote what's useful.
Dieses Projekt ist ein JAX-basiertes Transformer-Framework und Large-Language-Model-Trainer für das Training verteilter Modelle auf TPU-Hardwarebeschleunigern. Es bietet ein System für Pretraining und Fine-Tuning autoregressiver Modelle durch Aufteilung von Gewichten und Berechnungen über ein Mesh von Geräten, um den Speicherbedarf zu reduzieren und die Verarbeitungsgeschwindigkeit zu erhöhen. Das Framework enthält einen TPU-Compute-Orchestrator für die Ressourcenbereitstellung und die Automatisierung der Abhängigkeitsinstallation auf verteilten Remote-Knoten. Es verfügt zudem über einen Modell-Gewichtskonverter, der Checkpoints zwischen verschiedenen Hardwarekonfigurationen und numerischen Präzisionen transformieren und neu sharden kann. Das Projekt deckt breitere Funktionen ab, darunter Sharded-Checkpoint-Management für Cloud-Speicher, stream-basiertes Datenladen mit Zustandswiederherstellung und nucleus-basierte Textgenerierung für Modell-Inferenz. Es unterstützt zudem XLA-kompilierte Hardwarebeschleunigung für TPU- und GPU-Cluster und bietet Tools für Performance-Benchmarking gegen standardisierte Sprachaufgaben.
Reads training batches from binary record files using parsing functions to feed distributed accelerators without memory overflow.
Gluon-CV ist eine MXNet-Computer-Vision-Bibliothek, die eine umfassende Sammlung vortrainierter Vision-Architekturen und Trainings-Pipelines bereitstellt. Sie dient als Deep-Learning-Research-Toolkit und Model-Zoo mit State-of-the-Art-Gewichten für die Bild- und Videoanalyse. Das Projekt enthält eine spezialisierte Bibliothek für Human-Pose-Estimation sowie ein Toolkit zur Modellkompression. Diese Tools ermöglichen das Pruning und die Quantisierung von Deep-Learning-Modellen, um die Inferenzgeschwindigkeit zu erhöhen und die Bereitstellung auf ressourcenbeschränkter Edge-Hardware zu erleichtern. Die Bibliothek deckt ein breites Spektrum an Vision-Funktionen ab, darunter Bildklassifizierung, Objekterkennung sowie semantische und Instanz-Segmentierung. Sie bietet zudem Tools für die Videoanalyse, wie Action-Recognition, Objekt-Tracking und monokulare Tiefenschätzung. Das Training wird durch automatisierte Pipelines und verteilte Multi-GPU-Workloads unterstützt, um die Modellkonvergenz zu beschleunigen.
Provides optimized mechanisms for reading large-scale image datasets from binary files to reduce I/O overhead during training.
Dieses Projekt ist eine Implementierung der ALBERT-Sprachmodellarchitektur und bietet ein Framework zum Trainieren und Evaluieren von Transformer-basierten Textklassifikatoren und Ähnlichkeitsmodellen. Es enthält spezifisch vortrainierte Assets und Tools, die für die Generierung semantischer Embeddings und Repräsentationen chinesischer Texte optimiert sind. Das Framework zeichnet sich durch Tools zur Konvertierung schwerer Sprachmodell-Checkpoints in leichtgewichtige Formate aus, um Inferenz mit geringer Latenz auf Mobilgeräten zu ermöglichen. Es nutzt spezifische Techniken zur Gewichtsreduktion, einschließlich Cross-Parameter-Sharing und faktorisierter Embedding-Parametrisierung, um die Leistung bei geringerem Speicherbedarf aufrechtzuerhalten. Das System deckt eine vollständige Pipeline für Natural Language Processing ab, von der Normalisierung roher Texte und Subword-Tokenisierung bis hin zum selbstüberwachten Pre-training mittels Masked Language Modeling. Es bietet Funktionen für die Anpassung an nachgelagerte Aufgaben, wodurch vortrainierte Modelle für Textähnlichkeitsanalysen und überwachte Klassifizierungen feinabgestimmt werden können. Das Projekt enthält Dienstprogramme für die Konvertierung von Binärdatensätzen und die Transformation von Modellformaten, um die Kompatibilität über verschiedene Machine-Learning-Plattformen hinweg sicherzustellen.
Provides optimized mechanisms for reading large-scale binary datasets to minimize I/O overhead.