Why is kingoflolz/mesh-transformer-jax a recommended Binary Record Data Loading GitHub Repositories repository?

Reads training batches from binary record files using parsing functions to feed distributed accelerators without memory overflow.

Why is dmlc/gluon-cv a recommended Binary Record Data Loading GitHub Repositories repository?

Provides optimized mechanisms for reading large-scale image datasets from binary files to reduce I/O overhead during training.

Why is brightmart/albert_zh a recommended Binary Record Data Loading GitHub Repositories repository?

Provides optimized mechanisms for reading large-scale binary datasets to minimize I/O overhead.

3 dépôts

Awesome GitHub RepositoriesBinary Record Data Loading

Optimized mechanisms for reading large-scale datasets from binary files to minimize I/O overhead during model training.

Distinct from Binary Memory Loading: None of the candidates cover high-performance dataset loading for ML; they focus on memory emulation, native plugins, or specific file formats.

Explore 3 awesome GitHub repositories matching data & databases · Binary Record Data Loading. Refine with filters or upvote what's useful.

Trouvez les meilleurs dépôts grâce à l'IA.Nous recherchons les dépôts les plus pertinents grâce à l'IA.

kingoflolz/mesh-transformer-jax
kingoflolz/mesh-transformer-jax
6,376Voir sur GitHub
Ce projet est un framework de transformer basé sur JAX et un entraîneur de modèles de langage large conçu pour construire et entraîner des modèles distribués sur des accélérateurs matériels TPU. Il fournit un système pour le pré-entraînement et le fine-tuning de modèles autorégressifs en divisant les poids et les calculs sur un maillage de périphériques pour réduire la surcharge mémoire et augmenter la vitesse de traitement. Le framework inclut un orchestrateur de calcul TPU pour provisionner les ressources et automatiser l'installation des dépendances sur des nœuds distribués distants. Il dispose également d'un convertisseur de poids de modèle capable de transformer et de re-sharder les checkpoints entre différentes configurations matérielles et précisions numériques. Le projet couvre des capacités plus larges, notamment la gestion de checkpoints shardés pour le stockage cloud, le chargement de données par flux avec restauration d'état et la génération de texte basée sur le noyau pour l'inférence. Il prend en charge l'accélération matérielle compilée XLA pour les clusters TPU et GPU et fournit des outils de benchmarking de performance sur des tâches linguistiques standardisées.
Reads training batches from binary record files using parsing functions to feed distributed accelerators without memory overflow.
Python
Voir sur GitHub6,376
dmlc/gluon-cv
dmlc/gluon-cv
5,922Voir sur GitHub
Gluon-CV est une bibliothèque de vision par ordinateur MXNet qui fournit une collection complète d'architectures de vision pré-implémentées et de pipelines d'entraînement. Elle sert de toolkit de recherche en deep learning et de zoo de modèles contenant des poids pré-entraînés à l'état de l'art pour l'analyse d'images et de vidéos. Le projet inclut une bibliothèque spécialisée d'estimation de pose humaine et un toolkit de compression de modèles. Ces outils permettent l'élagage et la quantification de modèles de deep learning pour augmenter la vitesse d'inférence et faciliter le déploiement sur du matériel edge contraint. La bibliothèque couvre un large éventail de capacités de vision, incluant la classification d'images, la détection d'objets, ainsi que la segmentation sémantique et d'instance. Elle fournit également des outils pour l'analyse vidéo, tels que la reconnaissance d'action, le suivi d'objets et l'estimation de profondeur monoculaire. L'entraînement est pris en charge via des pipelines automatisés et des charges de travail multi-GPU distribuées pour accélérer la convergence des modèles.
Provides optimized mechanisms for reading large-scale image datasets from binary files to reduce I/O overhead during training.
Pythonaction-recognitioncomputer-visiondeep-learning
Voir sur GitHub5,922
brightmart/albert_zh
brightmart/albert_zh
3,982Voir sur GitHub
This project is an implementation of the ALBERT language model architecture, providing a framework for training and evaluating transformer-based text classifiers and similarity models. It specifically includes pre-trained assets and tools optimized for generating semantic embeddings and representations of Chinese text. The framework distinguishes itself through tools for converting heavy language model checkpoints into lightweight formats to enable low-latency inference on mobile devices. It utilizes specific weight reduction techniques, including cross-parameter sharing and factorized embedd
Provides optimized mechanisms for reading large-scale binary datasets to minimize I/O overhead.
Pythonalbertbertchinese-corpus
Voir sur GitHub3,982

Awesome Binary Record Data Loading GitHub Repositories

kingoflolz/mesh-transformer-jax

dmlc/gluon-cv

brightmart/albert_zh