2 repository-uri
Tools specifically for transforming raw data into tensors and batches for deep learning frameworks.
Distinct from Machine Learning Datasets: Focuses on the transformation process into tensors rather than the storage or curation of the datasets themselves
Explore 2 awesome GitHub repositories matching artificial intelligence & ml · Tensor Conversion Utilities. Refine with filters or upvote what's useful.
This is a collection of tutorials and practical demonstrations for implementing machine learning tasks using the HuggingFace Transformers library. It serves as a guide for applying transformer architectures across computer vision, natural language processing, and audio analysis. The repository provides implementation examples for multimodal model deployment, including the combination of text, image, and audio inputs. It includes resources for optimizing pre-trained models through fine-tuning on custom datasets and provides examples for preparing PyTorch datasets by converting raw files into t
Provides examples for preparing PyTorch datasets by converting raw files into tensors and batches.
Danfo.js este o bibliotecă de analiză și preprocesare a datelor pentru JavaScript care oferă structuri de date etichetate de înaltă performanță. Implementează data frame-uri și serii pentru a permite analiza complexă a datelor, calculul statistic și manipularea datelor tabulare structurate. Proiectul servește ca o bibliotecă de preprocesare pentru învățarea automată, oferind utilitare pentru codificarea etichetelor categorice, one-hot encoding și scalarea și standardizarea caracteristicilor numerice. Acesta facilitează în mod specific conversia structurilor de date etichetate în tensori pentru antrenarea și evaluarea modelelor. Biblioteca acoperă un set larg de capabilități, inclusiv statistici descriptive, operațiuni relaționale precum îmbinarea și unirea, și procesarea seriilor temporale. Include instrumente pentru curățarea, filtrarea și gruparea datelor, precum și o interfață de vizualizare pentru generarea de grafice și diagrame interactive direct din data frame-uri. Sistemul suportă importul și exportul datelor prin formate CSV, JSON și Excel.
Transforms structured labeled data into tensor formats for use in machine learning workflows.