1 repository
Libraries for normalizing features, vectorizing text, and performing dimensionality reduction to prepare data for machine learning.
Distinguishing note: The candidates are focused on UI toolkits or serialization, not ML data preprocessing.
Explore 1 awesome GitHub repository matching artificial intelligence & ml · Data Preprocessing Toolkits. Refine with filters or upvote what's useful.
Linfa este un framework de machine learning clasic și o suită de învățare statistică implementată în Rust. Oferă o colecție de algoritmi pentru învățare supervizată și nesupervizată, axată pe metode statistice tradiționale precum regresia, clustering-ul și arborii de decizie. Toolkit-ul se distinge prin capacitatea de a fi compilat în WebAssembly, permițând modelelor analitice să ruleze în medii de browser. Utilizează o interfață de algoritm bazată pe trăsături (traits) pentru a standardiza procesul de antrenare și predicție în diferitele sale modele. Biblioteca acoperă o gamă largă de capabilități, inclusiv clasificarea supervizată și regresia valorilor continue. Oferă clustering nesupervizat, metode de ansamblu pentru agregarea modelelor și procesarea semnalelor prin analiza componentelor independente. Suita include, de asemenea, instrumente extinse de preprocesare a datelor pentru normalizarea caracteristicilor, vectorizarea textului și reducerea dimensionalității folosind PCA și t-SNE. Utilitare suplimentare sunt furnizate pentru gestionarea datelor, inclusiv importul CSV și generarea de seturi de date sintetice, precum și instrumente de evaluare a modelelor, cum ar fi matricile de confuzie și metricile de validare încrucișată.
Provides extensive utilities for feature normalization, text vectorization, and dimensionality reduction.