1 repository
Techniques for identifying and analyzing patterns of missing information within datasets.
Distinguishing note: Shortlist focused on imputation or removal; this covers the analytical identification of missingness patterns.
Explore 1 awesome GitHub repository matching data & databases · Missing Data Analysis. Refine with filters or upvote what's useful.
missingno este o bibliotecă Python pentru vizualizarea și analiza modelelor de date lipsă. Oferă un set de instrumente pentru a profila completitudinea seturilor de date, a mapa lacunele de date și a cuantifica volumul valorilor nule în variabile. Biblioteca se diferențiază printr-un analizor de corelație a nulității și un instrument de clustering ierarhic al datelor. Aceste componente permit detectarea dependențelor și tendințelor sistemice prin măsurarea modului în care absența unei variabile se raportează la absența alteia. Setul de instrumente acoperă capabilități mai largi de auditare a calității datelor și analiză exploratorie. Include funcționalități pentru sumarizarea nulității coloanelor folosind scale liniare și logaritmice, precum și mapare bazată pe matrice pentru a identifica lacunele sistemice în înregistrări.
Identifies patterns and systemic gaps in datasets using Python to determine how and where information is missing.