1 Repo
Techniques for identifying and analyzing patterns of missing information within datasets.
Distinguishing note: Shortlist focused on imputation or removal; this covers the analytical identification of missingness patterns.
Explore 1 awesome GitHub repository matching data & databases · Missing Data Analysis. Refine with filters or upvote what's useful.
missingno ist eine Python-Bibliothek zur Visualisierung und Analyse von Mustern fehlender Daten. Sie bietet eine Reihe von Tools, um die Vollständigkeit von Datensätzen zu profilieren, Datenlücken abzubilden und das Volumen von Null-Werten über Variablen hinweg zu quantifizieren. Die Bibliothek zeichnet sich durch einen Nullity-Korrelations-Analyzer und ein hierarchisches Daten-Clustering-Tool aus. Diese Komponenten ermöglichen die Erkennung systemischer Abhängigkeiten und Trends, indem gemessen wird, wie das Fehlen einer Variable mit dem Fehlen einer anderen zusammenhängt. Das Toolset deckt breitere Funktionen für Data-Quality-Auditing und explorative Analysen ab. Es enthält Features zur Zusammenfassung der Spalten-Nullität mittels linearer und logarithmischer Skalen sowie matrixbasierte Mappings zur Identifizierung systemischer Lücken in Datensätzen.
Identifies patterns and systemic gaps in datasets using Python to determine how and where information is missing.