1 repositorio
Techniques for identifying and analyzing patterns of missing information within datasets.
Distinguishing note: Shortlist focused on imputation or removal; this covers the analytical identification of missingness patterns.
Explore 1 awesome GitHub repository matching data & databases · Missing Data Analysis. Refine with filters or upvote what's useful.
missingno es una biblioteca de Python para la visualización y el análisis de patrones de datos faltantes. Proporciona un conjunto de herramientas para perfilar la integridad de los conjuntos de datos, mapear brechas de datos y cuantificar el volumen de valores nulos en todas las variables. La biblioteca se diferencia por un analizador de correlación de nulidad y una herramienta de clustering jerárquico de datos. Estos componentes permiten la detección de dependencias y tendencias sistémicas midiendo cómo la ausencia de una variable se relaciona con la ausencia de otra. El conjunto de herramientas cubre capacidades más amplias de auditoría de calidad de datos y análisis exploratorio. Incluye funciones para el resumen de nulidad de columnas utilizando escalas lineales y logarítmicas, así como mapeo basado en matrices para identificar brechas sistémicas en los registros.
Identifies patterns and systemic gaps in datasets using Python to determine how and where information is missing.