1 个仓库
Techniques for identifying and analyzing patterns of missing information within datasets.
Distinguishing note: Shortlist focused on imputation or removal; this covers the analytical identification of missingness patterns.
Explore 1 awesome GitHub repository matching data & databases · Missing Data Analysis. Refine with filters or upvote what's useful.
missingno 是一个用于缺失数据模式可视化和分析的 Python 库。它提供了一套工具来分析数据集的完整性、映射数据缺口并量化变量中空值的数量。 该库通过空值相关性分析器和分层数据聚类工具脱颖而出。这些组件允许通过测量一个变量的缺失如何与另一个变量的缺失相关联,来检测系统性依赖和趋势。 该工具集涵盖了更广泛的数据质量审计和探索性分析功能。它包括使用线性和对数刻度进行列空值汇总的功能,以及用于识别记录中系统性缺口的基于矩阵的映射。
Identifies patterns and systemic gaps in datasets using Python to determine how and where information is missing.