1 dépôt
Guidelines and systems for evaluating sampling validity, data provenance, and the reliability of aggregated information.
Distinct from Data Provenance Frameworks: Distinct from provenance frameworks as it encompasses sampling validity and aggregation reliability, not just lineage tracking.
Explore 1 awesome GitHub repository matching data & databases · Data Audit Frameworks. Refine with filters or upvote what's useful.
Ce projet est une collection de supports de référence et de directives pour implémenter des frameworks d'audit de données. Il sert de guide de référence sur la qualité des données et de manuel de validation de jeux de données pour identifier les erreurs structurelles et statistiques courantes dans les jeux de données. Le projet fournit une base de connaissances structurée pour le nettoyage des données, présentant un catalogue d'erreurs de données réelles et des stratégies pratiques pour leur détection et leur résolution. Il inclut des frameworks spécifiques pour évaluer la provenance des données et la fiabilité des informations agrégées. Le matériel couvre un large éventail de capacités d'analyse de données, incluant la validation de l'intégrité statistique pour détecter la manipulation, des évaluations de la validité de l'échantillonnage pour identifier les biais de population, et des méthodes pour la détection d'erreurs structurelles telles que les problèmes d'encodage. Il décrit également des processus pour récupérer des informations tabulaires à partir de documents visuels via la reconnaissance optique de caractères (OCR).
Implements a comprehensive framework for evaluating sampling validity, provenance, and aggregation reliability in datasets.