2 dépôts
Dynamic grouping of continuous numerical values into discrete intervals for visualization and analysis.
Distinct from Bucket Management: Distinct from Object Storage Buckets, which are storage containers; this is about statistical binning of values.
Explore 2 awesome GitHub repositories matching data & databases · Interactive Data Binning. Refine with filters or upvote what's useful.
Facets is a set of interactive software tools for the statistical analysis, distribution visualization, and multidimensional exploration of machine learning datasets. It provides a visual interface for identifying outliers and missing values in numeric and string data, specifically designed for auditing dataset quality and identifying skews between training and validation sets. The system uses multidimensional facet-based visualization and interactive bucketing to map individual data points across multiple feature axes. It employs synchronized view filtering and animated dimension transitions
Groups continuous feature values into interactive discrete bins to enable efficient navigation of large datasets.
Cette bibliothèque de visualisation de données C++ est un framework de traçage scientifique utilisé pour créer des graphiques 2D et 3D, des graphes de réseau et des cartes géographiques. Elle fonctionne comme une bibliothèque graphique multi-backend, découplant la logique de traçage de haut niveau des moteurs de rendu de bas niveau pour prendre en charge divers backends de sortie. Le projet se distingue par une API à double interface, fournissant à la fois une interface fonctionnelle globale pour le prototypage rapide et une interface orientée objet pour un contrôle précis. Il dispose d'un moteur de mise en page basé sur des composants pour gérer les grilles tuilées et les sous-graphiques, ainsi qu'un état de tracé en couches qui permet de superposer plusieurs séries de données sans effacer les axes. La bibliothèque couvre un large éventail de capacités de visualisation, incluant le traçage de fonctions mathématiques, les champs vectoriels et l'analyse de données multidimensionnelles via des cartes thermiques et des coordonnées parallèles. Elle inclut des outils spécialisés pour la visualisation de données géographiques, tels que les graphiques geobubble et geodensity, ainsi que des outils pour le rendu de réseaux de graphes dirigés et non dirigés. Les capacités générales incluent la gestion des axes, le stylisme esthétique avec des colormaps et l'exportation de graphiques de haute qualité. Le projet utilise CMake pour l'automatisation de la construction et la récupération des dépendances afin de faciliter l'installation sur différents systèmes d'exploitation.
Visualizes large datasets by grouping points into bins to represent density and avoid overplotting.