2 dépôts
Sorted sets specifically optimized for storing unique integers to perform efficient range queries.
Distinct from Sorted Sets: More specific than general sorted sets by restricting members to integers for optimization.
Explore 2 awesome GitHub repositories matching data & databases · Integer. Refine with filters or upvote what's useful.
Kvrocks est un magasin clé-valeur distribué et une base de données NoSQL compatible avec Redis. Il utilise un moteur de stockage RocksDB pour fournir une persistance basée sur disque, permettant un stockage de données haute capacité avec des coûts de mémoire réduits par rapport aux systèmes en mémoire. Le système fonctionne comme une base de données vectorielle et un moteur de recherche plein texte, prenant en charge les recherches de plus proches voisins sur des embeddings vectoriels et des requêtes de documents complexes via la correspondance de texte. Il emploie une architecture de cluster sans proxy avec un routage basé sur des slots pour distribuer les données et mettre à l'échelle la capacité sur plusieurs nœuds. La plateforme couvre un large éventail de capacités de gestion des données, y compris la gestion de documents JSON, les données de séries temporelles et le traitement de flux en temps réel. Elle fournit une recherche et une indexation avancées grâce à des requêtes géospatiales, une indexation secondaire et l'analyse de plans de requête, tout en offrant un sketching de données probabiliste pour une estimation efficace de la cardinalité et de l'appartenance en mémoire. Les fonctionnalités opérationnelles supplémentaires incluent des transactions atomiques, la messagerie pub/sub et l'isolation des données par namespace pour les environnements multi-locataires.
Provides optimized sorted collections of unique integers for high-performance range queries.
Ce projet est un framework de traitement de données tabulaires haute performance pour R, conçu pour gérer des jeux de données massifs avec efficacité mémoire et vitesse. Il fournit une structure de données améliorée qui utilise la sémantique de référence et la modification sur place pour effectuer des transformations complexes sans la surcharge de copies d'objets inutiles. La bibliothèque se distingue par ses optimisations architecturales de bas niveau, incluant le traitement parallèle multi-threadé, le tri basé sur radix et l'analyse de fichiers mappés en mémoire. En déchargeant les routines critiques de manipulation et d'agrégation de données vers du code C compilé, elle permet une exécution rapide des tâches qui seraient autrement coûteuses en calcul. Son moteur principal prend en charge des opérations relationnelles avancées, telles que les jointures non-équi, glissantes et à intervalles chevauchants, parallèlement à l'indexation secondaire automatique pour accélérer l'accès répété aux données. Au-delà de ses capacités de traitement principales, le projet offre une suite complète d'outils pour la gestion du cycle de vie des données. Cela inclut des utilitaires d'ingestion et de sérialisation à haute vitesse avec détection automatique de type, ainsi qu'un support spécialisé pour l'analyse de séries temporelles et l'agrégation multidimensionnelle. Le framework est conçu pour évoluer, permettant aux utilisateurs d'effectuer des opérations complexes de regroupement, de filtrage et de remodelage sur des jeux de données contenant des milliards de lignes tout en maintenant la stabilité et les performances du système.
Uses integer-based storage for temporal data to accelerate sorting operations and minimize memory footprint.