3 dépôts
Efficient mechanisms for organizing data to enable fast retrieval and range-based queries.
Distinct from B+ Tree Indexing: Candidates focus on specific B-tree variants or selection logic rather than the general provision of indexing structures.
Explore 3 awesome GitHub repositories matching data & databases · Data Indexing Structures. Refine with filters or upvote what's useful.
klib est une extension complète de bibliothèque standard C et une boîte à outils de structure de données. Elle fournit un ensemble d'outils fondamentaux pour la gestion de la mémoire, l'organisation des données et des fonctions utilitaires à usage général pour les applications C autonomes. Le projet propose des capacités spécialisées pour l'analyse de séquences bioinformatiques, y compris l'analyse des formats FASTA, FASTQ et Newick et l'implémentation de l'alignement de séquences Smith-Waterman et des modèles de Markov cachés. Il inclut également une bibliothèque de calcul mathématique pour les routines numériques et l'évaluation d'expressions, ainsi qu'un client HTTP et FTP léger pour la récupération de données distantes à accès aléatoire. La boîte à outils couvre une large surface de primitives de calcul haute performance, y compris les modèles multi-threadés, la construction de tableaux de suffixes en temps linéaire et des algorithmes de tri optimisés. Elle implémente une variété de structures d'indexation de données efficaces telles que des tables de hachage avec adressage ouvert, des arbres B et des arbres AVL intrusifs, pris en charge par la gestion de séquences basée sur des pools de mémoire. Les utilitaires supplémentaires incluent l'analyse de données JSON et l'interprétation des arguments de ligne de commande.
Organizes information using hash tables, B-trees, and AVL trees for high-performance lookups.
Ce projet est un dépôt de localisation chinoise et un projet de traduction technique conçu pour rendre les projets de programmation concis et la documentation technique accessibles aux sinophones. Il fournit une collection de ressources traduites et des mappages curés de terminologie informatique pour assurer une traduction cohérente des concepts techniques. Le projet implémente un flux de travail de localisation logicielle qui convertit les guides techniques et la documentation de base de code en langue anglaise vers le chinois. Ce processus utilise une ressource de glossaire technique et un modèle de localisation piloté par les ressources pour maintenir le sens original et le contexte technique du matériel source. Le dépôt couvre la traduction de documentation technique et la gestion de mappages de traduction standardisés pour assurer une formulation technique cohérente à travers divers projets logiciels.
Implements specialized index structures to accelerate the retrieval of entities, attributes, and values.
Ce projet est un framework de traitement de données tabulaires haute performance pour R, conçu pour gérer des jeux de données massifs avec efficacité mémoire et vitesse. Il fournit une structure de données améliorée qui utilise la sémantique de référence et la modification sur place pour effectuer des transformations complexes sans la surcharge de copies d'objets inutiles. La bibliothèque se distingue par ses optimisations architecturales de bas niveau, incluant le traitement parallèle multi-threadé, le tri basé sur radix et l'analyse de fichiers mappés en mémoire. En déchargeant les routines critiques de manipulation et d'agrégation de données vers du code C compilé, elle permet une exécution rapide des tâches qui seraient autrement coûteuses en calcul. Son moteur principal prend en charge des opérations relationnelles avancées, telles que les jointures non-équi, glissantes et à intervalles chevauchants, parallèlement à l'indexation secondaire automatique pour accélérer l'accès répété aux données. Au-delà de ses capacités de traitement principales, le projet offre une suite complète d'outils pour la gestion du cycle de vie des données. Cela inclut des utilitaires d'ingestion et de sérialisation à haute vitesse avec détection automatique de type, ainsi qu'un support spécialisé pour l'analyse de séries temporelles et l'agrégation multidimensionnelle. Le framework est conçu pour évoluer, permettant aux utilisateurs d'effectuer des opérations complexes de regroupement, de filtrage et de remodelage sur des jeux de données contenant des milliards de lignes tout en maintenant la stabilité et les performances du système.
Organizes data structures using keys to enable fast retrieval and efficient filtering.