3 Repos
Efficient mechanisms for organizing data to enable fast retrieval and range-based queries.
Distinct from B+ Tree Indexing: Candidates focus on specific B-tree variants or selection logic rather than the general provision of indexing structures.
Explore 3 awesome GitHub repositories matching data & databases · Data Indexing Structures. Refine with filters or upvote what's useful.
klib ist eine umfassende Erweiterung der C-Standardbibliothek und ein Toolkit für Datenstrukturen. Es bietet eine Reihe grundlegender Tools für Speicherverwaltung, Datenorganisation und allgemeine Dienstprogrammfunktionen für eigenständige C-Anwendungen. Das Projekt verfügt über spezialisierte Funktionen für die bioinformatische Sequenzanalyse, einschließlich des Parsens von FASTA-, FASTQ- und Newick-Formaten sowie der Implementierung von Smith-Waterman-Sequenzalignment und Hidden-Markov-Modellen. Es enthält zudem eine Bibliothek für mathematische Berechnungen für numerische Routinen und Ausdrucksauswertung sowie einen leichtgewichtigen HTTP- und FTP-Client für den wahlfreien Zugriff auf entfernte Daten. Das Toolkit deckt eine breite Oberfläche von Hochleistungs-Computing-Primitiven ab, einschließlich Multithreading-Modellen, Suffix-Array-Konstruktion in linearer Zeit und optimierten Sortieralgorithmen. Es implementiert eine Vielzahl effizienter Datenindizierungsstrukturen wie Hash-Tabellen mit offener Adressierung, B-Bäume und intrusive AVL-Bäume, unterstützt durch speicherpoolbasierte Sequenzverwaltung. Zusätzliche Dienstprogramme umfassen JSON-Datenparsing und die Interpretation von Kommandozeilenargumenten.
Organizes information using hash tables, B-trees, and AVL trees for high-performance lookups.
Dieses Projekt ist ein chinesisches Lokalisierungs-Repository und technisches Übersetzungsprojekt, das darauf ausgelegt ist, prägnante Programmierprojekte und technische Dokumentationen für chinesischsprachige Personen zugänglich zu machen. Es bietet eine Sammlung übersetzter Ressourcen und kuratierter Mappings von Informatik-Terminologie, um eine konsistente Übersetzung technischer Konzepte zu gewährleisten. Das Projekt implementiert einen Software-Lokalisierungs-Workflow, der englischsprachige technische Leitfäden und Codebase-Dokumentationen in das Chinesische konvertiert. Dieser Prozess nutzt eine technische Glossar-Ressource und ein ressourcengesteuertes Lokalisierungsmodell, um die ursprüngliche Bedeutung und den technischen Kontext des Quellmaterials beizubehalten. Das Repository deckt die Übersetzung technischer Dokumentationen und die Verwaltung standardisierter Übersetzungs-Mappings ab, um eine konsistente technische Wortwahl über diverse Softwareprojekte hinweg sicherzustellen.
Implements specialized index structures to accelerate the retrieval of entities, attributes, and values.
Dieses Projekt ist ein High-Performance-Framework für die Verarbeitung tabellarischer Daten in R, das für die effiziente und schnelle Handhabung massiver Datensätze entwickelt wurde. Es bietet eine erweiterte Datenstruktur, die Referenzsemantik und In-Place-Modifikation nutzt, um komplexe Transformationen ohne den Overhead unnötiger Objektkopien durchzuführen. Die Bibliothek zeichnet sich durch ihre Low-Level-Architekturoptimierungen aus, einschließlich Multi-Threaded-Parallelverarbeitung, Radix-basiertem Sortieren und Memory-Mapped-File-Parsing. Durch das Auslagern kritischer Datenmanipulations- und Aggregationsroutinen in kompilierten C-Code ermöglicht sie die schnelle Ausführung von Aufgaben, die ansonsten rechenintensiv wären. Ihre Core-Engine unterstützt fortgeschrittene relationale Operationen wie Non-Equi-, Rolling- und Overlapping-Interval-Joins sowie automatische sekundäre Indizierung zur Beschleunigung wiederholter Datenzugriffe. Über ihre primären Verarbeitungsfunktionen hinaus bietet das Projekt eine umfassende Suite an Tools für das Datenlebenszyklus-Management. Dies umfasst Hochgeschwindigkeits-Ingestion- und Serialisierungs-Utilities mit automatischer Typenerkennung sowie spezialisierte Unterstützung für Zeitreihenanalysen und mehrdimensionale Aggregation. Das Framework ist auf Skalierbarkeit ausgelegt und ermöglicht Benutzern die Durchführung komplexer Gruppierungs-, Filter- und Reshaping-Operationen auf Datensätzen mit Milliarden von Zeilen bei gleichzeitiger Systemstabilität und Performance.
Organizes data structures using keys to enable fast retrieval and efficient filtering.