Why is attractivechaos/klib a recommended Data Indexing Structures GitHub Repositories repository?

Organizes information using hash tables, B-trees, and AVL trees for high-performance lookups.

Why is ht524/500lineorless_cn a recommended Data Indexing Structures GitHub Repositories repository?

Implements specialized index structures to accelerate the retrieval of entities, attributes, and values.

Why is rdatatable/data.table a recommended Data Indexing Structures GitHub Repositories repository?

Organizes data structures using keys to enable fast retrieval and efficient filtering.

3 Repos

Awesome GitHub RepositoriesData Indexing Structures

Efficient mechanisms for organizing data to enable fast retrieval and range-based queries.

Distinct from B+ Tree Indexing: Candidates focus on specific B-tree variants or selection logic rather than the general provision of indexing structures.

Explore 3 awesome GitHub repositories matching data & databases · Data Indexing Structures. Refine with filters or upvote what's useful.

Finde die besten Repos mit KI.Wir suchen mit KI nach den am besten passenden Repositories.

attractivechaos/klib
attractivechaos/klib
4,679Auf GitHub ansehen
klib ist eine umfassende Erweiterung der C-Standardbibliothek und ein Toolkit für Datenstrukturen. Es bietet eine Reihe grundlegender Tools für Speicherverwaltung, Datenorganisation und allgemeine Dienstprogrammfunktionen für eigenständige C-Anwendungen. Das Projekt verfügt über spezialisierte Funktionen für die bioinformatische Sequenzanalyse, einschließlich des Parsens von FASTA-, FASTQ- und Newick-Formaten sowie der Implementierung von Smith-Waterman-Sequenzalignment und Hidden-Markov-Modellen. Es enthält zudem eine Bibliothek für mathematische Berechnungen für numerische Routinen und Ausdrucksauswertung sowie einen leichtgewichtigen HTTP- und FTP-Client für den wahlfreien Zugriff auf entfernte Daten. Das Toolkit deckt eine breite Oberfläche von Hochleistungs-Computing-Primitiven ab, einschließlich Multithreading-Modellen, Suffix-Array-Konstruktion in linearer Zeit und optimierten Sortieralgorithmen. Es implementiert eine Vielzahl effizienter Datenindizierungsstrukturen wie Hash-Tabellen mit offener Adressierung, B-Bäume und intrusive AVL-Bäume, unterstützt durch speicherpoolbasierte Sequenzverwaltung. Zusätzliche Dienstprogramme umfassen JSON-Datenparsing und die Interpretation von Kommandozeilenargumenten.
Organizes information using hash tables, B-trees, and AVL trees for high-performance lookups.
C
Auf GitHub ansehen4,679
ht524/500lineorless_cn
HT524/500LineorLess_CN
4,434Auf GitHub ansehen
Dieses Projekt ist ein chinesisches Lokalisierungs-Repository und technisches Übersetzungsprojekt, das darauf ausgelegt ist, prägnante Programmierprojekte und technische Dokumentationen für chinesischsprachige Personen zugänglich zu machen. Es bietet eine Sammlung übersetzter Ressourcen und kuratierter Mappings von Informatik-Terminologie, um eine konsistente Übersetzung technischer Konzepte zu gewährleisten. Das Projekt implementiert einen Software-Lokalisierungs-Workflow, der englischsprachige technische Leitfäden und Codebase-Dokumentationen in das Chinesische konvertiert. Dieser Prozess nutzt eine technische Glossar-Ressource und ein ressourcengesteuertes Lokalisierungsmodell, um die ursprüngliche Bedeutung und den technischen Kontext des Quellmaterials beizubehalten. Das Repository deckt die Übersetzung technischer Dokumentationen und die Verwaltung standardisierter Übersetzungs-Mappings ab, um eine konsistente technische Wortwahl über diverse Softwareprojekte hinweg sicherzustellen.
Implements specialized index structures to accelerate the retrieval of entities, attributes, and values.
Jupyter Notebook
Auf GitHub ansehen4,434
rdatatable/data.table
Rdatatable/data.table
3,894Auf GitHub ansehen
Dieses Projekt ist ein High-Performance-Framework für die Verarbeitung tabellarischer Daten in R, das für die effiziente und schnelle Handhabung massiver Datensätze entwickelt wurde. Es bietet eine erweiterte Datenstruktur, die Referenzsemantik und In-Place-Modifikation nutzt, um komplexe Transformationen ohne den Overhead unnötiger Objektkopien durchzuführen. Die Bibliothek zeichnet sich durch ihre Low-Level-Architekturoptimierungen aus, einschließlich Multi-Threaded-Parallelverarbeitung, Radix-basiertem Sortieren und Memory-Mapped-File-Parsing. Durch das Auslagern kritischer Datenmanipulations- und Aggregationsroutinen in kompilierten C-Code ermöglicht sie die schnelle Ausführung von Aufgaben, die ansonsten rechenintensiv wären. Ihre Core-Engine unterstützt fortgeschrittene relationale Operationen wie Non-Equi-, Rolling- und Overlapping-Interval-Joins sowie automatische sekundäre Indizierung zur Beschleunigung wiederholter Datenzugriffe. Über ihre primären Verarbeitungsfunktionen hinaus bietet das Projekt eine umfassende Suite an Tools für das Datenlebenszyklus-Management. Dies umfasst Hochgeschwindigkeits-Ingestion- und Serialisierungs-Utilities mit automatischer Typenerkennung sowie spezialisierte Unterstützung für Zeitreihenanalysen und mehrdimensionale Aggregation. Das Framework ist auf Skalierbarkeit ausgelegt und ermöglicht Benutzern die Durchführung komplexer Gruppierungs-, Filter- und Reshaping-Operationen auf Datensätzen mit Milliarden von Zeilen bei gleichzeitiger Systemstabilität und Performance.
Organizes data structures using keys to enable fast retrieval and efficient filtering.
R
Auf GitHub ansehen3,894

Awesome Data Indexing Structures GitHub Repositories

attractivechaos/klib

HT524/500LineorLess_CN

Rdatatable/data.table