10 Repos
Algorithms for mapping and transforming one sequence of data into another to optimize memory and processing.
Distinct from Sequence To Sequence Models: The candidates refer to ML Sequence-to-Sequence models (Transformers), whereas this is a general algorithmic utility for mapping data sequences.
Explore 10 awesome GitHub repositories matching data & databases · Sequence Transformations. Refine with filters or upvote what's useful.
This project is a markdown knowledge base used to maintain a curated collection of concise technical notes and write-ups across various programming languages and tools. It serves as a searchable personal reference library for documenting technical discoveries and software development patterns. The system implements a learning in public workflow, transforming markdown-based content storage into a static site. It utilizes directory-based routing to map folder structures to URL paths and employs schema-driven type generation to ensure data consistency across the knowledge base. The codebase cov
Produces a sequence of all intermediate values generated during a collection reduction.
pifs ist ein Dateisystem für mathematische Konstanten und ein Simulator für datenfreien Speicher. Es emuliert ein virtuelles Dateisystem, indem es Dateidaten auf Ziffernfolgen innerhalb unendlicher mathematischer Konstanten abbildet, um die Notwendigkeit physischer Festplattenspeicher zu eliminieren. Das System fungiert als experimentelles Tool zur Dateizuordnung, das Dateiinhalte in Koordinaten und Offsets innerhalb einer numerischen Konstante umwandelt. Es nutzt einen virtuellen Metadaten-Manager, um Dateilängen und -positionen zu verfolgen, was den Datenabruf ohne traditionelle Speicherblöcke ermöglicht. Das Projekt deckt experimentelle Speicherarchitektur durch die Verwendung formelhafter Offset-Berechnungen und indexbasierter Metadatenverfolgung ab, um eine Standard-Dateihierarchie zu simulieren.
Implements the conversion of raw file content into digit sequences compatible with mathematical constants.
This project is a comprehensive Lisp AI implementation library that provides reference implementations for various artificial intelligence paradigms and symbolic algorithms. It functions as a multi-purpose toolkit containing a logic programming engine, a natural language processing suite, and a symbolic mathematics toolkit. The library is distinguished by its diverse architectural frameworks, including a Prolog-style execution engine that uses unification and goal-driven backtracking, and a system for simulating human decision-making through expert system shells and certainty factors. It also
Deno Data Storage & Sync applies a function to multiple sequences and writes results into a target sequence to minimize memory allocation.
The .NET Reactive Extensions Library is a framework for composing, querying, and transforming asynchronous data streams. It provides a non-blocking implementation of the observer pattern to manage notifications and data flows between producers and consumers, functioning as an event stream processing library. The project applies LINQ-style querying and filtering operators to asynchronous sequences. This allows for the handling of event-driven programming patterns by utilizing composable operators to process notifications as they occur. The library covers asynchronous data streaming and non-bl
Applies advanced operators to asynchronous enumerables for complex data transformations.
language-ext is a functional programming framework for C# that provides a suite of immutable data structures and monadic types. It enables the implementation of pure functional programming patterns, utilizing containers to manage side effects, optional values, and error handling. The library is distinguished by its advanced concurrency and state management tools, including a software transactional memory system and lock-free atomic references. It also provides specialized utilities for distributed systems, such as vector clocks for causality tracking and deterministic data conflict resolution
Applies mapping functions to each element of a lazy sequence to produce a new transformed sequence.
RxKotlin is a reactive programming library and asynchronous stream processor that provides Kotlin language extensions for composing event-based data streams. It serves as a set of Kotlin bindings for RxJava, allowing developers to transform, filter, and flatten sequences of data emitted over time. The library focuses on integrating RxJava patterns into Kotlin projects by applying language-specific conventions and idioms. It utilizes extension functions to simplify reactive programming patterns, reduce boilerplate, and optimize workflows within the reactive ecosystem. The toolkit covers a bro
Employs lazy transformations on data streams, ensuring operations are only executed upon observer subscription.
Reactor Core ist ein Toolkit für reaktive Programmierung und eine nicht-blockierende Grundlage für die Komposition asynchroner Datenpipelines auf der JVM. Es dient als Framework für asynchrone Stream-Verarbeitung und als Backpressure-Managementsystem, das es Entwicklern ermöglicht, Ereignissequenzen zu transformieren, zu filtern und zu kombinieren, während der Datenfluss zwischen Produzenten und Konsumenten reguliert wird, um Ressourcenerschöpfung zu vermeiden. Die Bibliothek differenziert sich durch ein ausgeklügeltes Concurrency-Scheduling-System und nachfragebasierte Flusskontrolle. Sie entkoppelt die Signalverarbeitung von spezifischen Threads unter Verwendung einer Scheduler-Registry und bietet Mechanismen für die kontextbewusste Propagierung unveränderlicher Metadaten über asynchrone Grenzen hinweg. Sie enthält zudem spezialisierte Tools für die Trace-Erfassung zur Assembly-Zeit und Virtual-Time-Scheduling, um das Testen zeitbasierter Operatoren zu erleichtern. Das Projekt deckt ein breites Spektrum an Funktionen ab, einschließlich funktionaler Datenverarbeitung für Sequenzaggregation und Windowing, einer Vielzahl von Fehlerbehebungsstrategien wie exponentiellem Backoff-Retry sowie Dienstprogrammen zur Überbrückung von Legacy-Callback- oder synchronen APIs in reaktive Streams. Zudem bietet es Instrumentierung für Pipeline-Monitoring und eine Suite von Test-Tools zur Verifizierung von Signalsequenzen.
Provides a rich set of operators for mapping, flattening, and transforming asynchronous data sequences.
NCCL ist eine Hochleistungs-Kommunikationsbibliothek und ein Framework für verteiltes GPU-Computing, das für die Ausführung kollektiver und Punkt-zu-Punkt-Datenaustausche über mehrere GPUs in Einzel- oder Multi-Node-Systemen entwickelt wurde. Es dient als RDMA-GPU-Transportschicht und Speicher-Orchestrator, der die hochbandbreitige Synchronisation von Daten und Modellgradienten für verteiltes GPU-Training und Inference erleichtert. Die Bibliothek zeichnet sich durch ihre Fähigkeit aus, Kommunikationsprimitive direkt aus GPU-Kernels auszuführen, wodurch die Host-CPU aus dem kritischen Pfad entfernt wird. Sie nutzt topologiebewusste Pfadauswahl zur Optimierung der Datenbewegung und verwendet RDMA-basierten Netzwerktransport, einschließlich InfiniBand und NVLink, um Zero-Copy-Speicherzugriffe zwischen Geräten über verschiedene physische Knoten hinweg zu ermöglichen. Das Projekt deckt eine breite Palette an kollektiven Kommunikationsmustern ab, darunter Reduktionen, Broadcasts, Gathers und All-to-All-Austausche, neben Punkt-zu-Punkt-Remote-Speicherzugriffen. Es bietet umfassendes Communicator-Management für die Initialisierung, Partitionierung und Größenanpassung von GPU-Gruppen sowie spezialisiertes Speichermanagement für das Registrieren von Buffern und das Koordinieren von gemeinsam genutztem Gerätespeicher. Das System enthält eine Suite von Monitoring- und Observability-Tools für Health-Tracking, diagnostisches Logging und Echtzeit-Ereignisüberwachung sowie Integrationsschnittstellen für Machine-Learning-Frameworks, CUDA-Graphs, MPI und Python.
NCCL performs a reduction across multiple sources and copies the resulting value to destinations in a single operation.
Dies ist eine C++-Ranges-Bibliothek und Erweiterung der Standard Template Library, die eine Sammlung zusammensetzbarer Algorithmen und Lazy Views für die Verarbeitung von Datensequenzen bereitstellt. Sie fungiert als Framework für die Verarbeitung von Lazy-Sequenzen und als Template-Metaprogrammierungsbibliothek zur Manipulation von Typenlisten und zur Durchführung von Typberechnungen zur Kompilierzeit. Das Projekt ermöglicht funktionale Programmiermuster in C++ durch die Verwendung von Pipe-Syntax und partieller Anwendung, um lesbare, von links nach rechts verlaufende Datentransformationsketten zu erstellen. Es erlaubt die Konstruktion von Lazy-Datenpipelines, die Elemente bei Bedarf filtern und transformieren, um den Speicherbedarf zu reduzieren und unnötige Kopien zu vermeiden. Die Bibliothek deckt breite Funktionsbereiche ab, einschließlich Sequenzmanipulation, Typmanipulation zur Kompilierzeit sowie die Implementierung benutzerdefinierter Range-Typen und Iteratoren. Sie bietet Tools für Eager-In-Place-Containermutation, projektionsbasiertes Algorithmus-Dispatching und die Verwaltung von Typenlisten durch eine Reihe von Callables auf Typebene.
Implements a comprehensive set of algorithms for mapping and transforming data sequences to optimize memory and processing.
more-itertools ist eine Python-Utility-Bibliothek für Iterables, die erweiterte Funktionen zur Manipulation, Filterung und Transformation von Datensequenzen bereitstellt. Sie dient als Toolkit für die Verarbeitung von Datenströmen und als Sammlung von Hilfsmitteln für das Management von Iterator-Zuständen, womit sie die Möglichkeiten des Standard-Moduls itertools erweitert. Die Bibliothek enthält ein kombinatorisches Mathe-Toolkit zur Erzeugung von Permutationen, Kombinationen und Potenzmengen sowie Routinen für zahlentheoretische Berechnungen und Matrixoperationen. Zudem bietet sie Werkzeuge für das Stream-State-Management, mit denen Benutzer einen Blick auf kommende Elemente werfen oder innerhalb einer Sequenz navigieren können, um die Datenverarbeitung zu steuern. Weitere Funktionen umfassen Routinen für das Chunking, Interleaving und Flattening komplexer Sequenzen. Das Toolkit enthält außerdem Funktionen zur Analyse von Iterable-Eigenschaften und zur Synchronisierung paralleler Datenströme.
Offers algorithms for mapping and transforming sequences, including padding and repeating values.