26 Repos
Using relative offsets within a binary blob to navigate data structures without parsing.
Distinct from Pointer-Based Navigation: Focuses on relative binary offsets for zero-copy access rather than path-based pointers to JSON/DOM elements.
Explore 26 awesome GitHub repositories matching data & databases · Offset-Based Addressing. Refine with filters or upvote what's useful.
CapnProto is a zero-copy serialization framework and remote procedure call system. It serves as a C++ communication library providing a schema-based data interchange format that eliminates the need to encode or decode data before reading it from memory. The system enables high-performance data serialization and low-latency network communication. It supports cross-language data exchange by using a defined schema to ensure consistent binary representation across different platforms. The framework provides tools for implementing remote procedure calls, allowing functions to be invoked on a remo
Enables zero-copy navigation of data structures using relative offsets within binary blobs.
Sarama is an Apache Kafka Go client library that provides native support for the Kafka protocol. It includes a protocol client for managing offsets and timestamps, a producer implementation for sending messages, and a consumer group coordinator to balance workloads across multiple instances. The library enables high throughput data streaming through concurrent message production and maintains strict partition ordering during network retries. It supports secure communication with Kafka brokers using certificate-based encryption to protect data traffic. The project covers a broad range of dist
Allows retrieving specific message offsets for given timestamps to initiate reading from precise points in time.
xsv is a suite of high-performance command-line utilities written in Rust for the analysis, manipulation, and statistical processing of large delimited datasets. It provides a toolkit for processing comma-separated value files through a command line interface. The project provides capabilities for statistical analysis, including the computation of column statistics, value frequencies, and descriptive metrics. It also includes data manipulation utilities for joining, slicing, sampling, and reformatting records. The toolkit covers a broad range of data operations including column selection, da
Uses byte-offset indexing to provide constant-time random access to rows without parsing the entire file.
WWDC is a native macOS video player and conference session manager designed for streaming and organizing developer conference videos. It functions as a video transcription browser and annotation tool, allowing users to track viewing progress and organize technical sessions into personalized learning paths. The application enables navigation through videos via searchable, multi-language text transcripts. Users can create searchable reference points by annotating specific video timestamps with custom notes and distribute content by sharing session links or extracting short video clips. The sys
Links searchable text indices to specific video time offsets for instant navigation during playback.
Silero VAD is a voice activity detection model and deep learning speech classifier designed to distinguish human speech from silence across diverse languages and noisy environments. It functions as a pre-trained neural network capable of identifying speech segments within both static audio recordings and real-time data streams. The project includes a language identification tool for classifying spoken languages and a framework for fine-tuning audio models. It provides utilities for optimizing detection thresholds using validation datasets and retraining the model with custom labeled audio to
Maps model output indices to temporal offsets to isolate specific voice segments from recordings.
Bigcache is a thread-safe, in-memory key-value store for Go designed to minimize garbage collection pauses. It functions as a memory-optimized cache capable of storing gigabytes of data while maintaining low latency during high-volume operations. The system avoids garbage collection overhead by managing memory through large byte arrays and manual allocation. It utilizes a circular-buffer layout to reuse space and lock-striped sharding to reduce contention during concurrent read and write access. The project provides capabilities for high-volume in-memory caching and low-latency data retrieva
Uses relative byte offsets within a large memory block to provide fast, zero-copy access to stored values.
Wren is an embeddable, class-based scripting language and bytecode interpreter. It provides a dependency-free virtual machine designed for integrating dynamic script execution into host applications via a C API. The language is centered on a modern object-oriented model featuring inheritance, method overloading, and first-class functions. It utilizes a concurrent fiber runtime to manage lightweight, cooperatively scheduled execution paths without relying on operating system threads. The project includes a comprehensive suite of object-oriented primitives, closure-based state capture, and a m
Implements fixed-offset field access to eliminate expensive hash table lookups for object properties.
Autocut is a text-based video editor and automatic speech recognition tool. It allows users to cut and merge video clips by modifying a text transcript instead of using a traditional timeline. The system operates as an FFmpeg video processor and subtitle manipulation utility. It converts spoken audio into text and compacts subtitle files into simplified formats, enabling the removal of unwanted video segments by deleting corresponding sentences from a transcription file. The project covers automated video transcription, non-linear video cutting, and subtitle file management. It supports hard
Generates precise video edit points by mapping text indices from a transcript to specific timecodes.
kcat ist ein Kommandozeilen-Client für Apache Kafka, der verwendet wird, um Nachrichten unter Verwendung des nativen Wire-Protokolls zu produzieren, zu konsumieren und zu debuggen. Er bietet eine Reihe von Tools für die Interaktion mit Kafka-Clustern, einschließlich eines Protokoll-Debuggers zur Untersuchung von Cluster-Metadaten und eines Transaktionsmanagers für die Handhabung atomarer Nachrichten-Batches. Das Projekt verfügt über einen spezialisierten Avro-Schema-Dekoder, der binär kodierte Nachrichten in menschenlesbares JSON umwandelt, indem er sich in Remote-Schema-Registries oder lokale Dateien integriert. Zusätzlich enthält es einen In-Memory-Simulator, der das Testen von Producer- und Consumer-Logik durch die Simulation ephemerer Broker-Verhaltensweisen ermöglicht, ohne dass eine externe Infrastruktur erforderlich ist. Das Toolset deckt ein breites Spektrum an Messaging-Operationen ab, einschließlich Unterstützung für ausbalancierte Consumer-Gruppen, zeitstempelbasierte Offset-Suche und transaktionales Daten-Streaming von der Standardeingabe. Zudem bietet es Dienstprogramme für die Konfiguration der Verbindungssicherheit und die Untersuchung von Cluster-Metadaten.
Retrieves specific message offsets based on temporal values for targeted data recovery and analysis.
LyricsX is a macOS application that renders synchronized song lyrics over the system UI during music playback. It functions as a desktop display tool, an external lyric aggregator, and a synchronization utility. The application fetches lyrics from multiple remote data sources using current playback metadata and provides a script converter to translate text between Traditional and Simplified Chinese characters. It also includes a lyric file manager for importing and exporting common lyric formats via drag-and-drop interactions. The tool provides capabilities for timing synchronization to matc
Adjusts the temporal offset of lyric lines to align precisely with the audio playback clock.
exif-js ist eine JavaScript-Bibliothek zum Extrahieren von Bildmetadaten direkt im Browser. Sie fungiert als Binär-Bild-Buffer-Parser, der rohe Bildbytes liest, um technische Details abzurufen, ohne dass Dateien auf einen Server hochgeladen werden müssen. Die Bibliothek parst Daten gemäß den EXIF- und IPTC-Standards, um Kameraeinstellungen, Zeitstempel, GPS-Koordinaten, Bildunterschriften, Schlüsselwörter und Copyright-Informationen zu extrahieren. Sie nutzt typisierte Arrays und offset-basiertes Traversieren, um Bildstrukturen zu navigieren und numerische Bezeichner auf menschenlesbare Tags abzubilden.
Navigates image file structures by calculating byte offsets to jump between metadata segments.
HelloSilicon ist ein Programmierleitfaden und Tutorial zum Schreiben und Debuggen von Low-Level-64-Bit-Assembly-Code speziell für Apple Silicon-Prozessoren. Es dient als Architekturreferenz für die Interaktion mit macOS- und iOS-Kernel-Diensten unter Verwendung von Systemaufrufen und Hardware-Registern. Das Projekt bietet spezialisierte Anleitungen zum Foreign-Function-Interfacing, um Assembly mit Hochsprachen wie C oder Python zu verbinden. Es enthält zudem ein Toolkit zur Konfiguration von Mach-O-Binaries sowie zum Kompilieren universeller Binaries und dynamischer Bibliotheken für hardwareübergreifende Kompatibilität. Das Material deckt Low-Level-Systemprogrammierung ab, einschließlich Speicheradressierung, Aufrufkonventionen und der Verwendung von Debuggern zur Inspektion von Registern und Speicher.
Demonstrates how to access nonlocal data by calculating relative offsets from a base page in the writable section.
This project is an anime scene reverse image search engine that matches a screenshot to the exact anime episode and timestamp. It is designed as a self-hosted search service that can be deployed using Docker containers and pre-indexed databases, enabling private operation on local or custom infrastructure. At its core, the system extracts visual features from frames using a convolutional neural network trained on anime imagery. Query images provided via URL are processed through the same feature extraction pipeline, and an approximate nearest neighbor search matches the query against millions
Translates matched frame numbers to exact anime episode, offset, and scene metadata.
Kaitai Struct ist ein Framework für deklarative Binärspezifikationen, das die automatisierte Parser- und Serializer-Generierung über mehrere Programmiersprachen hinweg ermöglicht. Es verwendet eine portable, domänenspezifische Sprache, um das Layout von Binärdateien und Netzwerkpaketen zu beschreiben, und konvertiert diese Spezifikationen in Quellcode zum Lesen und Schreiben binärer Daten. Das System ermöglicht sprachübergreifende Datenverarbeitung durch die Übersetzung einer einzigen strukturellen Definition in nativen Quellcode für Sprachen wie C++, C#, Go, Java, JavaScript, Python und Rust. Dieser Ansatz ermöglicht es, dieselbe Binärdatenspezifikation über verschiedene Plattformen hinweg zu implementieren, ohne die Parsing-Logik manuell neu schreiben zu müssen. Das Framework deckt die Modellierung und Verarbeitung binärer Daten ab, einschließlich der Fähigkeit, Lesezeiger für die Offset-Navigation zu verwalten und Datentransformationen wie Dekomprimierung und Entschlüsselung anzuwenden. Es bietet zudem Tools für das Debugging von Formatspezifikationen, um das Mapping zwischen Binärdatenlayouts und ihren deklarativen Beschreibungen zu validieren.
Provides mechanisms for navigating binary blobs using absolute and relative byte offsets via a read pointer.
rkyv ist ein Zero-Copy-Deserialisierungs-Framework für Rust, das ein binäres Serialisierungsformat für speicherabbildbare Datenarchive bereitstellt. Es ermöglicht, komplexe Datenstrukturen auf Bytes abzubilden und direkt aus einem Puffer zuzugreifen, ohne neuen Speicher zuzuweisen oder Daten zu kopieren. Das Projekt ermöglicht die Serialisierung polymorpher Typen und Trait-Objekte, wobei deren dynamisches Verhalten und Struktur innerhalb der binären Form beibehalten werden. Es nutzt relative Zeigeradressierung und byte-ausgerichtetes Struktur-Packing, um sicherzustellen, dass Daten unabhängig davon gültig bleiben, wo sie im Speicher geladen werden. Das Framework deckt hochperformante Datenpersistenz und latenzarmes Zustandsmanagement durch direktes Memory-Mapping ab. Es bietet Mechanismen sowohl für Zero-Copy-Datenzugriff als auch für die vollständige Rekonstruktion von Datentypen, wenn dies von der Anwendung benötigt wird.
Uses relative offsets instead of absolute addresses to ensure data remains valid regardless of memory location.
MuJing is a contextual English vocabulary learner and interactive media player designed for language study. It extracts words from videos and documents to provide real-world examples and media clips for memorization, functioning as a subtitle-based language tool and a lemma-based word list generator. The system differentiates itself by linking vocabulary lists to specific video timestamps and subtitles for auditory and visual reinforcement. It includes a video player with bilingual subtitles and keyboard-based transcription and spelling exercises to build muscle memory through movie and telev
Maps vocabulary terms to precise video playback offsets for immediate retrieval of audiovisual examples.
Velox ist eine leistungsstarke C++-Abfrage-Ausführungs-Engine und eine Bibliothek für spaltenbasierte Datenverarbeitung. Sie dient als kompositionsfähiges Framework zur Implementierung analytischer Query-Engines und bietet einen vektorisierten Ausdrucksauswerter sowie ein Toolkit für Datenmanagementsysteme. Das Projekt zeichnet sich durch die Verwendung vektorisierter spaltenbasierter Ausführung und arena-basierter Speicherallokation zur Verarbeitung großer Datensätze aus. Es bietet spezialisierte Optimierungen wie Broadcast-Join-Table-Caching, Dynamic-Filter-Push-Down und Dictionary-Encoding, um den Speicher-Overhead zu reduzieren und analytische Lesezugriffe zu beschleunigen. Die Engine deckt ein breites Spektrum analytischer Funktionen ab, einschließlich der Implementierung von Hash-, Merge- und Semi-Joins sowie mehrstufiger paralleler Aggregation und der Berechnung von Fensterfunktionen. Sie bietet Primitive für spaltenbasierte In-Memory-Speicherung, Parquet-Datendekodierung und die Integration mit Cloud-Speichern. Erweiterbarkeit wird durch ein Funktionsregistrierungssystem für benutzerdefinierte Skalar- und Aggregatfunktionen geboten, wobei High-Level-Bindings verfügbar sind, um die C++-Logik mit Python zu verbinden.
Manages variable-length elements and nested arrays using offset buffers to enable zero-copy slicing and indexing.
Deformable-ConvNets ist ein Computer-Vision-Framework und eine Sammlung von neuronalen Netzwerkkomponenten zur Implementierung von deformierbaren faltenden neuronalen Netzen (CNNs). Es bietet adaptive Convolutional-Layer und Pooling-Implementierungen, die ihre rezeptiven Felder basierend auf Eingabemerkmalen anpassen, um die Geometrie von Objekten in Bildern präziser zu erfassen. Das Projekt ermöglicht den Einsatz von lernbaren Sampling-Offsets und Modulationsmasken, um Convolutional-Grids an die Formen von Zielobjekten auszurichten. Es enthält spezialisierte Tools zur Visualisierung der gelernten Offsets in Convolution- und Pooling-Layern, wodurch analysiert werden kann, wie das Netzwerk sein räumliches rezeptives Feld anpasst. Diese Funktionen werden eingesetzt, um die Genauigkeit der Objekterkennung zu verbessern und die semantische Segmentierung zu verfeinern. Das Framework unterstützt die Extraktion von Merkmalen aus Regionen von Interesse (RoI) durch Deformable Pooling, um Sampling-Bereiche an tatsächliche Objektgrenzen anzupassen. Die Implementierung umfasst eine Trainings-Pipeline zur Ausführung und Evaluierung dieser spezialisierten Netzwerkarchitekturen.
Enables the use of learnable 2D offsets to adjust convolutional grids to match object shapes in images.
pyinstxtractor is a PyInstaller executable unpacker and Python bytecode recovery tool. It functions as a helper for decompiling compiled Python binaries by extracting bundled binaries and bytecode from executables created with PyInstaller. The project includes a bytecode decryptor to remove encryption from extracted files and a header repair tool that restores corrupted headers. These capabilities ensure that extracted compiled files are compatible with bytecode decompilation software. The utility covers reverse engineering of Python applications, supporting malware analysis workflows throug
Uses relative offsets within binary blobs to navigate and locate bundled assets.
KafkaJS ist ein reiner JavaScript-Client für Apache Kafka, der die notwendigen Tools bereitstellt, um Nachrichten aus einem Kafka-Cluster zu produzieren und zu konsumieren, ohne native Abhängigkeiten oder externe Addons zu erfordern. Er fungiert als umfassende Integrationsbibliothek für Node.js-Anwendungen, um an verteilter Nachrichtenverarbeitung und Echtzeit-Event-Streaming teilzunehmen. Das Projekt zeichnet sich durch seine native Implementierung des Kafka-Wire-Protokolls aus, wodurch C++-Abhängigkeiten vermieden werden. Es verfügt über einen Security-Client, der SSL-, TLS- und SASL-Authentifizierung unterstützt, sowie über transaktionale Funktionen, die atomares Nachrichten-Senden und verknüpfte Offset-Commitments ermöglichen, um Exactly-Once-Processing sicherzustellen. Die Bibliothek deckt ein breites Spektrum an operativen Bereichen ab, einschließlich vollständiger Cluster-Administration zur Verwaltung von Topics und Consumer-Groups, fortgeschrittenem Partition-Routing und Zuweisungsstrategien sowie umfassender Telemetrie durch event-gesteuertes Monitoring. Sie implementiert zudem Netzwerk-Zuverlässigkeitsmuster wie Exponential-Backoff-Retries und Rack-Aware-Data-Fetching, um die Latenz zu optimieren.
Fetches the earliest or most recent offsets for a topic based on a specific timestamp.