26 مستودعات
Using relative offsets within a binary blob to navigate data structures without parsing.
Distinct from Pointer-Based Navigation: Focuses on relative binary offsets for zero-copy access rather than path-based pointers to JSON/DOM elements.
Explore 26 awesome GitHub repositories matching data & databases · Offset-Based Addressing. Refine with filters or upvote what's useful.
CapnProto is a zero-copy serialization framework and remote procedure call system. It serves as a C++ communication library providing a schema-based data interchange format that eliminates the need to encode or decode data before reading it from memory. The system enables high-performance data serialization and low-latency network communication. It supports cross-language data exchange by using a defined schema to ensure consistent binary representation across different platforms. The framework provides tools for implementing remote procedure calls, allowing functions to be invoked on a remo
Enables zero-copy navigation of data structures using relative offsets within binary blobs.
Sarama is an Apache Kafka Go client library that provides native support for the Kafka protocol. It includes a protocol client for managing offsets and timestamps, a producer implementation for sending messages, and a consumer group coordinator to balance workloads across multiple instances. The library enables high throughput data streaming through concurrent message production and maintains strict partition ordering during network retries. It supports secure communication with Kafka brokers using certificate-based encryption to protect data traffic. The project covers a broad range of dist
Allows retrieving specific message offsets for given timestamps to initiate reading from precise points in time.
xsv is a suite of high-performance command-line utilities written in Rust for the analysis, manipulation, and statistical processing of large delimited datasets. It provides a toolkit for processing comma-separated value files through a command line interface. The project provides capabilities for statistical analysis, including the computation of column statistics, value frequencies, and descriptive metrics. It also includes data manipulation utilities for joining, slicing, sampling, and reformatting records. The toolkit covers a broad range of data operations including column selection, da
Uses byte-offset indexing to provide constant-time random access to rows without parsing the entire file.
WWDC is a native macOS video player and conference session manager designed for streaming and organizing developer conference videos. It functions as a video transcription browser and annotation tool, allowing users to track viewing progress and organize technical sessions into personalized learning paths. The application enables navigation through videos via searchable, multi-language text transcripts. Users can create searchable reference points by annotating specific video timestamps with custom notes and distribute content by sharing session links or extracting short video clips. The sys
Links searchable text indices to specific video time offsets for instant navigation during playback.
Silero VAD is a voice activity detection model and deep learning speech classifier designed to distinguish human speech from silence across diverse languages and noisy environments. It functions as a pre-trained neural network capable of identifying speech segments within both static audio recordings and real-time data streams. The project includes a language identification tool for classifying spoken languages and a framework for fine-tuning audio models. It provides utilities for optimizing detection thresholds using validation datasets and retraining the model with custom labeled audio to
Maps model output indices to temporal offsets to isolate specific voice segments from recordings.
Bigcache is a thread-safe, in-memory key-value store for Go designed to minimize garbage collection pauses. It functions as a memory-optimized cache capable of storing gigabytes of data while maintaining low latency during high-volume operations. The system avoids garbage collection overhead by managing memory through large byte arrays and manual allocation. It utilizes a circular-buffer layout to reuse space and lock-striped sharding to reduce contention during concurrent read and write access. The project provides capabilities for high-volume in-memory caching and low-latency data retrieva
Uses relative byte offsets within a large memory block to provide fast, zero-copy access to stored values.
Wren is an embeddable, class-based scripting language and bytecode interpreter. It provides a dependency-free virtual machine designed for integrating dynamic script execution into host applications via a C API. The language is centered on a modern object-oriented model featuring inheritance, method overloading, and first-class functions. It utilizes a concurrent fiber runtime to manage lightweight, cooperatively scheduled execution paths without relying on operating system threads. The project includes a comprehensive suite of object-oriented primitives, closure-based state capture, and a m
Implements fixed-offset field access to eliminate expensive hash table lookups for object properties.
Autocut is a text-based video editor and automatic speech recognition tool. It allows users to cut and merge video clips by modifying a text transcript instead of using a traditional timeline. The system operates as an FFmpeg video processor and subtitle manipulation utility. It converts spoken audio into text and compacts subtitle files into simplified formats, enabling the removal of unwanted video segments by deleting corresponding sentences from a transcription file. The project covers automated video transcription, non-linear video cutting, and subtitle file management. It supports hard
Generates precise video edit points by mapping text indices from a transcript to specific timecodes.
kcat هو عميل واجهة سطر أوامر لـ Apache Kafka يُستخدم لإنتاج واستهلاك وتصحيح أخطاء الرسائل باستخدام بروتوكول الأسلاك الأصلي. يوفر مجموعة من الأدوات للتفاعل مع مجموعات Kafka، بما في ذلك مصحح بروتوكول لفحص بيانات تعريف المجموعة ومدير معاملات للتعامل مع دفعات الرسائل الذرية. يتميز المشروع بفك تشفير مخطط Avro متخصص يحول الرسائل المشفرة ثنائياً إلى JSON مقروء للبشر من خلال التكامل مع سجلات المخططات البعيدة أو الملفات المحلية. بالإضافة إلى ذلك، يتضمن محاكياً في الذاكرة يسمح باختبار منطق المنتج والمستهلك عن طريق محاكاة سلوك الوسيط المؤقت دون الحاجة إلى بنية تحتية خارجية. تغطي مجموعة الأدوات مجموعة واسعة من عمليات المراسلة، بما في ذلك دعم مجموعة المستهلكين المتوازنة، والبحث عن الإزاحة القائم على الطابع الزمني، وبث البيانات المعاملاتية من الإدخال القياسي. كما يوفر أدوات مساعدة لتكوين أمان الاتصال وفحص بيانات تعريف المجموعة.
Retrieves specific message offsets based on temporal values for targeted data recovery and analysis.
LyricsX هو تطبيق macOS يعرض كلمات الأغاني المتزامنة فوق واجهة النظام أثناء تشغيل الموسيقى. يعمل كأداة عرض سطح المكتب، ومجمع كلمات خارجي، ومرفق مزامنة. يجلب التطبيق كلمات الأغاني من مصادر بيانات بعيدة متعددة باستخدام بيانات تعريف التشغيل الحالية ويوفر محول نصوص لترجمة النص بين الأحرف الصينية التقليدية والمبسطة. كما يتضمن مدير ملفات كلمات لاستيراد وتصدير تنسيقات الكلمات الشائعة عبر تفاعلات السحب والإفلات. توفر الأداة قدرات لمزامنة التوقيت لمطابقة طوابع كلمات الأغاني مع ساعة تشغيل الصوت. تشمل الميزات الإضافية القدرة على عرض كلمات الأغاني على سطح المكتب أو شريط القائمة وإدارة دورة حياة التطبيق التلقائية للحفاظ على المزامنة مع مشغل الموسيقى النشط.
Adjusts the temporal offset of lyric lines to align precisely with the audio playback clock.
exif-js هي مكتبة JavaScript لاستخراج بيانات تعريف الصور مباشرة في المتصفح. تعمل كمحلل لمخزن الصور الثنائي الذي يقرأ بايتات الصور الخام لاسترجاع التفاصيل الفنية دون الحاجة إلى تحميل الملفات إلى خادم. تقوم المكتبة بتحليل البيانات باتباع معايير EXIF وIPTC لاستخراج إعدادات الكاميرا، والطوابع الزمنية، وإحداثيات GPS، والتعليقات التوضيحية، والكلمات الرئيسية، ومعلومات حقوق النشر. وتستخدم مصفوفات مكتوبة واجتيازاً قائماً على الإزاحة للتنقل في هياكل الصور وتعيين المعرفات الرقمية إلى وسوم قابلة للقراءة البشرية.
Navigates image file structures by calculating byte offsets to jump between metadata segments.
HelloSilicon is a programming guide and tutorial for writing and debugging low-level 64-bit assembly code specifically for Apple Silicon processors. It serves as an architecture reference for interacting with macOS and iOS kernel services using system calls and hardware registers. The project provides specialized instruction on foreign function interfacing to bridge assembly with high-level languages like C or Python. It also includes a toolkit for configuring Mach-O binaries and compiling universal binaries and dynamic libraries for cross-hardware compatibility. The material covers low-leve
Demonstrates how to access nonlocal data by calculating relative offsets from a base page in the writable section.
This project is an anime scene reverse image search engine that matches a screenshot to the exact anime episode and timestamp. It is designed as a self-hosted search service that can be deployed using Docker containers and pre-indexed databases, enabling private operation on local or custom infrastructure. At its core, the system extracts visual features from frames using a convolutional neural network trained on anime imagery. Query images provided via URL are processed through the same feature extraction pipeline, and an approximate nearest neighbor search matches the query against millions
Translates matched frame numbers to exact anime episode, offset, and scene metadata.
Kaitai Struct هو إطار عمل لمواصفات ثنائية تصريحية يوفر توليداً مؤتمتاً للمحلل والمُسلسل عبر لغات برمجة متعددة. يستخدم لغة محمولة خاصة بالمجال لوصف تخطيط الملفات الثنائية وحزم الشبكة، محولاً هذه المواصفات إلى كود مصدر لقراءة وكتابة البيانات الثنائية. يمكن النظام من معالجة البيانات عبر اللغات عن طريق ترجمة تعريف هيكلي واحد إلى كود مصدر أصلي للغات بما في ذلك C++ و C# و Go و Java و JavaScript و Python و Rust. يسمح هذا النهج بتنفيذ نفس مواصفات البيانات الثنائية عبر منصات مختلفة دون إعادة كتابة منطق التحليل يدوياً. يغطي إطار العمل نمذجة ومعالجة البيانات الثنائية، بما في ذلك القدرة على إدارة مؤشرات القراءة للتنقل في الإزاحة وتطبيق تحويلات البيانات مثل فك الضغط وفك التشفير. كما يوفر أدوات لتصحيح أخطاء مواصفات التنسيق للتحقق من التعيين بين تخطيطات البيانات الثنائية وأوصافها التصريحية.
Provides mechanisms for navigating binary blobs using absolute and relative byte offsets via a read pointer.
rkyv is a zero-copy deserialization framework for Rust that provides a binary serialization format for memory-mappable data archives. It allows complex data structures to be mapped to bytes and accessed directly from a buffer without allocating new memory or copying data. The project enables the serialization of polymorphic types and trait objects, maintaining their dynamic behavior and structure within the binary form. It utilizes relative-pointer addressing and byte-aligned structure packing to ensure data remains valid regardless of where it is loaded in memory. The framework covers high-
Uses relative offsets instead of absolute addresses to ensure data remains valid regardless of memory location.
MuJing هو أداة لتعلم مفردات اللغة الإنجليزية في سياقها ومشغل وسائط تفاعلي مصمم لدراسة اللغات. يستخرج الكلمات من مقاطع الفيديو والمستندات لتقديم أمثلة واقعية ومقاطع وسائط للحفظ، ويعمل كأداة لغوية تعتمد على الترجمة (subtitles) ومولد لقوائم الكلمات بناءً على الجذور اللغوية. يتميز النظام بربط قوائم المفردات بطوابع زمنية محددة في الفيديو وترجمات لتعزيز التعلم السمعي والبصري. يتضمن مشغل فيديو مع ترجمات ثنائية اللغة وتمارين للنسخ والتهجئة عبر لوحة المفاتيح لبناء الذاكرة العضلية من خلال سياقات الأفلام والبرامج التلفزيونية. يغطي المشروع استخراج المفردات من المستندات والترجمات ومسارات الفيديو، مقترناً بتنقية قوائم الكلمات من خلال التجزئة (lemmatization)، وتصفية التكرار، والاستبعاد القائم على القاموس. كما يدير مصادر التعلم متعددة الوسائط ويبث مقاطع فيديو محددة مرتبطة بالكلمات المستهدفة لتعزيز الذاكرة.
Maps vocabulary terms to precise video playback offsets for immediate retrieval of audiovisual examples.
Velox هو محرك تنفيذ استعلامات عالي الأداء ومكتبة لمعالجة البيانات العمودية بلغة C++. يعمل كإطار عمل قابل للتركيب لتنفيذ محركات الاستعلام التحليلية، ويوفر مقيماً للتعبيرات المتجهة (vectorized) ومجموعة أدوات لأنظمة إدارة البيانات. يتميز المشروع باستخدامه للتنفيذ العمودي المتجه وتخصيص الذاكرة القائم على الساحة (arena-based) لمعالجة مجموعات البيانات واسعة النطاق. يتميز بتحسينات متخصصة مثل التخزين المؤقت لجدول الربط الإذاعي (broadcast join)، ودفع الفلتر الديناميكي للأسفل، وترميز القاموس لتقليل حمل الذاكرة وتسريع القراءات التحليلية. يغطي المحرك مجموعة واسعة من القدرات التحليلية، بما في ذلك تنفيذ عمليات الربط (hash, merge, semi joins)، بالإضافة إلى التجميع المتوازي متعدد المراحل وحساب دوال النافذة. يوفر بدائيات للتخزين العمودي في الذاكرة، وفك تشفير بيانات Parquet، والتكامل مع التخزين السحابي. يتم توفير القابلية للتوسع من خلال نظام تسجيل الدوال للدوال العددية والتجميعية المخصصة، مع توفر روابط عالية المستوى لربط منطق C++ بلغة Python.
Manages variable-length elements and nested arrays using offset buffers to enable zero-copy slicing and indexing.
Deformable-ConvNets هو إطار عمل لرؤية الحاسوب ومجموعة من مكونات الشبكات العصبية المصممة لتنفيذ الشبكات العصبية التلافيفية القابلة للتشكيل (Deformable Convolutional Neural Networks). يوفر طبقات تلافيفية تكيفية وتطبيقات تجميع (pooling) تعدل مجالات استقبالها بناءً على ميزات المدخلات لالتقاط هندسة الكائنات داخل الصور بشكل أفضل. يُمكّن المشروع من استخدام إزاحات أخذ العينات القابلة للتعلم وأقنعة التعديل لمحاذاة الشبكات التلافيفية مع أشكال الكائنات المستهدفة. كما يتضمن أدوات متخصصة لتصور الإزاحات المكتسبة في طبقات التلافيف والتجميع، مما يسمح بتحليل كيفية تكيف الشبكة مع مجال استقبالها المكاني. تُطبق هذه القدرات لتحسين دقة اكتشاف الكائنات وتحسين التجزئة الدلالية (semantic segmentation). يدعم إطار العمل استخراج الميزات من مناطق الاهتمام (ROI) من خلال التجميع القابل للتشكيل لمحاذاة مناطق أخذ العينات مع حدود الكائنات الفعلية. يتضمن التنفيذ خط أنابيب تدريب لتنفيذ وتقييم هذه البنى الشبكية المتخصصة.
Enables the use of learnable 2D offsets to adjust convolutional grids to match object shapes in images.
pyinstxtractor is a PyInstaller executable unpacker and Python bytecode recovery tool. It functions as a helper for decompiling compiled Python binaries by extracting bundled binaries and bytecode from executables created with PyInstaller. The project includes a bytecode decryptor to remove encryption from extracted files and a header repair tool that restores corrupted headers. These capabilities ensure that extracted compiled files are compatible with bytecode decompilation software. The utility covers reverse engineering of Python applications, supporting malware analysis workflows throug
Uses relative offsets within binary blobs to navigate and locate bundled assets.
KafkaJS هو عميل JavaScript خالص لـ Apache Kafka، يوفر الأدوات اللازمة لإنتاج واستهلاك الرسائل من مجموعة Kafka دون الحاجة إلى تبعيات أصلية أو إضافات خارجية. يعمل كمكتبة تكامل شاملة لتطبيقات Node.js للمشاركة في معالجة الرسائل الموزعة وبث الأحداث في الوقت الفعلي. يتميز المشروع بتنفيذه الأصلي لبروتوكول سلك Kafka، متجنباً تبعيات C++. يتميز بعميل أمان يدعم مصادقة SSL وTLS وSASL، إلى جانب قدرات المعاملات التي تسمح بإرسال الرسائل الذري والالتزامات المرتبطة بالإزاحة لضمان المعالجة مرة واحدة بالضبط. تغطي المكتبة مجموعة واسعة من المجالات التشغيلية، بما في ذلك إدارة المجموعة الكاملة لإدارة المواضيع ومجموعات المستهلكين، واستراتيجيات توجيه وتعيين الأقسام المتقدمة، والقياس عن بعد الشامل عبر المراقبة القائمة على الأحداث. كما تنفذ أنماط موثوقية الشبكة مثل عمليات إعادة المحاولة ذات التراجع الأسي وجلب البيانات المدرك للرف لتحسين زمن الوصول.
Fetches the earliest or most recent offsets for a topic based on a specific timestamp.