6 مستودعات
Accessing data using integer-based slicing.
Distinguishing note: Focuses on positional access rather than label-based access.
Explore 6 awesome GitHub repositories matching data & databases · Position-Based Data Selection. Refine with filters or upvote what's useful.
Pandas is a high-performance data analysis library that provides a comprehensive framework for manipulating, cleaning, and transforming structured datasets. It centers on labeled one-dimensional and two-dimensional data structures, allowing users to construct, filter, and reshape tabular information while performing complex arithmetic and logical operations. The library distinguishes itself through a sophisticated indexing engine that enables automatic data alignment during calculations and relational merges. By utilizing a block-based memory layout, it optimizes cache locality for vectorized
Supports standard integer-based slicing for precise data retrieval.
Python is a high-level, interpreted programming language designed for readability and versatility. It operates via a bytecode-based virtual machine and manages memory automatically through reference-counting garbage collection. The language supports multiple programming paradigms, including object-oriented, imperative, and functional styles, and provides a comprehensive standard library for system operations, networking, and data handling. The language is distinguished by its dynamic nature, allowing for runtime object introspection and metaclass-driven class creation. It utilizes protocol-ba
Python retrieves specific items or sub-sequences from a collection using zero-based index positions or range-based slicing.
Dask هو إطار عمل للحوسبة المتوازية وجدول مهام موزع مصمم لتوسيع نطاق سير عمل علوم البيانات في Python من أجهزة فردية إلى مجموعات (clusters) كبيرة. يعمل كمدير موارد للمجموعة يقوم بتنسيق المنطق الحسابي من خلال تمثيل المهام وتبعياتها كرسوم بيانية موجهة غير دورية. تسمح هذه البنية للنظام بأتمتة توزيع أعباء العمل عبر الأجهزة المتاحة مع إدارة متطلبات التنفيذ المعقدة. يتميز المشروع بمحرك تقييم كسول يؤجل عمليات البيانات حتى يتم طلبها صراحة، مما يتيح تحسين الرسم البياني العالمي وتخصيص الموارد بكفاءة. يتضمن خاصية تسريب البيانات الواعية بالذاكرة لمنع تعطل النظام عند معالجة مجموعات البيانات التي تتجاوز الذاكرة المتاحة، ويستخدم دمج الرسم البياني للمهام لدمج تسلسلات العمليات في خطوات تنفيذ واحدة، مما يقلل من عبء الجدولة والاتصال بين العقد. توفر المنصة سطح قدرات شاملاً لتحليلات البيانات واسعة النطاق، بما في ذلك دعم التعلم الآلي الموزع، وتكامل الحوسبة عالية الأداء، ومعالجة البيانات المتوازية. توفر أدوات واسعة النطاق لإدارة دورة حياة المجموعة، وتوصيف الأداء، والمراقبة في الوقت الفعلي لتنفيذ المهام. يمكن للمستخدمين نشر هذه البيئات عبر بنية تحتية متنوعة، بما في ذلك الأجهزة المحلية، ومزودي السحابة، والأنظمة الحاوية، ومجموعات الحوسبة عالية الأداء.
Extracts specific columns from a dataset using integer-based positional indexing while maintaining the underlying distributed structure.
Hexyl is a colored hex dump utility and binary data viewer for the terminal. It allows for the inspection of binary files by rendering contents as a colored hex dump to distinguish between different byte categories, such as printable text, whitespace, and null bytes. The tool includes a C-style hex exporter that transforms binary data into C include files for direct integration into source code. It supports visual layout customization through configurable panels and borders, as well as the ability to define colors for byte categories and offsets using terminal colors or RGB hex codes via envi
Enables precise slicing of binary streams by specifying start offsets and data lengths.
Danfo.js هي مكتبة لتحليل البيانات والمعالجة المسبقة لـ JavaScript توفر هياكل بيانات مصنفة عالية الأداء. تنفذ إطارات البيانات (DataFrames) والسلاسل لتمكين تحليل البيانات المعقد، والحوسبة الإحصائية، ومعالجة البيانات الجدولية المهيكلة. تعمل المكتبة كمكتبة للمعالجة المسبقة لتعلم الآلة، حيث تقدم أدوات لتشفير التسميات الفئوية، والتشفير الأحادي (One-hot encoding)، وتوسيع نطاق الميزات الرقمية وتوحيدها. تسهل بشكل خاص تحويل هياكل البيانات المصنفة إلى tensors لتدريب النماذج وتقييمها. تغطي المكتبة مجموعة واسعة من القدرات بما في ذلك الإحصاءات الوصفية، والعمليات العلائقية مثل الدمج والربط، ومعالجة السلاسل الزمنية. تتضمن أدوات لتنظيف البيانات، والتصفية، والتجميع، بالإضافة إلى واجهة مرئية لإنشاء مخططات ورسوم بيانية تفاعلية مباشرة من إطارات البيانات. يدعم النظام استيراد وتصدير البيانات عبر تنسيقات CSV وJSON وExcel.
Retrieves specific data subsets using integer indices, arrays of positions, or slice notation.
This is a Python library providing sorted list, set, and dictionary data structures that maintain their order automatically during insertions and deletions. The library provides a sorted list for fast random access and logarithmic lookups, a sorted set for unique elements and set-theoretic operations, and a sorted dictionary for managing key-value pairs where keys remain sorted. These collections support custom sorting logic through user-defined key functions to determine the order of elements. Core capabilities include positional indexing, range queries, and the use of bisection methods to
Enables retrieving elements by their integer position using optimized lookups across internal sublists.