3 مستودعات
Architectural patterns for partitioning, processing, and reassembling data.
Distinguishing note: Focuses on the structural pattern rather than simple grouping utilities.
Explore 3 awesome GitHub repositories matching data & databases · Split-Apply-Combine Patterns. Refine with filters or upvote what's useful.
Pandas is a high-performance data analysis library that provides a comprehensive framework for manipulating, cleaning, and transforming structured datasets. It centers on labeled one-dimensional and two-dimensional data structures, allowing users to construct, filter, and reshape tabular information while performing complex arithmetic and logical operations. The library distinguishes itself through a sophisticated indexing engine that enables automatic data alignment during calculations and relational merges. By utilizing a block-based memory layout, it optimizes cache locality for vectorized
Implements the split-apply-combine pattern for independent group processing and reassembly.
This project is a pandas data analysis cookbook and Python data science guide. It provides a collection of programmatic recipes and examples for cleaning, manipulating, and analyzing structured data. The project focuses on providing a containerized analysis environment to ensure a consistent workspace and reproducible dependencies when executing data processing scripts. It covers a broad range of data science capabilities, including data ingestion from external sources, raw data cleaning, and exploratory data analysis. These recipes demonstrate how to perform structured data analysis through
Uses the split-apply-combine pattern to process data by categorizing, applying functions, and merging results.
Danfo.js هي مكتبة لتحليل البيانات والمعالجة المسبقة لـ JavaScript توفر هياكل بيانات مصنفة عالية الأداء. تنفذ إطارات البيانات (DataFrames) والسلاسل لتمكين تحليل البيانات المعقد، والحوسبة الإحصائية، ومعالجة البيانات الجدولية المهيكلة. تعمل المكتبة كمكتبة للمعالجة المسبقة لتعلم الآلة، حيث تقدم أدوات لتشفير التسميات الفئوية، والتشفير الأحادي (One-hot encoding)، وتوسيع نطاق الميزات الرقمية وتوحيدها. تسهل بشكل خاص تحويل هياكل البيانات المصنفة إلى tensors لتدريب النماذج وتقييمها. تغطي المكتبة مجموعة واسعة من القدرات بما في ذلك الإحصاءات الوصفية، والعمليات العلائقية مثل الدمج والربط، ومعالجة السلاسل الزمنية. تتضمن أدوات لتنظيف البيانات، والتصفية، والتجميع، بالإضافة إلى واجهة مرئية لإنشاء مخططات ورسوم بيانية تفاعلية مباشرة من إطارات البيانات. يدعم النظام استيراد وتصدير البيانات عبر تنسيقات CSV وJSON وExcel.
Implements the split-apply-combine pattern to segment datasets, apply functions, and reassemble results.