2 مستودعات
Utilities for filling empty cells or null values in tabular datasets.
Distinct from Random Value Populators: Candidates focus on generating mock data for test databases, whereas this is about filling gaps in existing real datasets.
Explore 2 awesome GitHub repositories matching data & databases · Missing Value Population. Refine with filters or upvote what's useful.
dplyr هي مكتبة لمعالجة البيانات في لغة R توفر قواعد لتحويل إطارات البيانات الجدولية. تعمل كمعالج لإطارات البيانات الموجودة في الذاكرة وأداة لجبر البيانات العلائقية، باستخدام مجموعة متسقة من الأفعال لتصفية البيانات واختيارها وتلخيصها. يتضمن المشروع محرك ترجمة SQL يقوم بتحويل تعبيرات معالجة البيانات عالية المستوى إلى استعلامات محسنة. يتيح ذلك للمستخدمين إجراء التحويلات مباشرة على قواعد البيانات العلائقية البعيدة والتخزين السحابي دون الحاجة إلى جلب البيانات محلياً. تغطي المكتبة مجموعة واسعة من العمليات الجدولية، بما في ذلك تعديل الأعمدة، وتحديد مجموعات فرعية من الصفوف، وربط البيانات العلائقية. كما توفر إمكانيات لتحليل البيانات المجمعة، مما يسمح بتقسيم مجموعات البيانات لإجراء عمليات تجميع وملخصات مستقلة.
Provides utilities for filling empty cells or replacing null values in tabular datasets.
qsv is a high-performance command line toolkit for querying, transforming, and analyzing comma-separated value files. It functions as a data wrangling interface and a tabular data profiler, featuring a query engine capable of executing SQL statements and joins directly on flat files without requiring a database. The project is distinguished by its ability to process massive datasets that exceed available system memory. This is achieved through disk-based external memory processing, including multithreaded merge sorting, on-disk hash tables for deduplication, and lightweight file indexing for
Provides capabilities to populate empty cells within a dataset.