2 रिपॉजिटरी
Utilities for filling empty cells or null values in tabular datasets.
Distinct from Random Value Populators: Candidates focus on generating mock data for test databases, whereas this is about filling gaps in existing real datasets.
Explore 2 awesome GitHub repositories matching data & databases · Missing Value Population. Refine with filters or upvote what's useful.
dplyr एक R डेटा मैनिपुलेशन लाइब्रेरी है जो टैबुलर डेटा फ़्रेम को बदलने के लिए एक ग्रामर प्रदान करती है। यह इन-मेमोरी डेटा फ़्रेम प्रोसेसर और रिलेशनल डेटा अलजेब्रा टूल के रूप में कार्य करती है, जो डेटा को फ़िल्टर, सिलेक्ट और समराइज़ करने के लिए वर्ब्स के एक सुसंगत सेट का उपयोग करती है। इस प्रोजेक्ट में एक SQL ट्रांसलेशन इंजन शामिल है जो उच्च-स्तरीय डेटा मैनिपुलेशन एक्सप्रेशंस को ऑप्टिमाइज़्ड क्वेरीज़ में बदलता है। यह यूज़र्स को डेटा को स्थानीय रूप से पुल किए बिना सीधे रिमोट रिलेशनल डेटाबेस और क्लाउड स्टोरेज पर ट्रांसफ़ॉर्मेशन करने की अनुमति देता है। यह लाइब्रेरी कॉलम म्यूटेशन, रो सबसेटिंग और रिलेशनल डेटा जॉइनिंग सहित टैबुलर ऑपरेशंस की एक विस्तृत श्रृंखला को कवर करती है। यह ग्रुप किए गए डेटा विश्लेषण के लिए क्षमताएं भी प्रदान करती है, जिससे डेटासेट को स्वतंत्र एग्रीगेशन और सारांश के लिए विभाजित किया जा सकता है।
Provides utilities for filling empty cells or replacing null values in tabular datasets.
qsv is a high-performance command line toolkit for querying, transforming, and analyzing comma-separated value files. It functions as a data wrangling interface and a tabular data profiler, featuring a query engine capable of executing SQL statements and joins directly on flat files without requiring a database. The project is distinguished by its ability to process massive datasets that exceed available system memory. This is achieved through disk-based external memory processing, including multithreaded merge sorting, on-disk hash tables for deduplication, and lightweight file indexing for
Provides capabilities to populate empty cells within a dataset.