2 रिपॉजिटरी
Conversion of query results between different tabular memory formats and data science frameworks.
Distinct from Framework Array Conversions: Existing candidates are too narrow, focusing on specific tensor conversions rather than general dataframe format interoperability.
Explore 2 awesome GitHub repositories matching data & databases · Dataframe Interoperability. Refine with filters or upvote what's useful.
Ibis is a portable Python dataframe library and multi-backend query engine that provides a unified interface for executing data transformations across diverse compute engines. It functions as a Python SQL expression compiler and dialect transpiler, allowing users to define data logic once and execute it across cloud warehouses, embedded databases, and distributed clusters without rewriting code. The project distinguishes itself through a database backend abstraction that decouples transformation logic from the underlying execution engine. It enables polyglot data workflows by mixing raw SQL s
Transforms query results into common data structures such as Pandas, Polars, and PyArrow.
cuml, एक GPU-एक्सेलेरेटेड मशीन लर्निंग लाइब्रेरी और फ्रेमवर्क है जो टैबुलर डेटा प्रीप्रोसेसिंग और मॉडल निष्पादन को गति देने के लिए CUDA का उपयोग करता है। यह NVIDIA GPUs और GPU क्लस्टर्स पर क्लासिफिकेशन, रिग्रेशन और क्लस्टरिंग मॉडल्स को प्रशिक्षित और डिप्लॉय करने के लिए टूल्स का एक सूट प्रदान करता है। लाइब्रेरी को स्केलेबिलिटी के लिए डिज़ाइन किया गया है, जो एक डिस्ट्रिब्यूटेड GPU मशीन लर्निंग वातावरण प्रदान करती है जो सिंगल-डिवाइस मेमोरी से अधिक डेटासेट्स को संभालने के लिए हार्डवेयर एक्सेलेरेटर्स और नोड्स में गणना और डेटा फैला सकती है। यह मानक एस्टिमेटर इंटरफ़ेस को मिरर करती है ताकि मौजूदा वर्कफ़्लो के भीतर CPU-आधारित मॉडल्स को GPU-एक्सेलेरेटेड वर्शन्स के साथ बदला जा सके। प्रोजेक्ट मशीन लर्निंग क्षमताओं की एक विस्तृत श्रृंखला को कवर करता है, जिसमें सुपरवाइज्ड लर्निंग, अनसुपरवाइज्ड क्लस्टरिंग, नियरेस्ट नेबर सर्च और हाई-डायमेंशनल डाइमेंशनलिटी रिडक्शन शामिल है।
Enables seamless data movement between processing libraries by accepting various input formats like arrays and dataframes.