17 مستودعات
Mechanisms for appending computed results as new columns to tabular data structures.
Distinct from Distributed Dataframes: Existing candidates focus on disk storage or distributed dataframes, not the specific act of adding columns to an in-memory pandas DataFrame.
Explore 17 awesome GitHub repositories matching data & databases · DataFrame Integration. Refine with filters or upvote what's useful.
Perspective is a columnar data analytics engine and high-performance visualization component powered by WebAssembly. It provides a system for analyzing and visualizing large or streaming datasets through interactive data grids and charts, utilizing a compiled binary to achieve near-native performance within the browser. The project distinguishes itself through a WebSocket-based data streaming interface and deep Apache Arrow integration, which minimize memory overhead when synchronizing tables between servers and clients. It acts as a remote query proxy capable of translating visualization con
Converts pandas or polars DataFrame objects into internal high-performance tables while preserving indexing.
FastUI is a server-driven UI system and Pydantic UI framework that transforms backend data models into functional web interfaces. It operates as a model-based frontend generator where the server controls the layout and behavior of the user interface through structured data schemas, enabling a low-code approach to web development. The project allows for the definition of visual hierarchies and component properties on the backend, using a JSON-based protocol to communicate UI structure between the server and client. It utilizes schema-driven generation to automate the creation of interfaces, in
Displays tabular data from models with configurable columns, interactive links, and formatted fields.
Jeesite is a full-stack low-code development framework designed for building enterprise administrative portals using Spring Boot, MyBatis, and Vue. It functions as a comprehensive platform for creating administrative dashboards with integrated role-based access control and organizational data permission systems. The framework distinguishes itself through a combination of automated CRUD code generation and an integrated RAG platform that connects large language models to enterprise data via vector stores. It further incorporates a BPMN-based workflow engine to automate complex business process
Provides interactive data tables featuring sorting, pagination, and frozen columns for efficient administrative data management.
Mesop is a stateful, declarative Python web UI framework and component library designed for building interactive web applications and AI demos. It allows for the construction of data-driven interfaces and chat systems using only Python, removing the need to write separate HTML or CSS. The framework is specifically tailored for AI application development, offering dedicated tools for conversational UI design and the creation of dashboards for large language model applications. It distinguishes itself with a visual UI editor for real-time property adjustments and the ability to embed custom Jav
Renders data frames as interactive tables with sticky headers, columns, and clickable cells.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Converts Spark DataFrames into offline segment files and writes them to a specified filesystem path for ingestion.
dtale هو شبكة تفاعلية قائمة على الويب ومصور لإطارات بيانات pandas، مصمم كأداة تحليل بيانات استكشافية. يوفر واجهة قائمة على المتصفح لتحليل هياكل البيانات الجدولية، مما يسمح للمستخدمين بحساب الإحصائيات، واكتشاف القيم المتطرفة، وحساب الارتباطات دون كتابة كود يدوي. يعمل المشروع كعارض بيانات مضمن يمكن دمجه في تطبيقات الويب عبر iframes أو مسارات مخصصة، مع دعم محدد لـ Django و Flask و Streamlit. يتيح استكشاف مجموعات البيانات من خلال مزيج من شبكة بيانات تفاعلية ومكتبة تصور بيانات قادرة على إنشاء رسوم بيانية، ومخططات صندوقية، ومخططات تشتت ثلاثية الأبعاد. تغطي المنصة مجموعة واسعة من قدرات إدارة وتحليل البيانات، بما في ذلك تنظيف البيانات الجدولية، وإعادة التشكيل، والتصفية التفاعلية. يتضمن أدوات مراقبة لتحليل البيانات المفقودة، وحساب الارتباط، وتسجيل القوة التنبؤية. لإدارة الجلسة، يدعم تتبع المثيلات المتعددة واستمرارية الحالة عبر عمليات العامل المتزامنة. الواجهة محمية بمصادقة اسم المستخدم وكلمة المرور وتدعم استيعاب البيانات من الملفات المحددة، وجداول البيانات، ومخازن بيانات ArcticDB.
Connects to high-performance ArcticDB datastores to load and filter large-scale dataframes.
This is a pandas-based technical analysis library and financial feature engineering tool. It serves as a vectorized indicator calculator that transforms raw price and volume data into derived metrics for time series analysis. The library uses a NumPy-based engine to perform mathematical operations across entire arrays, avoiding iterative loops to maintain high performance. It organizes technical indicators into a modular class hierarchy with a consistent interface, allowing for bulk feature generation and the direct appending of results as new columns to a pandas DataFrame. The system covers
Appends computed indicator results as new columns to a pandas DataFrame to maintain time series alignment.
Mimesis هو مولد بيانات اصطناعية بلغة Python يستخدم لإنشاء مجموعات بيانات وهمية واقعية وبيانات تجريبية لاختبار البرمجيات وتطويرها. يعمل كمولد مجموعات بيانات قائم على المخطط (Schema) قادر على إنتاج سجلات منظمة ومجموعات بيانات علائقية، بينما يعمل أيضاً كمخفي بيانات للإنتاج لاستبدال المعلومات الحساسة بقيم اصطناعية. تتميز المكتبة بدعم شامل متعدد اللغات، مما يسمح بإنشاء معلومات خاصة بالموقع لمحاكاة ملفات تعريف المستخدمين الإقليمية. وتضمن إمكانية التكرار من خلال توليد البيانات الحتمية باستخدام البذور (Seeds)، مما يتيح إنشاء مجموعات بيانات متسقة عبر عمليات تشغيل مختلفة. تغطي الأداة مجموعة واسعة من المحتوى الاصطناعي، بما في ذلك الهوية الشخصية، والبيانات المالية، والعناوين الجغرافية، وبيانات الشبكة الوصفية، والتسلسلات العلمية. وتمتد قدراتها إلى تحويل البيانات من خلال المنطق الشرطي والأنابيب (Piping)، بالإضافة إلى التكامل مع إطارات البيانات (Dataframes) وأنماط المصنع (Factory patterns). كما تدعم إنشاء رموز النظام الموحدة، ورموز التشفير، ومحاكاة الملفات الثنائية. إطار العمل قابل للتوسيع عبر مزودي بيانات مخصصين ومعالجات حقول، مما يسمح للمستخدمين بدمج منطق خاص بالمجال وملفات JSON خارجية لتوليد بيانات متخصصة.
Generates synthetic columns for use in tabular data structures like pandas DataFrames.
statsforecast هي مكتبة تنبؤ بالسلاسل الزمنية إحصائية عالية الأداء مصممة لإنشاء تنبؤات نقطية وفترات تنبؤ. تعمل كإطار عمل موزع للسلاسل الزمنية يستخدم محرك تنبؤ قائم على C ومحدد نماذج آلي لتحديد وملاءمة النموذج الإحصائي الأمثل لكل سلسلة فريدة في مجموعة البيانات. يتضمن النظام أيضاً كاشف شذوذ للسلاسل الزمنية لتحديد نقاط البيانات غير العادية من خلال مقارنة القيم المرصودة مقابل فترات التنبؤ الاحتمالية. يتميز المشروع بقدرته على التعامل مع التنبؤ المتوازي على نطاق واسع لملايين السلاسل الفردية. ويحقق ذلك من خلال إطار عمل حوسبة موزع، وتنفيذ متوازي متعدد النواة، ونوى C مجمعة تسرع منطق ARIMA الأساسي والتنعيم الأسي. كما يعمل النظام على تحسين المعالجة واسعة النطاق باستخدام تخطيط بيانات طويل التنسيق وخط أنابيب بيانات التقييم الكسول لتقليل حمل الذاكرة. توفر المكتبة مجموعة شاملة من النماذج، بما في ذلك AutoARIMA، وطرق تنعيم أسي متنوعة للطلب المتقطع أو الموسمي، وتحليل Theta، ونمذجة تقلب GARCH للمخاطر المالية. وتغطي مجالات قدرات أوسع مثل التنبؤ متعدد المتغيرات مع متغيرات خارجية، وتحليل السلاسل الزمنية، وتقييم النموذج عبر التحقق المتبادل التاريخي وتحليل النافذة المنزلقة. تتكامل المكتبة مع هياكل بيانات عالية الأداء مثل Polars وتوفر أدوات لخدمة النماذج المحفوظة كنقاط نهاية REST للتنبؤات التي يمكن الوصول إليها عبر الشبكة.
Integrates with Polars data structures to accelerate memory management and processing during forecasting.
Plotnine is a data visualization library for Python based on the Grammar of Graphics. It serves as a declarative statistical plotting framework and multi-panel plotting engine, allowing users to create complex charts by mapping data variables to visual properties such as position, color, and size. The project is distinguished by its use of a layered composition model and a statistical transformation engine that performs aggregations and computations before rendering visuals. It features a comprehensive system for multi-panel faceting, which enables the splitting of a single visualization into
Integrates tabular dataframes via piping operations, converting external pandas or polars objects into internal plotting formats.
aws-sdk-pandas هي مكتبة Python تدمج إطارات بيانات pandas مع خدمات AWS، وتعمل كأداة ETL لبيانات السحابة وموصل لمستودع البيانات. توفر واجهة موحدة لنقل وتحويل البيانات بين إطارات البيانات في الذاكرة والتخزين السحابي وقواعد البيانات ومستودعات البيانات. يتميز المشروع كمنسق حوسبة موزع قادر على إرسال أعباء العمل القائمة على pandas إلى مجموعات EMR وبيئات المعالجة بدون خادم. كما يتخصص في تنسيق معالجة البيانات الموزعة عبر تهيئة مجموعة Ray للتعامل مع مجموعات البيانات التي تتجاوز ذاكرة جهاز واحد. تغطي المكتبة مجموعة واسعة من القدرات، بما في ذلك إدارة تخزين الكائنات لـ S3، وتنفيذ استعلام SQL لـ Athena وRedshift، والتكامل مع قواعد بيانات NoSQL، والرسم البياني، والسلاسل الزمنية. كما تتضمن أدوات لإدارة البيانات الوصفية من خلال كتالوج Glue، وفهرسة بيانات OpenSearch، وإدارة أصول ذكاء الأعمال في QuickSight. تشمل الوظائف الإضافية استرداد الأسرار، وتحليل سجلات CloudWatch، وإدارة قواعد جودة البيانات.
Wraps multiple cloud service APIs to convert remote query results directly into Pandas dataframes.
dcat-admin هو إطار عمل لوحة تحكم Laravel يُستخدم لبناء واجهات إدارية تعتمد على البيانات بسرعة. يعمل كمولد CRUD وأداة سقالات خلفية تنتج تلقائياً واجهات الإنشاء والقراءة والتحديث والحذف بناءً على مخططات جداول قاعدة البيانات. يتميز النظام ببنية امتداد قائمة على المكونات الإضافية والقدرة على تشغيل مثيلات إدارية مستقلة متعددة داخل تثبيت واحد. ويوفر أدوات متخصصة لربط واجهات برمجة التطبيقات الخارجية بالنماذج والجداول، بالإضافة إلى دورة حياة نموذج قائمة على الأحداث لتنفيذ منطق مخصص أثناء الحل والإرسال. يغطي إطار العمل مجموعة واسعة من مجالات الإمكانيات، بما في ذلك التحكم في الوصول القائم على الأدوار لإدارة الأذونات الهرمية، ومجموعة شاملة من شبكات إدارة البيانات مع التحرير المضمن، وسير عمل النماذج متعددة الخطوات. كما يتضمن أدوات تصور البيانات للوحات التحكم التشغيلية ومجموعة متنوعة من أدوات معالجة المحتوى لتحميل الملفات الكبيرة المجزأة وتحرير النصوص الغنية. يتم توفير أدوات سطر الأوامر لأتمتة إنشاء المكونات الإدارية وفئات الإجراءات.
Renders database records in an expandable tree structure with lazy-loading for child nodes.
Vizro is a low-code Python framework for building production-ready data visualization applications. It functions as a UI orchestrator that allows users to define multi-page analytical dashboards through structured configurations in Python, YAML, or JSON, reducing the need for extensive frontend engineering. The project distinguishes itself through generative AI integration, utilizing a model context protocol server to translate natural language descriptions into validated dashboard configurations, charts, and layouts. It also features a decoupled data cataloging system that separates data sou
Displays dataframes in interactive tables with pre-configured sorting and pagination.
This project is a Python library that wraps official NBA endpoints to retrieve player, team, and game statistics as structured data. It serves as a programmatic interface for fetching professional basketball league records and real-time scoreboards via HTTP requests. The library integrates with Pandas to transform raw JSON responses from sports servers into DataFrames for statistical analysis and data science. It functions as a data retrieval utility for tracking league-wide performance trends and scouting professional basketball players. The tool covers a broad range of capabilities includi
Transforms raw JSON responses from sports servers into Pandas DataFrames for statistical analysis and data science.
This is a structured deep learning curriculum for programmers, delivered as a collection of Jupyter notebooks. It teaches the fundamentals of training neural networks for computer vision, natural language processing, tabular data analysis, and collaborative filtering using PyTorch and the fastai library. The course is designed to be hands-on, guiding learners from building a training loop from scratch to fine-tuning pretrained models for a variety of practical tasks. The curriculum distinguishes itself by covering the full lifecycle of a deep learning project, from data preparation and augmen
Reads column values from DataFrame rows as labels for supervised learning tasks.
هذا المشروع عبارة عن مجموعة من مكونات الواجهة القابلة لإعادة الاستخدام والتي يمكن الوصول إليها، والمبنية خصيصاً لإطار العمل Svelte. يعمل المشروع كنظام تصميم متكامل، حيث يوفر أدوات قياسية لبناء واجهات مستخدم متجاوبة وشاملة تلتزم بمعايير التصميم وإرشادات سهولة الوصول. تتميز المكتبة بتكاملها العميق مع إطار العمل Svelte، حيث تستخدم تحويلات تعتمد على المترجم (compiler) لتحسين عرض المكونات ومزامنة الحالة التفاعلية. كما تتضمن نظاماً قوياً لإدارة السمات (themes) يطبق الأنماط المرئية عبر خصائص CSS المخصصة، مما يسمح بتبديل السمات ديناميكياً أثناء التشغيل. بالإضافة إلى ذلك، تستخدم المكتبة تقنية العرض عبر البوابات (portal-based rendering) لعناصر الواجهة العائمة لضمان عدم حجبها بواسطة قيود الحاويات الأبوية. تغطي مجموعة المكونات نطاقاً واسعاً من متطلبات الواجهة، بما في ذلك إدارة جداول البيانات المهيكلة، وبناء النماذج الديناميكية مع التحقق المدمج، وحاويات التخطيط المتجاوبة. كما توفر أدوات متخصصة لتتبع نقاط توقف الشاشة (breakpoints)، وإدارة استمرارية حالة التطبيق، وتقديم إشعارات المستخدم عبر أنظمة مضمنة أو مشروطة (modal). صُممت المكتبة لدعم سير عمل تطوير فعال من خلال تقليم الأنماط غير المستخدمة وتحسين تسليم الأصول أثناء عملية البناء.
Renders structured datasets into sortable, interactive tables with defined headers and row identifiers.
React Base Table is a library of reusable interface components designed for building complex, responsive data grids within web applications. It provides a high-performance foundation for rendering large datasets by utilizing window-based row virtualization, which ensures the user interface remains responsive even when displaying extensive collections of data. The library distinguishes itself through flexible layout and navigation capabilities, including support for hierarchical data structures that can be rendered as expandable tree rows. It allows for precise control over table geometry thro
Organizes and renders nested data structures as expandable tree rows to allow exploration of parent-child relationships.