17 repository-uri
Mechanisms for appending computed results as new columns to tabular data structures.
Distinct from Distributed Dataframes: Existing candidates focus on disk storage or distributed dataframes, not the specific act of adding columns to an in-memory pandas DataFrame.
Explore 17 awesome GitHub repositories matching data & databases · DataFrame Integration. Refine with filters or upvote what's useful.
Perspective is a columnar data analytics engine and high-performance visualization component powered by WebAssembly. It provides a system for analyzing and visualizing large or streaming datasets through interactive data grids and charts, utilizing a compiled binary to achieve near-native performance within the browser. The project distinguishes itself through a WebSocket-based data streaming interface and deep Apache Arrow integration, which minimize memory overhead when synchronizing tables between servers and clients. It acts as a remote query proxy capable of translating visualization con
Converts pandas or polars DataFrame objects into internal high-performance tables while preserving indexing.
FastUI is a server-driven UI system and Pydantic UI framework that transforms backend data models into functional web interfaces. It operates as a model-based frontend generator where the server controls the layout and behavior of the user interface through structured data schemas, enabling a low-code approach to web development. The project allows for the definition of visual hierarchies and component properties on the backend, using a JSON-based protocol to communicate UI structure between the server and client. It utilizes schema-driven generation to automate the creation of interfaces, in
Displays tabular data from models with configurable columns, interactive links, and formatted fields.
Jeesite is a full-stack low-code development framework designed for building enterprise administrative portals using Spring Boot, MyBatis, and Vue. It functions as a comprehensive platform for creating administrative dashboards with integrated role-based access control and organizational data permission systems. The framework distinguishes itself through a combination of automated CRUD code generation and an integrated RAG platform that connects large language models to enterprise data via vector stores. It further incorporates a BPMN-based workflow engine to automate complex business process
Provides interactive data tables featuring sorting, pagination, and frozen columns for efficient administrative data management.
Mesop is a stateful, declarative Python web UI framework and component library designed for building interactive web applications and AI demos. It allows for the construction of data-driven interfaces and chat systems using only Python, removing the need to write separate HTML or CSS. The framework is specifically tailored for AI application development, offering dedicated tools for conversational UI design and the creation of dashboards for large language model applications. It distinguishes itself with a visual UI editor for real-time property adjustments and the ability to embed custom Jav
Renders data frames as interactive tables with sticky headers, columns, and clickable cells.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Converts Spark DataFrames into offline segment files and writes them to a specified filesystem path for ingestion.
dtale este o grilă interactivă bazată pe web și un vizualizator pentru dataframe-urile pandas, conceput ca un instrument de analiză exploratorie a datelor. Oferă o interfață bazată pe browser pentru analizarea structurilor de date tabelare, permițând utilizatorilor să calculeze statistici, să detecteze valori aberante și să calculeze corelații fără a scrie cod manual. Proiectul funcționează ca un vizualizator de date încorporat care poate fi integrat în aplicații web prin iframes sau rute personalizate, cu suport specific pentru Django, Flask și Streamlit. Permite explorarea seturilor de date printr-o combinație de grilă de date interactivă și o bibliotecă de vizualizare a datelor capabilă să genereze histograme, box plots și grafice scatter 3D. Platforma acoperă o gamă largă de capabilități de gestionare și analiză a datelor, inclusiv curățarea datelor tabelare, remodelarea și filtrarea interactivă. Include instrumente de observabilitate pentru analiza datelor lipsă, calculul corelației și scorarea puterii predictive. Pentru gestionarea sesiunilor, suportă urmărirea multi-instanță și persistența stării între procesele worker concurente. Interfața este protejată prin autentificare cu nume de utilizator și parolă și suportă ingestia de date din fișiere delimitate, foi de calcul și datastore-uri ArcticDB.
Connects to high-performance ArcticDB datastores to load and filter large-scale dataframes.
This is a pandas-based technical analysis library and financial feature engineering tool. It serves as a vectorized indicator calculator that transforms raw price and volume data into derived metrics for time series analysis. The library uses a NumPy-based engine to perform mathematical operations across entire arrays, avoiding iterative loops to maintain high performance. It organizes technical indicators into a modular class hierarchy with a consistent interface, allowing for bulk feature generation and the direct appending of results as new columns to a pandas DataFrame. The system covers
Appends computed indicator results as new columns to a pandas DataFrame to maintain time series alignment.
Mimesis este un generator de date sintetice pentru Python, utilizat pentru a crea seturi de date false realiste și date mock pentru testarea și dezvoltarea software-ului. Funcționează ca un generator de seturi de date bazat pe scheme, capabil să producă înregistrări structurate și seturi de date relaționale, servind totodată ca un anonimizator de date de producție pentru a înlocui informațiile sensibile cu valori sintetice. Biblioteca se distinge prin suportul multilingv cuprinzător, permițând generarea de informații specifice localității pentru a simula profiluri de utilizatori regionali. Asigură reproductibilitatea prin generarea deterministă de date folosind seed-uri, permițând crearea de seturi de date consistente între diferite rulări. Instrumentul acoperă o gamă largă de conținut sintetic, inclusiv identitate personală, date financiare, adrese geografice, metadate de rețea și secvențe științifice. Capabilitățile sale se extind la transformarea datelor prin logică condițională și piping, precum și la integrarea cu dataframe-uri și pattern-uri de tip factory. De asemenea, suportă generarea de coduri de sistem standardizate, token-uri criptografice și mock-uri de fișiere binare. Framework-ul este extensibil prin furnizori de date personalizați și field handlere, permițând utilizatorilor să integreze logică specifică domeniului și fișiere JSON externe pentru generarea specializată de date.
Generates synthetic columns for use in tabular data structures like pandas DataFrames.
statsforecast este o bibliotecă de prognoză statistică a seriilor temporale de înaltă performanță, concepută pentru a genera prognoze punctuale și intervale de predicție. Funcționează ca un framework distribuit de serii temporale care utilizează un motor de prognoză bazat pe C și un selector automat de modele pentru a identifica și potrivi modelul statistic optim pentru fiecare serie unică dintr-un set de date. Sistemul include, de asemenea, un detector de anomalii pentru serii temporale pentru a identifica punctele de date neobișnuite prin compararea valorilor observate cu intervalele de prognoză probabilistice. Proiectul se distinge prin capacitatea sa de a gestiona prognoza paralelă la scară masivă pentru milioane de serii individuale. Realizează acest lucru printr-un framework de calcul distribuit, execuție paralelă multi-core și kernel-uri C compilate care accelerează logica de bază ARIMA și de netezire exponențială. Sistemul optimizează în continuare procesarea la scară largă folosind un layout de date în format lung și un pipeline de date cu evaluare leneșă (lazy-evaluation) pentru a reduce overhead-ul de memorie. Biblioteca oferă o suită cuprinzătoare de modele, inclusiv AutoARIMA, diverse metode de netezire exponențială pentru cererea intermitentă sau sezonieră, descompunerea Theta și modelarea volatilității GARCH pentru riscul financiar. Acoperă domenii mai largi de capabilități, cum ar fi prognoza multivariată cu variabile exogene, descompunerea seriilor temporale și evaluarea modelelor prin cross-validare istorică și analiză sliding window. Biblioteca se integrează cu structuri de date de înaltă performanță precum Polars și oferă utilitare pentru a servi modelele salvate ca endpoint-uri REST pentru predicții accesibile prin rețea.
Integrates with Polars data structures to accelerate memory management and processing during forecasting.
Plotnine este o bibliotecă de vizualizare a datelor pentru Python bazată pe Grammar of Graphics. Servește drept framework declarativ de plotting statistic și motor de plotting multi-panel, permițând utilizatorilor să creeze grafice complexe prin maparea variabilelor de date la proprietăți vizuale precum poziția, culoarea și dimensiunea. Proiectul se distinge prin utilizarea unui model de compoziție stratificat și a unui motor de transformare statistică care efectuează agregări și calcule înainte de a randa vizualele. Dispune de un sistem cuprinzător pentru faceting multi-panel, care permite împărțirea unei singure vizualizări într-o grilă de sub-grafice bazate pe variabile categorice. Biblioteca acoperă o gamă largă de capabilități, inclusiv reprezentări geometrice diverse pentru distribuție, arie și scatter plots, precum și vizualizare geospațială pentru randarea limitelor geografice. Oferă instrumente extinse pentru maparea scalei, proiecții de coordonate și stilizare bazată pe teme pentru a separa elementele bazate pe date de proprietățile estetice non-date. Framework-ul utilizează un backend Matplotlib pentru randare și se integrează cu dataframe-urile tabelare prin operațiuni de piping.
Integrates tabular dataframes via piping operations, converting external pandas or polars objects into internal plotting formats.
aws-sdk-pandas este o bibliotecă Python care integrează dataframe-urile pandas cu serviciile AWS, acționând ca un instrument ETL de date cloud și conector de data lake. Oferă o interfață unificată pentru a muta și transforma datele între dataframe-urile din memorie și stocarea cloud, bazele de date și depozitele de date. Proiectul se distinge ca un orchestrator de calcul distribuit capabil să trimită sarcini de lucru bazate pe pandas către clustere EMR și medii de procesare serverless. Se specializează în continuare în coordonarea procesării distribuite a datelor prin inițializarea clusterelor Ray pentru a gestiona seturi de date care depășesc memoria unei singure mașini. Biblioteca acoperă o gamă largă de capabilități, inclusiv gestionarea stocării obiectelor pentru S3, execuția interogărilor SQL pentru Athena și Redshift și integrarea cu baze de date NoSQL, graf și serii temporale. Include, de asemenea, utilitare pentru gestionarea metadatelor prin catalogul Glue, indexarea datelor OpenSearch și gestionarea activelor de business intelligence în QuickSight. Funcționalitatea suplimentară include recuperarea secretelor, analizarea log-urilor CloudWatch și gestionarea seturilor de reguli de calitate a datelor.
Wraps multiple cloud service APIs to convert remote query results directly into Pandas dataframes.
dcat-admin este un framework de panou de administrare Laravel utilizat pentru a construi rapid interfețe administrative bazate pe date. Funcționează ca un generator CRUD și instrument de scaffolding backend care produce automat interfețe de creare, citire, actualizare și ștergere bazate pe schemele tabelelor din baza de date. Sistemul se distinge printr-o arhitectură de extensii bazată pe plugin-uri și capacitatea de a rula mai multe instanțe administrative independente într-o singură instalare. Oferă instrumente specializate pentru maparea API-urilor externe către formulare și tabele, precum și un ciclu de viață al formularului bazat pe evenimente pentru executarea de logică personalizată în timpul rezoluției și trimiterii. Framework-ul acoperă o gamă largă de domenii de capabilități, inclusiv controlul accesului bazat pe roluri (RBAC) pentru gestionarea permisiunilor ierarhice, o suită completă de grile de gestionare a datelor cu editare inline și fluxuri de lucru pentru formulare în mai mulți pași. Include, de asemenea, instrumente de vizualizare a datelor pentru dashboard-uri operaționale și o varietate de utilitare de manipulare a conținutului pentru încărcări de fișiere mari și editare text îmbogățit. Sunt furnizate utilitare de linie de comandă pentru a automatiza generarea componentelor administrative și a claselor de acțiune.
Renders database records in an expandable tree structure with lazy-loading for child nodes.
Vizro is a low-code Python framework for building production-ready data visualization applications. It functions as a UI orchestrator that allows users to define multi-page analytical dashboards through structured configurations in Python, YAML, or JSON, reducing the need for extensive frontend engineering. The project distinguishes itself through generative AI integration, utilizing a model context protocol server to translate natural language descriptions into validated dashboard configurations, charts, and layouts. It also features a decoupled data cataloging system that separates data sou
Displays dataframes in interactive tables with pre-configured sorting and pagination.
This project is a Python library that wraps official NBA endpoints to retrieve player, team, and game statistics as structured data. It serves as a programmatic interface for fetching professional basketball league records and real-time scoreboards via HTTP requests. The library integrates with Pandas to transform raw JSON responses from sports servers into DataFrames for statistical analysis and data science. It functions as a data retrieval utility for tracking league-wide performance trends and scouting professional basketball players. The tool covers a broad range of capabilities includi
Transforms raw JSON responses from sports servers into Pandas DataFrames for statistical analysis and data science.
This is a structured deep learning curriculum for programmers, delivered as a collection of Jupyter notebooks. It teaches the fundamentals of training neural networks for computer vision, natural language processing, tabular data analysis, and collaborative filtering using PyTorch and the fastai library. The course is designed to be hands-on, guiding learners from building a training loop from scratch to fine-tuning pretrained models for a variety of practical tasks. The curriculum distinguishes itself by covering the full lifecycle of a deep learning project, from data preparation and augmen
Reads column values from DataFrame rows as labels for supervised learning tasks.
Acest proiect este o colecție de componente de interfață accesibile și reutilizabile, construite pentru framework-ul Svelte. Funcționează ca o implementare completă a unui sistem de design, oferind un set de instrumente standardizat pentru construirea de interfețe utilizator responsive și incluzive, care respectă limbajul de design stabilit și ghidurile de accesibilitate. Biblioteca se distinge printr-o integrare profundă cu framework-ul Svelte, utilizând transformări bazate pe compilator pentru a optimiza randarea componentelor și sincronizarea stării reactive. Dispune de un sistem robust de gestionare a temelor care aplică stiluri vizuale prin proprietăți CSS personalizate, permițând schimbarea dinamică a temelor la runtime. În plus, biblioteca folosește randarea bazată pe portaluri pentru elementele UI flotante, asigurându-se că overlay-urile rămân neobstrucționate de constrângerile containerelor părinte. Suita de componente acoperă o gamă largă de cerințe de interfață, inclusiv gestionarea tabelelor de date structurate, construirea dinamică a formularelor cu validare integrată și containere de layout responsive. Oferă, de asemenea, utilitare specializate pentru urmărirea breakpoint-urilor de ecran, gestionarea persistenței stării aplicației și livrarea notificărilor către utilizator prin sisteme inline sau modale. Biblioteca este concepută pentru a susține fluxuri de lucru eficiente prin eliminarea stilurilor neutilizate și optimizarea livrării activelor în timpul procesului de build.
Renders structured datasets into sortable, interactive tables with defined headers and row identifiers.
React Base Table este o bibliotecă de componente de interfață reutilizabile concepute pentru construirea de grile de date complexe și responsive în aplicații web. Oferă o fundație de înaltă performanță pentru randarea seturilor mari de date prin utilizarea virtualizării rândurilor bazată pe fereastră, ceea ce asigură că interfața utilizatorului rămâne responsivă chiar și atunci când afișează colecții extinse de date. Biblioteca se distinge prin capabilități flexibile de layout și navigare, inclusiv suport pentru structuri de date ierarhice care pot fi randate ca rânduri de tip arbore expandabile. Permite controlul precis asupra geometriei tabelului prin dimensionarea proporțională a coloanelor și urmărirea automată a containerului, permițând în același timp utilizatorilor să fixeze coloane specifice la marginile viewport-ului pentru a menține vizibilitatea în timpul scroll-ului orizontal. Dezvoltatorii pot crea afișări de date extrem de personalizate prin injectarea de componente custom direct în celulele tabelului și aplicarea de override-uri de stil pentru a îndeplini cerințe specifice de design. Sistemul se ajustează automat la schimbările dimensiunii containerului părinte, asigurând că layout-ul tabelului rămâne consistent pe diferite dimensiuni de ecran și configurații de interfață.
Organizes and renders nested data structures as expandable tree rows to allow exploration of parent-child relationships.