15 Repos
Tools for aggregating and grouping datasets into summary tables.
Distinct from Table Data Processing: Distinct from Table Data Processing: focuses on pivot-specific aggregation logic rather than general row-level table operations.
Explore 15 awesome GitHub repositories matching data & databases · Pivot Table Aggregators. Refine with filters or upvote what's useful.
Ramda is a functional JavaScript standard library and toolset for immutable data transformation and composition. It provides a comprehensive suite of pure utility functions designed to enable declarative data processing pipelines. The library is distinguished by its use of automatic function currying and a data-last argument order. These design patterns allow multi-argument functions to be partially applied, simplifying the construction of processing chains where data is passed through a sequence of operations. The toolkit covers broad data manipulation capabilities, including list processin
Transforms lists of key-value pairs into pivoted table formats to reorganize data.
Excelize is a library for reading and writing spreadsheet files in the Office Open XML format. It provides a comprehensive suite of tools for programmatically creating, modifying, and analyzing workbooks, worksheets, and cell data, ensuring compatibility across various office software suites through structured XML serialization. The library distinguishes itself with a built-in formula calculation engine that evaluates complex mathematical and logical expressions directly against workbook data. It also features a memory-mapped streaming architecture, which allows for the efficient processing o
Aggregates and groups large datasets into summary tables using configurable statistical functions.
Cube is a semantic data layer that provides a unified framework for defining business metrics, dimensions, and relationships across diverse data sources. By acting as a headless business intelligence engine, it transforms raw data into a governed model that can be queried via SQL, REST, and GraphQL interfaces. This architecture ensures consistent data definitions and logic across all downstream analytical applications and reporting tools. The platform distinguishes itself through its integrated conversational AI capabilities, which allow users to explore data using natural language. It orches
Combines metrics from multiple fact tables sharing common dimensions without causing row multiplication or data duplication.
Luckysheet upgraded to Univer
Summarizes and visualizes data through interactive pivot tables and chart components.
This project is an educational resource and a collection of instructional materials for performing data manipulation and statistical analysis using Python. It provides a comprehensive set of guides and code examples for using the Pandas, NumPy, and Matplotlib libraries to analyze structured data. The resource includes a dedicated guide for reshaping, cleaning, and aggregating tabular data and time series via Pandas, alongside a reference for high-performance vectorized operations and linear algebra using NumPy. It also features tutorials for creating publication-quality charts, distribution p
Generates pivot tables by aggregating data across multiple keys into a rectangular summary grid.
VisiData is a terminal-based interactive data analysis tool and browser designed for exploring, filtering, and sorting large tabular datasets. It functions as a structured data inspector that loads and flattens complex formats like JSON, XML, and PCAP into interactive sheets, as well as a terminal file manager for navigating directories and performing staged filesystem operations. The project distinguishes itself by rendering data visualizations, such as scatter plots and histograms, directly in the terminal using Unicode Braille characters. It provides a Python-based data wrangling environme
Rearranges data by grouping key columns and pivoting categorical variables into cross-tabulations.
vxe-table is a high-performance data table component and UI library for Vue, designed for building data-heavy applications. It functions as a virtualized data grid and spreadsheet UI framework capable of rendering millions of rows by mounting only the visible elements of a dataset. The project distinguishes itself through spreadsheet-like functionality, including cell selection, copy-paste support, and the generation of cross-tabulated pivot tables. It also provides specialized tools for managing complex data hierarchies using virtual trees, row grouping, and cell merging. The library covers
Summarizes data into cross-tabulated pivot tables to analyze relationships between multiple variables.
OfficeCLI ist eine Headless-Office-Suite und ein Automatisierungswerkzeug, das darauf ausgelegt ist, Microsoft Office-Dokumente programmatisch zu lesen, zu bearbeiten und zu generieren. Es fungiert als OOXML-Manipulationsbibliothek und Dokument-Templating-Engine und bietet eine eigenständige Binärdatei, die die Verwaltung von Word-, Excel- und PowerPoint-Dateien ermöglicht, ohne dass eine lokale Installation von Office-Software erforderlich ist. Das Projekt zeichnet sich dadurch aus, dass es Dokumentoperationen als Werkzeuge für KI-Agenten über einen JSON-RPC-Server und das Model Context Protocol offenlegt. Es ermöglicht fortgeschrittene Anpassungen durch rohe XML-Manipulation mittels XPath und bietet ein Serialisierungssystem, das Dokument-Subtrees in wiederholbare JSON-Batches ausgibt. Das Tool deckt ein breites Spektrum an Funktionen ab, einschließlich programmatischem Tabellenkalkulations-Engineering mit Formelauswertung und Pivot-Tabellen-Generierung sowie umfassenden Textverarbeitungsaufgaben wie Stilverwaltung, Revisionsverfolgung und mehrsprachiger Textformatierung. Es enthält zudem Utilities für Datenvisualisierung, Inhaltsextraktion in strukturiertes JSON oder High-Fidelity-HTML sowie das Zusammenführen von JSON-Daten in vordefinierte Templates für die automatisierte Berichterstellung.
Generates native pivot tables from source ranges with multi-field aggregations and custom layouts.
Davinci ist eine Business-Intelligence- und Datenvisualisierungsplattform, die für den Aufbau interaktiver Dashboards und Berichte verwendet wird. Sie fungiert als SQL-basierter Dashboard-Builder und Multi-Tenant-Analytics-Dienst, der über JDBC und CSV-Dateien mit Datenbanken verbunden wird, um Rohdaten in visuelle Komponenten zu transformieren. Die Plattform zeichnet sich durch ihr granulares Sicherheitsmodell aus, das Zeilen- und Spalten-basierte Berechtigungen umfasst, die in LDAP- und OAuth2-Authentifizierung integriert sind. Sie bietet zudem ein eingebettetes Visualisierungstool, das es ermöglicht, sichere, parametrisierte Diagramme und Dashboards über URLs und Frames in externe Anwendungen einzubinden. Das System deckt ein breites Spektrum an Funktionen ab, einschließlich Datenmodellierung mit SQL-Vorlagen, einer Drag-and-Drop-Layout-Engine für responsive Dashboards und einer Vielzahl von Visualisierungstypen wie Sankey-Diagrammen, Radar-Charts und geografischen Karten. Zudem umfasst es Automatisierungen für die Planung E-Mail-basierter Berichte und nutzt Key-Value-Caching zur Optimierung der Abfrageleistung.
Implements pivot tables that transform data through row and column swapping with color-grouped metrics.
This project is a JSON-based form rendering framework and visual creator designed for dynamic data collection. It provides a JavaScript form builder library that transforms JSON schemas into functional web forms and multi-step wizards, with a dedicated visual survey creator for designing layouts and branching logic without writing code. The library is distinguished by its bidirectional PDF integration, which allows the conversion of JSON schemas into fillable PDF documents and the extraction of structured data from existing PDFs. It also features advanced capabilities for creating scored asse
Generates interactive charts, tables, and pivot visualizations to analyze response counts and data trends.
Zombodb ist eine Datenbankerweiterung und ein relationaler Daten-Indexer, der PostgreSQL mit Elasticsearch integriert. Er bietet eine SQL-Suchschnittstelle, die es Benutzern ermöglicht, komplexe Suchanfragen und Aggregationen unter Verwendung von Standard-SQL-Funktionen und -Syntax anstelle nativer JSON-APIs auszuführen. Das Projekt synchronisiert relationale Daten von PostgreSQL mit einer Remote-Suchmaschine, um leistungsstarke Volltextsuche und Analysen zu ermöglichen. Das System zeichnet sich dadurch aus, dass es relationale Strukturen mit Suchmaschinenfunktionen verbindet, insbesondere durch die Integration der Georaumsuche für Geometrie- und Geografietypen. Es implementiert eine SQL-zu-JSON-Abfrage-Mapping-Schicht, die fortgeschrittene Textanalysen – einschließlich Fuzzy-Matching, Proximity-Suchen und Relevanz-Scoring – direkt in einer relationalen Umgebung ermöglicht. Das Projekt deckt breite Funktionsbereiche ab, einschließlich Index-Lebenszyklusmanagement, automatisierter relationaler Datensynchronisation und komplexer analytischer Aggregationen. Es unterstützt räumliche Indizierung für standortbasierte Abfragen, benutzerdefinierte Textanalyse-Pipelines und Überwachungstools zur Prüfung von Indexstatistiken und Cluster-Gesundheit. Die Sicherheit wird durch verschlüsselte Verbindungen zwischen der Datenbank und der Suchmaschine mittels TLS gewährleistet.
Transforms multi-bucket search aggregation results into relational table formats for SQL output.
Dieses Projekt ist eine JavaScript-Pivot-Table-Bibliothek und clientseitiger Datenprozessor. Es bietet eine interaktive Schnittstelle zum Umwandeln roher Datensätze in zusammenfassende Tabellen, Heatmaps und Diagramme, was eine browserbasierte Datenanalyse ohne Backend-Server ermöglicht. Die Bibliothek zeichnet sich durch eine Drag-and-Drop-Schnittstelle für dynamische Datenexploration und die Fähigkeit aus, neue Attribute durch Datums-Binning oder benutzerdefinierte Logik abzuleiten. Sie unterstützt flexibles Daten-Rendering durch Konvertierung analysierter Ergebnisse in HTML-Tabellen oder grafische Darstellungen unter Verwendung integrierter oder Drittanbieter-Charting-Bibliotheken. Das System deckt eine breite Palette analytischer Funktionen ab, einschließlich statistischer Datenaggregation, Multi-Format-Datenimport aus CSV und JSON sowie den Export von Ansichten in tabulatorgetrennte Werte. Es enthält zudem Zustandsmanagement für die Serialisierung von Layout-Konfigurationen und eine Lokalisierungsschicht für regionale Sprach- und Zahlenformatierung.
Provides a JavaScript library for creating interactive pivot tables with drag-and-drop grouping and aggregation.
Dieses Projekt ist ein Model Context Protocol-Server, der eine Schnittstelle für KI-Agenten bereitstellt, um Excel-Arbeitsmappen programmatisch zu erstellen, zu lesen und zu modifizieren. Es dient als Brücke, die es Large Language Models ermöglicht, Tabellenkalkulationsautomatisierung und Datenvisualisierung durchzuführen. Der Server ermöglicht es KI-Agenten, native Excel-Diagramme und Pivot-Tabellen aus Rohdaten zu generieren und strukturierte Informationen in visuelle Zusammenfassungen umzuwandeln. Er bietet einen Mechanismus für Remote-Tabellenkalkulationsmanagement durch eine protokollbasierte Konnektivitätsschicht. Das System deckt ein breites Spektrum an Tabellenkalkulations-Manipulationsfunktionen ab, einschließlich zellbasierter Operationen für Formeln und Datenvalidierung, visueller Formatierung von Bereichen und Layout-Modifikationen. Es handhabt zudem das Management auf Arbeitsmappenebene, wie Metadatenextraktion, Blattorganisation und die Erstellung strukturierter Tabellen.
Creates dynamic pivot tables to aggregate and summarize large datasets within Excel.
qsv is a high-performance command line toolkit for querying, transforming, and analyzing comma-separated value files. It functions as a data wrangling interface and a tabular data profiler, featuring a query engine capable of executing SQL statements and joins directly on flat files without requiring a database. The project is distinguished by its ability to process massive datasets that exceed available system memory. This is achieved through disk-based external memory processing, including multithreaded merge sorting, on-disk hash tables for deduplication, and lightweight file indexing for
Rotates data from rows to columns based on specified keys to create summary pivot tables.
Dieses Projekt ist eine interaktive, webbasierte Notebook-Umgebung für verteilte Data Science und groß angelegtes Computing. Es dient als Entwicklungstool zum Ausführen von Code und zur Durchführung von Datenanalysen speziell innerhalb des Apache Spark-Frameworks und bietet ein browserbasiertes Interface, das Codeausführung mit reaktiver Datenvisualisierung kombiniert. Die Plattform zeichnet sich durch ihre tiefe Integration in verteilte Infrastrukturen aus, die es Benutzern ermöglicht, Cluster-Ressourcen zu verwalten, Laufzeitabhängigkeiten zu konfigurieren und Ausführungsprozesse für einzelne Notebooks zu isolieren. Sie unterstützt kollaborative Workflows durch die Synchronisation von Notebook-Dateien direkt mit Versionskontrollsystemen und bietet eine reaktive Rendering-Engine, die Diagramme und Widgets automatisch als Reaktion auf Live-Datenströme und Codeausführung aktualisiert. Über ihre Kern-Ausführungsfähigkeiten hinaus enthält die Umgebung umfassende Tools für Cluster-Management, Sicherheit und Erweiterbarkeit. Sie unterstützt Benutzerauthentifizierung und Identitätswechsel für den sicheren Zugriff auf verteilte Ressourcen und bietet flexible Konfigurationsoptionen für Umgebungsvorlagen, Abhängigkeitsmanagement und Performance-Tuning. Das System verfügt zudem über eine breite Bibliothek interaktiver Visualisierungskomponenten, einschließlich Geodaten-Mapping, Netzwerkgraphen und Pivot-Tabellen, um komplexe Datenexplorationen zu erleichtern.
Summarizes and transforms datasets using an interactive pivot table interface for dynamic data aggregation.