15 repositorios
Tools for aggregating and grouping datasets into summary tables.
Distinct from Table Data Processing: Distinct from Table Data Processing: focuses on pivot-specific aggregation logic rather than general row-level table operations.
Explore 15 awesome GitHub repositories matching data & databases · Pivot Table Aggregators. Refine with filters or upvote what's useful.
Ramda is a functional JavaScript standard library and toolset for immutable data transformation and composition. It provides a comprehensive suite of pure utility functions designed to enable declarative data processing pipelines. The library is distinguished by its use of automatic function currying and a data-last argument order. These design patterns allow multi-argument functions to be partially applied, simplifying the construction of processing chains where data is passed through a sequence of operations. The toolkit covers broad data manipulation capabilities, including list processin
Transforms lists of key-value pairs into pivoted table formats to reorganize data.
Excelize is a library for reading and writing spreadsheet files in the Office Open XML format. It provides a comprehensive suite of tools for programmatically creating, modifying, and analyzing workbooks, worksheets, and cell data, ensuring compatibility across various office software suites through structured XML serialization. The library distinguishes itself with a built-in formula calculation engine that evaluates complex mathematical and logical expressions directly against workbook data. It also features a memory-mapped streaming architecture, which allows for the efficient processing o
Aggregates and groups large datasets into summary tables using configurable statistical functions.
Cube is a semantic data layer that provides a unified framework for defining business metrics, dimensions, and relationships across diverse data sources. By acting as a headless business intelligence engine, it transforms raw data into a governed model that can be queried via SQL, REST, and GraphQL interfaces. This architecture ensures consistent data definitions and logic across all downstream analytical applications and reporting tools. The platform distinguishes itself through its integrated conversational AI capabilities, which allow users to explore data using natural language. It orches
Combines metrics from multiple fact tables sharing common dimensions without causing row multiplication or data duplication.
Luckysheet upgraded to Univer
Summarizes and visualizes data through interactive pivot tables and chart components.
This project is an educational resource and a collection of instructional materials for performing data manipulation and statistical analysis using Python. It provides a comprehensive set of guides and code examples for using the Pandas, NumPy, and Matplotlib libraries to analyze structured data. The resource includes a dedicated guide for reshaping, cleaning, and aggregating tabular data and time series via Pandas, alongside a reference for high-performance vectorized operations and linear algebra using NumPy. It also features tutorials for creating publication-quality charts, distribution p
Generates pivot tables by aggregating data across multiple keys into a rectangular summary grid.
VisiData is a terminal-based interactive data analysis tool and browser designed for exploring, filtering, and sorting large tabular datasets. It functions as a structured data inspector that loads and flattens complex formats like JSON, XML, and PCAP into interactive sheets, as well as a terminal file manager for navigating directories and performing staged filesystem operations. The project distinguishes itself by rendering data visualizations, such as scatter plots and histograms, directly in the terminal using Unicode Braille characters. It provides a Python-based data wrangling environme
Rearranges data by grouping key columns and pivoting categorical variables into cross-tabulations.
vxe-table is a high-performance data table component and UI library for Vue, designed for building data-heavy applications. It functions as a virtualized data grid and spreadsheet UI framework capable of rendering millions of rows by mounting only the visible elements of a dataset. The project distinguishes itself through spreadsheet-like functionality, including cell selection, copy-paste support, and the generation of cross-tabulated pivot tables. It also provides specialized tools for managing complex data hierarchies using virtual trees, row grouping, and cell merging. The library covers
Summarizes data into cross-tabulated pivot tables to analyze relationships between multiple variables.
OfficeCLI es una suite de oficina headless y herramienta de automatización diseñada para leer, editar y generar documentos de Microsoft Office de forma programática. Funciona como una biblioteca de manipulación OOXML y un motor de plantillas de documentos, proporcionando un binario independiente que permite la gestión de archivos de Word, Excel y PowerPoint sin requerir una instalación local de software de oficina. El proyecto se distingue por exponer las operaciones de documentos como herramientas para agentes de IA a través de un servidor JSON-RPC y el Protocolo de Contexto de Modelo (Model Context Protocol). Permite una personalización avanzada mediante la manipulación de XML sin procesar utilizando XPath y proporciona un sistema de serialización que vuelca subárboles de documentos en lotes JSON reproducibles. La herramienta cubre una amplia gama de capacidades, incluyendo ingeniería de hojas de cálculo programática con evaluación de fórmulas y generación de tablas dinámicas, así como tareas integrales de procesamiento de textos como gestión de estilos, seguimiento de revisiones y formato de texto multilingüe. También incluye utilidades para la visualización de datos, extracción de contenido en JSON estructurado o HTML de alta fidelidad, y la fusión de datos JSON en plantillas predefinidas para la generación automatizada de informes.
Generates native pivot tables from source ranges with multi-field aggregations and custom layouts.
Davinci es una plataforma de inteligencia de negocios y visualización de datos utilizada para construir dashboards e informes interactivos. Funciona como un constructor de dashboards basado en SQL y un servicio de analítica multi-tenant que se conecta a bases de datos mediante JDBC y archivos CSV para transformar datos crudos en componentes visuales. La plataforma se distingue por su modelo de seguridad granular, que incluye permisos a nivel de fila y columna integrados con autenticación LDAP y OAuth2. También proporciona una herramienta de visualización embebida que permite insertar gráficos y dashboards parametrizados y seguros en aplicaciones externas mediante URLs y frames. El sistema cubre una amplia gama de capacidades, incluyendo modelado de datos con plantillas SQL, un motor de diseño drag-and-drop para dashboards responsivos y una amplia variedad de tipos de visualización como diagramas de Sankey, gráficos de radar y mapas geográficos. Incluye además automatización para programar informes por correo electrónico y utiliza caché de clave-valor para optimizar el rendimiento de las consultas.
Implements pivot tables that transform data through row and column swapping with color-grouped metrics.
Este proyecto es un framework de renderizado de formularios basado en JSON y un creador visual diseñado para la recolección dinámica de datos. Proporciona una biblioteca de construcción de formularios en JavaScript que transforma esquemas JSON en formularios web funcionales y asistentes de varios pasos, con un creador de encuestas visual dedicado para diseñar diseños y lógica de ramificación sin escribir código. La biblioteca destaca por su integración bidireccional con PDF, que permite la conversión de esquemas JSON en documentos PDF rellenables y la extracción de datos estructurados de archivos PDF existentes. También cuenta con capacidades avanzadas para crear evaluaciones puntuadas y calculadoras que procesan entradas numéricas para proporcionar resultados ponderados en tiempo real. El sistema cubre una amplia superficie de capacidades, incluyendo ramificación condicional y validación de entrada de varias etapas, localización en varios idiomas y renderizado agnóstico al framework para React, Angular y Vue.js. Además, incluye herramientas para la visualización de datos de respuesta, tematización basada en variables CSS y cumplimiento de accesibilidad WCAG.
Generates interactive charts, tables, and pivot visualizations to analyze response counts and data trends.
Zombodb es una extensión de base de datos e indexador de datos relacionales que integra PostgreSQL con Elasticsearch. Proporciona una interfaz de búsqueda SQL, permitiendo a los usuarios ejecutar consultas de búsqueda complejas y agregaciones utilizando funciones y sintaxis SQL estándar en lugar de APIs JSON nativas. El proyecto sincroniza datos relacionales de PostgreSQL a un motor de búsqueda remoto para habilitar la búsqueda de texto completo y analítica de alto rendimiento. El sistema se distingue por tender un puente entre estructuras relacionales y capacidades de motores de búsqueda, específicamente mediante la integración de búsqueda geoespacial para tipos de geometría y geografía. Implementa una capa de mapeo de consultas SQL-a-JSON que permite un análisis de texto avanzado —incluyendo coincidencia difusa, búsquedas de proximidad y puntuación de relevancia— directamente dentro de un entorno relacional. El proyecto cubre áreas de capacidad amplias, incluyendo la gestión del ciclo de vida de índices, sincronización automatizada de datos relacionales y agregaciones analíticas complejas. Soporta indexación espacial para consultas basadas en ubicación, tuberías de análisis de texto personalizadas y herramientas de monitoreo para auditar estadísticas de índices y salud del clúster. La seguridad se maneja mediante conexiones cifradas entre la base de datos y el motor de búsqueda usando TLS.
Transforms multi-bucket search aggregation results into relational table formats for SQL output.
Este proyecto es una biblioteca de tablas dinámicas (pivot tables) de JavaScript y un procesador de datos del lado del cliente. Proporciona una interfaz interactiva para transformar conjuntos de datos crudos en tablas resumidas, mapas de calor y gráficos, permitiendo el análisis de datos basado en navegador sin un servidor backend. La biblioteca se distingue por una interfaz de arrastrar y soltar para la exploración dinámica de datos y la capacidad de derivar nuevos atributos mediante la agrupación de fechas o lógica personalizada. Admite una representación de datos flexible convirtiendo los resultados analizados en tablas HTML o representaciones gráficas utilizando bibliotecas de gráficos integradas o de terceros. El sistema cubre una amplia gama de capacidades analíticas, incluyendo la agregación estadística de datos, la importación de datos multiformato desde CSV y JSON, y la exportación de vistas a valores separados por tabulaciones. También incluye gestión de estado para serializar configuraciones de diseño y una capa de localización para el formato regional de idiomas y números.
Provides a JavaScript library for creating interactive pivot tables with drag-and-drop grouping and aggregation.
This project is a Model Context Protocol server that provides an interface for AI agents to programmatically create, read, and modify Excel workbooks. It serves as a bridge that enables large language models to perform spreadsheet automation and data visualization. The server allows AI agents to generate native Excel charts and pivot tables from raw data, transforming structured information into visual summaries. It provides a mechanism for remote spreadsheet management through a protocol-based connectivity layer. The system covers a broad range of spreadsheet manipulation capabilities, incl
Creates dynamic pivot tables to aggregate and summarize large datasets within Excel.
qsv is a high-performance command line toolkit for querying, transforming, and analyzing comma-separated value files. It functions as a data wrangling interface and a tabular data profiler, featuring a query engine capable of executing SQL statements and joins directly on flat files without requiring a database. The project is distinguished by its ability to process massive datasets that exceed available system memory. This is achieved through disk-based external memory processing, including multithreaded merge sorting, on-disk hash tables for deduplication, and lightweight file indexing for
Rotates data from rows to columns based on specified keys to create summary pivot tables.
Este proyecto es un entorno de notebook interactivo basado en la web diseñado para la ciencia de datos distribuida y la computación a gran escala. Sirve como una herramienta de desarrollo para ejecutar código y realizar análisis de datos específicamente dentro del framework Apache Spark, proporcionando una interfaz basada en navegador que combina la ejecución de código con la visualización de datos reactiva. La plataforma se distingue por su profunda integración con la infraestructura distribuida, permitiendo a los usuarios gestionar recursos de cluster, configurar dependencias de tiempo de ejecución y aislar procesos de ejecución para notebooks individuales. Admite flujos de trabajo colaborativos sincronizando archivos de notebook directamente con sistemas de control de versiones y proporciona un motor de renderizado reactivo que actualiza automáticamente gráficos y widgets en respuesta a flujos de datos en vivo y ejecución de código. Más allá de sus capacidades de ejecución central, el entorno incluye herramientas integrales para la gestión de clusters, seguridad y extensibilidad. Admite la autenticación y suplantación de usuarios para un acceso seguro a recursos distribuidos, mientras ofrece opciones de configuración flexibles para plantillas de entorno, gestión de dependencias y ajuste de rendimiento. El sistema también cuenta con una amplia biblioteca de componentes de visualización interactivos, incluyendo mapeo geoespacial, grafos de red y tablas dinámicas, para facilitar la exploración compleja de datos.
Summarizes and transforms datasets using an interactive pivot table interface for dynamic data aggregation.