Why is starrocks/starrocks a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Performs complex aggregations and ad-hoc queries across large datasets using vectorized processing.

Why is boostorg/boost a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Analyzes complex data distributions across multiple axes using multi-dimensional histograms.

Why is dc-js/dc.js a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Connects SVG or Canvas visualizations to multi-dimensional data stores for coordinated filtering and analysis.

Why is growthbook/growthbook a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Breaks down experiment performance across user attributes like geography or platform using multi-dimensional analysis.

Why is apache/pinot a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Performs multi-dimensional analysis including slice, dice, and drill-down operations on large datasets.

Why is prometheus/client_golang a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Enables multi-dimensional time series through dynamic label-value pairs on metric families.

Why is wepe/machinelearning a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Implements manifold learning to visualize complex, high-dimensional datasets in lower dimensions.

Why is tensorflow/lucid a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Maps high-dimensional activations into lower-dimensional spaces to visualize the distribution of internal representations.

Why is districtdatalabs/yellowbrick a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Implements non-linear dimensionality reduction like t-SNE and UMAP to visualize high-dimensional data in 2D or 3D.

Why is prometheus/client_python a recommended Multi-Dimensional Analysis GitHub Repositories repository?

Supports multi-dimensional time series by organizing metrics using label-value pairs for flexible filtering.

12 مستودعات

Awesome GitHub RepositoriesMulti-Dimensional Analysis

Analytical processing of large datasets using complex aggregations and vectorized execution for high-speed response.

Distinct from Multi-Dataset Analysis: The candidates provided were either for 3D visualization or scientific arrays; this is about OLAP-style multi-dimensional SQL analysis.

Explore 12 awesome GitHub repositories matching data & databases · Multi-Dimensional Analysis. Refine with filters or upvote what's useful.

اعثر على أفضل المستودعات باستخدام الذكاء الاصطناعي.سنبحث عن أفضل المستودعات المطابقة باستخدام الذكاء الاصطناعي.

starrocks/starrocks
StarRocks/starrocks
11,789عرض على GitHub
StarRocks is a distributed SQL OLAP database engine designed for real-time analytics and high-performance multi-dimensional analysis. It functions as a data lakehouse query engine that enables SQL execution across large datasets and external open table formats without requiring local data imports. The system employs a shared-nothing distributed architecture and utilizes the MySQL protocol to integrate with business intelligence tools. It maintains real-time data consistency through a primary key upsert model and accelerates query response times using vectorized execution and cost-based optimi
Performs complex aggregations and ad-hoc queries across large datasets using vectorized processing.
Javaanalyticsbig-datacloudnative
عرض على GitHub11,789
boostorg/boost
boostorg/boost
8,493عرض على GitHub
Boost is a collection of portable, high-performance source libraries that extend the C++ standard library. It provides a wide range of reusable components, data structures, and algorithms designed to add capabilities to the base language across different platforms. The project is distinguished by its extensive focus on compile-time template metaprogramming and generic programming. It implements advanced architectural patterns such as policy-based design, concept-based type validation, and the use of SFINAE for conditional template resolution to minimize runtime overhead. The library covers a
Analyzes complex data distributions across multiple axes using multi-dimensional histograms.
HTML
عرض على GitHub8,493
dc-js/dc.js
dc-js/dc.js
7,431عرض على GitHub
dc.js is a multi-dimensional analysis tool and visualization framework used to build interactive data dashboards. It functions as a charting library that renders diverse SVG visualizations powered by D3 and integrates natively with Crossfilter to enable coordinated filtering across large datasets. The project is distinguished by its linked-view coordination, where selecting a data range or category in one chart simultaneously updates all other connected views. This allows for dynamic data exploration through dimensional chart linking and coordinated brushing, transforming raw datasets into na
Connects SVG or Canvas visualizations to multi-dimensional data stores for coordinated filtering and analysis.
JavaScript
عرض على GitHub7,431
growthbook/growthbook
growthbook/growthbook
7,351عرض على GitHub
GrowthBook is a feature flagging and experimentation platform that utilizes a warehouse-native approach to data analysis. It serves as a system for managing feature rollouts and conducting A/B tests by executing SQL queries directly against existing data warehouses to calculate experiment results. The platform is distinguished by its integration of a Model Context Protocol server, which allows AI coding assistants and IDEs to manage flags and query analytics using natural language. It also provides specialized capabilities for AI model optimization, enabling the testing of prompts and models
Breaks down experiment performance across user attributes like geography or platform using multi-dimensional analysis.
TypeScriptab-testingabtestabtesting
عرض على GitHub7,351
apache/pinot
apache/pinot
6,098عرض على GitHub
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Performs multi-dimensional analysis including slice, dice, and drill-down operations on large datasets.
Java
عرض على GitHub6,098
prometheus/client_golang
prometheus/client_golang
5,999عرض على GitHub
Prometheus client_golang is the official Go client library for instrumenting applications with Prometheus metrics. It provides a metric registry that manages and exposes custom application metrics like counters, gauges, histograms, and summaries in Prometheus format for HTTP scraping by a Prometheus server. The library also includes a remote read client that sends PromQL queries to a Prometheus server over HTTP and retrieves time series data programmatically. The library supports creating separate registries to isolate metric namespaces and control which metrics are exposed per scrape endpoin
Enables multi-dimensional time series through dynamic label-value pairs on metric families.
Go
عرض على GitHub5,999
wepe/machinelearning
wepe/MachineLearning
5,714عرض على GitHub
هذا المشروع عبارة عن مكتبة تعلم آلي توفر مجموعة من التنفيذات لخوارزميات التعلم الخاضع للإشراف وغير الخاضع للإشراف. يعمل كإطار عمل للتعلم العميق، ومجموعة مصنفات إحصائية، ومجموعة أدوات للتعلم غير الخاضع للإشراف وتقليل الأبعاد. تمكّن المكتبة من بناء الشبكات العصبية، بما في ذلك الإدراكات متعددة الطبقات والشبكات التلافيفية للتعرف على الأنماط. كما توفر أدوات لإجراء تحليل المكونات الرئيسية وتعلم المتشعبات (manifold learning) لتصور مجموعات البيانات عالية الأبعاد، إلى جانب مجموعة من خوارزميات التجميع التي تجمع البيانات غير المصنفة من خلال التقسيم التكراري. يغطي المشروع مجموعة واسعة من إمكانيات النمذجة التنبؤية، بما في ذلك مهام التصنيف والانحدار باستخدام أشجار القرار، وأقرب الجيران (k-nearest neighbors)، ومصنفات Bayes، وآلات ناقل الدعم (support vector machines)، وانحدار Ridge. كما يتضمن أدوات لسير عمل تصنيف الصور وتحليل البيانات غير المصنفة.
Implements manifold learning to visualize complex, high-dimensional datasets in lower dimensions.
Python
عرض على GitHub5,714
tensorflow/lucid
tensorflow/lucid
4,707عرض على GitHub
Lucid هي مجموعة أدوات قابلية التفسير (interpretability) لـ TensorFlow ومكتبة تصور مصممة لتحليل التمثيلات الداخلية للشبكات العصبية. تعمل كإطار عمل تحسين قائم على التدرج يولد صوراً وأطالس للكشف عن الميزات التي تعلمتها عصبونات وطبقات معينة. تمكن المكتبة من إنشاء أطالس التنشيط وربط تنشيطات الشبكة عالية الأبعاد في مساحات منخفضة الأبعاد لدراسة سلوك النموذج. تستخدم معلمات الصور القابلة للاشتقاق لتحسين المدخلات المرئية التي تنشط مكونات الشبكة إلى أقصى حد. يغطي النظام مجموعة واسعة من البنية التحتية لقابلية التفسير، بما في ذلك تعيين توزيع التنشيط وأبحاث تصور الميزات. كما يتضمن أدوات لاستيراد النماذج المدربة مسبقاً وحفظ أوزان الشبكة للتحليل المستمر.
Maps high-dimensional activations into lower-dimensional spaces to visualize the distribution of internal representations.
Jupyter Notebook
عرض على GitHub4,707
districtdatalabs/yellowbrick
DistrictDataLabs/yellowbrick
4,398عرض على GitHub
Yellowbrick هي مكتبة لتصور تعلم الآلة وأداة تشخيص للنماذج مصممة لتحليل أهمية الميزات، وتوزيعات الأهداف، ومقاييس خطأ النموذج. تعمل كمجموعة أدوات مرئية لتشخيص نقص الملاءمة (underfitting) والإفراط في الملاءمة (overfitting) من خلال استخدام منحنيات التحقق والتعلم. يوفر المشروع مجموعات متخصصة لتقييم النماذج التنبؤية والتعلم غير الخاضع للإشراف. يتيح تحديد أعداد العناقيد المثلى عبر طرق الكوع (elbow methods) ومعاملات الصورة الظلية (silhouette coefficients)، وتقييم جودة المصنفات والمنحدرات من خلال منحنيات ROC، ومصفوفات الارتباك، ومخططات البواقي. تغطي المكتبة العديد من مجالات الإمكانيات عالية المستوى، بما في ذلك تحليل هندسة الميزات لتحديد المتغيرات التنبؤية، وضبط المعلمات الفائقة (hyperparameters) لتعديل تعقيد النموذج، وتشخيص خطأ الانحدار لتحديد نقاط البيانات المؤثرة. كما تتضمن أدوات لإسقاط تعلم المتشعبات (manifold learning) لتصور البيانات عالية الأبعاد ومتون النصوص. تتكامل الأداة مع واجهة برمجة تطبيقات Scikit-Learn لاستهلاك طرق الملاءمة والتنبؤ القياسية.
Implements non-linear dimensionality reduction like t-SNE and UMAP to visualize high-dimensional data in 2D or 3D.
Python
عرض على GitHub4,398
prometheus/client_python
prometheus/client_python
4,333عرض على GitHub
This is a Prometheus Python client library used for instrumenting Python applications. It provides the tools necessary to record counters, gauges, and histograms within a process to monitor application health and expose that data as a Prometheus exposition format provider. The library enables cloud native observability by allowing developers to define custom telemetry and track internal application events. It transforms internal application data into a standardized text format required by Prometheus scrapers for collection. The project covers a variety of monitoring and observability capabil
Supports multi-dimensional time series by organizing metrics using label-value pairs for flexible filtering.
Pythoninstrumentationmetricsprometheus
عرض على GitHub4,333
stumpy-dev/stumpy
stumpy-dev/stumpy
4,105عرض على GitHub
Stumpy هي مكتبة Python لتحليل السلاسل الزمنية القابلة للتوسع تركز على تنفيذ خوارزميات ملف تعريف المصفوفة (matrix profile). توفر إطار عمل لحساب ملفات تعريف المسافة لتحديد الأنماط المتكررة والشذوذ داخل بيانات السلاسل الزمنية. يتميز المشروع بقدرته على توسيع نطاق الحسابات الثقيلة عبر أجهزة GPU والمجموعات الموزعة باستخدام Dask. ويدعم التحليل متعدد الأبعاد لاكتشاف الزخارف عبر تدفقات البيانات المتزامنة ويوفر حساباً تزايدياً لتحليل التدفق في الوقت الفعلي. تغطي المكتبة مجموعة واسعة من تقنيات تعدين السلاسل الزمنية، بما في ذلك اكتشاف الزخارف، واكتشاف الشذوذ، ومطابقة أنماط التسلسل. كما توفر أدوات للتجزئة الدلالية لاكتشاف تغيرات النظام واستخراج سلاسل مرتبة زمنياً من أنماط التسلسل الفرعي المتشابهة.
Computes dimensionality and bit-size for compressing multi-dimensional subsequences using minimum description length.
Pythonanomaly-detectiondaskdata-science
عرض على GitHub4,105
pythonot/pot
PythonOT/POT
2,751عرض على GitHub
POT is an optimal transport library providing a collection of solvers for computing Wasserstein, Gromov-Wasserstein, and Fused Gromov-Wasserstein distances between probability distributions. It functions as a differentiable tensor framework that integrates with various tensor libraries to enable automatic differentiation and GPU acceleration. The project is distinguished by its ability to align data distributions across different metric spaces by comparing internal relational structures rather than coordinates. It implements mathematical optimization algorithms as differentiable layers, allow
Analyzes complex high-dimensional probability distributions using slicing and projection techniques to reduce complexity.
Pythondomain-adaptationemdgromov-wasserstein
عرض على GitHub2,751

Awesome Multi-Dimensional Analysis GitHub Repositories

StarRocks/starrocks

boostorg/boost

dc-js/dc.js

growthbook/growthbook

apache/pinot

prometheus/client_golang

wepe/MachineLearning

tensorflow/lucid

DistrictDataLabs/yellowbrick

prometheus/client_python

stumpy-dev/stumpy

PythonOT/POT

استكشف الوسوم الفرعية