12 مستودعات
Analytical processing of large datasets using complex aggregations and vectorized execution for high-speed response.
Distinct from Multi-Dataset Analysis: The candidates provided were either for 3D visualization or scientific arrays; this is about OLAP-style multi-dimensional SQL analysis.
Explore 12 awesome GitHub repositories matching data & databases · Multi-Dimensional Analysis. Refine with filters or upvote what's useful.
StarRocks is a distributed SQL OLAP database engine designed for real-time analytics and high-performance multi-dimensional analysis. It functions as a data lakehouse query engine that enables SQL execution across large datasets and external open table formats without requiring local data imports. The system employs a shared-nothing distributed architecture and utilizes the MySQL protocol to integrate with business intelligence tools. It maintains real-time data consistency through a primary key upsert model and accelerates query response times using vectorized execution and cost-based optimi
Performs complex aggregations and ad-hoc queries across large datasets using vectorized processing.
Boost is a collection of portable, high-performance source libraries that extend the C++ standard library. It provides a wide range of reusable components, data structures, and algorithms designed to add capabilities to the base language across different platforms. The project is distinguished by its extensive focus on compile-time template metaprogramming and generic programming. It implements advanced architectural patterns such as policy-based design, concept-based type validation, and the use of SFINAE for conditional template resolution to minimize runtime overhead. The library covers a
Analyzes complex data distributions across multiple axes using multi-dimensional histograms.
dc.js is a multi-dimensional analysis tool and visualization framework used to build interactive data dashboards. It functions as a charting library that renders diverse SVG visualizations powered by D3 and integrates natively with Crossfilter to enable coordinated filtering across large datasets. The project is distinguished by its linked-view coordination, where selecting a data range or category in one chart simultaneously updates all other connected views. This allows for dynamic data exploration through dimensional chart linking and coordinated brushing, transforming raw datasets into na
Connects SVG or Canvas visualizations to multi-dimensional data stores for coordinated filtering and analysis.
GrowthBook is a feature flagging and experimentation platform that utilizes a warehouse-native approach to data analysis. It serves as a system for managing feature rollouts and conducting A/B tests by executing SQL queries directly against existing data warehouses to calculate experiment results. The platform is distinguished by its integration of a Model Context Protocol server, which allows AI coding assistants and IDEs to manage flags and query analytics using natural language. It also provides specialized capabilities for AI model optimization, enabling the testing of prompts and models
Breaks down experiment performance across user attributes like geography or platform using multi-dimensional analysis.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Performs multi-dimensional analysis including slice, dice, and drill-down operations on large datasets.
Prometheus client_golang is the official Go client library for instrumenting applications with Prometheus metrics. It provides a metric registry that manages and exposes custom application metrics like counters, gauges, histograms, and summaries in Prometheus format for HTTP scraping by a Prometheus server. The library also includes a remote read client that sends PromQL queries to a Prometheus server over HTTP and retrieves time series data programmatically. The library supports creating separate registries to isolate metric namespaces and control which metrics are exposed per scrape endpoin
Enables multi-dimensional time series through dynamic label-value pairs on metric families.
هذا المشروع عبارة عن مكتبة تعلم آلي توفر مجموعة من التنفيذات لخوارزميات التعلم الخاضع للإشراف وغير الخاضع للإشراف. يعمل كإطار عمل للتعلم العميق، ومجموعة مصنفات إحصائية، ومجموعة أدوات للتعلم غير الخاضع للإشراف وتقليل الأبعاد. تمكّن المكتبة من بناء الشبكات العصبية، بما في ذلك الإدراكات متعددة الطبقات والشبكات التلافيفية للتعرف على الأنماط. كما توفر أدوات لإجراء تحليل المكونات الرئيسية وتعلم المتشعبات (manifold learning) لتصور مجموعات البيانات عالية الأبعاد، إلى جانب مجموعة من خوارزميات التجميع التي تجمع البيانات غير المصنفة من خلال التقسيم التكراري. يغطي المشروع مجموعة واسعة من إمكانيات النمذجة التنبؤية، بما في ذلك مهام التصنيف والانحدار باستخدام أشجار القرار، وأقرب الجيران (k-nearest neighbors)، ومصنفات Bayes، وآلات ناقل الدعم (support vector machines)، وانحدار Ridge. كما يتضمن أدوات لسير عمل تصنيف الصور وتحليل البيانات غير المصنفة.
Implements manifold learning to visualize complex, high-dimensional datasets in lower dimensions.
Lucid هي مجموعة أدوات قابلية التفسير (interpretability) لـ TensorFlow ومكتبة تصور مصممة لتحليل التمثيلات الداخلية للشبكات العصبية. تعمل كإطار عمل تحسين قائم على التدرج يولد صوراً وأطالس للكشف عن الميزات التي تعلمتها عصبونات وطبقات معينة. تمكن المكتبة من إنشاء أطالس التنشيط وربط تنشيطات الشبكة عالية الأبعاد في مساحات منخفضة الأبعاد لدراسة سلوك النموذج. تستخدم معلمات الصور القابلة للاشتقاق لتحسين المدخلات المرئية التي تنشط مكونات الشبكة إلى أقصى حد. يغطي النظام مجموعة واسعة من البنية التحتية لقابلية التفسير، بما في ذلك تعيين توزيع التنشيط وأبحاث تصور الميزات. كما يتضمن أدوات لاستيراد النماذج المدربة مسبقاً وحفظ أوزان الشبكة للتحليل المستمر.
Maps high-dimensional activations into lower-dimensional spaces to visualize the distribution of internal representations.
Yellowbrick هي مكتبة لتصور تعلم الآلة وأداة تشخيص للنماذج مصممة لتحليل أهمية الميزات، وتوزيعات الأهداف، ومقاييس خطأ النموذج. تعمل كمجموعة أدوات مرئية لتشخيص نقص الملاءمة (underfitting) والإفراط في الملاءمة (overfitting) من خلال استخدام منحنيات التحقق والتعلم. يوفر المشروع مجموعات متخصصة لتقييم النماذج التنبؤية والتعلم غير الخاضع للإشراف. يتيح تحديد أعداد العناقيد المثلى عبر طرق الكوع (elbow methods) ومعاملات الصورة الظلية (silhouette coefficients)، وتقييم جودة المصنفات والمنحدرات من خلال منحنيات ROC، ومصفوفات الارتباك، ومخططات البواقي. تغطي المكتبة العديد من مجالات الإمكانيات عالية المستوى، بما في ذلك تحليل هندسة الميزات لتحديد المتغيرات التنبؤية، وضبط المعلمات الفائقة (hyperparameters) لتعديل تعقيد النموذج، وتشخيص خطأ الانحدار لتحديد نقاط البيانات المؤثرة. كما تتضمن أدوات لإسقاط تعلم المتشعبات (manifold learning) لتصور البيانات عالية الأبعاد ومتون النصوص. تتكامل الأداة مع واجهة برمجة تطبيقات Scikit-Learn لاستهلاك طرق الملاءمة والتنبؤ القياسية.
Implements non-linear dimensionality reduction like t-SNE and UMAP to visualize high-dimensional data in 2D or 3D.
This is a Prometheus Python client library used for instrumenting Python applications. It provides the tools necessary to record counters, gauges, and histograms within a process to monitor application health and expose that data as a Prometheus exposition format provider. The library enables cloud native observability by allowing developers to define custom telemetry and track internal application events. It transforms internal application data into a standardized text format required by Prometheus scrapers for collection. The project covers a variety of monitoring and observability capabil
Supports multi-dimensional time series by organizing metrics using label-value pairs for flexible filtering.
Stumpy هي مكتبة Python لتحليل السلاسل الزمنية القابلة للتوسع تركز على تنفيذ خوارزميات ملف تعريف المصفوفة (matrix profile). توفر إطار عمل لحساب ملفات تعريف المسافة لتحديد الأنماط المتكررة والشذوذ داخل بيانات السلاسل الزمنية. يتميز المشروع بقدرته على توسيع نطاق الحسابات الثقيلة عبر أجهزة GPU والمجموعات الموزعة باستخدام Dask. ويدعم التحليل متعدد الأبعاد لاكتشاف الزخارف عبر تدفقات البيانات المتزامنة ويوفر حساباً تزايدياً لتحليل التدفق في الوقت الفعلي. تغطي المكتبة مجموعة واسعة من تقنيات تعدين السلاسل الزمنية، بما في ذلك اكتشاف الزخارف، واكتشاف الشذوذ، ومطابقة أنماط التسلسل. كما توفر أدوات للتجزئة الدلالية لاكتشاف تغيرات النظام واستخراج سلاسل مرتبة زمنياً من أنماط التسلسل الفرعي المتشابهة.
Computes dimensionality and bit-size for compressing multi-dimensional subsequences using minimum description length.
POT is an optimal transport library providing a collection of solvers for computing Wasserstein, Gromov-Wasserstein, and Fused Gromov-Wasserstein distances between probability distributions. It functions as a differentiable tensor framework that integrates with various tensor libraries to enable automatic differentiation and GPU acceleration. The project is distinguished by its ability to align data distributions across different metric spaces by comparing internal relational structures rather than coordinates. It implements mathematical optimization algorithms as differentiable layers, allow
Analyzes complex high-dimensional probability distributions using slicing and projection techniques to reduce complexity.