28 dépôts
Integration layers specifically for mapping native memory to NumPy array structures.
Distinct from NumPy-Compatible Frameworks: Existing candidates are for general frameworks or array operations; this is about the native binding mechanism.
Explore 28 awesome GitHub repositories matching scientific & mathematical computing · NumPy Array Integration. Refine with filters or upvote what's useful.
pybind11 is a header-only C++ binding library that exposes C++ functions and classes as Python modules. It serves as a language bridge, mapping native types, inheritance hierarchies, and lambda functions into compatible Python objects to enable high-performance native code execution. The library includes specialized integration for NumPy arrays, utilizing buffer protocols to bind native C++ data without copying memory. It provides a toolkit for mapping C++ standard library data structures and smart pointers into the Python environment while maintaining cross-language memory management. The p
Binds native C++ data to NumPy arrays using buffer protocols to avoid memory copying.
This project is a Python wrapper for the TA-Lib C library, serving as a financial technical analysis library and quantitative trading tool. It provides a collection of mathematical functions designed to analyze market price movements, identify trading signals, and recognize candlestick patterns within financial data. The library focuses on the computation of trend, momentum, and volume metrics. It includes specialized tools for candlestick pattern recognition to detect recurring price action shapes in both historical and real-time data. The system integrates with NumPy arrays to process cont
Maps native C memory blocks directly to NumPy array structures for efficient vectorized processing.
This project is a reference collection of statistical learning algorithms built from scratch using NumPy for linear algebra and matrix operations. It serves as an educational resource for studying the mathematical foundations and inner workings of machine learning models through manual implementations. The codebase provides hand-coded implementations of both supervised and unsupervised learning. This includes classification and regression models such as support vector machines, decision trees, and Naive Bayes, as well as data clustering and pattern discovery methods like k-means and hierarchi
Writing high-performance linear algebra and matrix operations using NumPy to implement mathematical formulas and academic pseudocode.
CuPy est une bibliothèque de calcul de tableaux CUDA qui implémente une interface compatible avec NumPy pour exécuter des opérations sur tableaux et du calcul numérique sur des GPU NVIDIA. Elle sert de bibliothèque numérique accélérée par GPU et d'implémentation SciPy basée sur CUDA, déchargeant les calculs lourds sur le matériel graphique pour augmenter la vitesse de traitement pour les charges de travail scientifiques et d'ingénierie. La bibliothèque permet l'échange de tenseurs multi-framework, permettant aux tampons de données d'être partagés entre différents frameworks d'apprentissage profond en utilisant des mises en page mémoire standardisées pour éviter les copies mémoire. Elle prend également en charge l'intégration de noyaux GPU personnalisés, permettant aux données de tableaux d'être connectées à des API de bas niveau pour un contrôle précis sur l'exécution matérielle. Globalement, le projet couvre le traitement de tableaux haute performance et les flux de travail de calcul scientifique. Ses capacités incluent l'accélération des calculs de tableaux et la fourniture d'outils pour les calculs numériques à grande échelle.
Implements a NumPy-compatible array interface to allow seamless transition of computations from CPU to GPU.
Einops is a tensor manipulation library that provides a framework-agnostic interface for reshaping, Einstein summation, and multi-dimensional array operations. It serves as an abstraction layer that works across NumPy, PyTorch, TensorFlow, and JAX, allowing for tensor transformations without changing the API. The library distinguishes itself through a declarative notation system that uses readable string patterns to describe tensor rearrangements and reductions. This approach includes an extended Einstein summation interface that supports multi-letter axis names and a named dimension mapping
Enables the conversion of tensors from various deep learning frameworks into standard NumPy arrays.
pysheeet est une bibliothèque de référence technique fournissant une collection organisée d'extraits de code et de modèles d'implémentation pour le développement Python avancé, l'intégration système et le calcul haute performance. Il sert de guide complet pour implémenter la programmation réseau de bas niveau, les extensions C natives, et la programmation asynchrone et concurrente. Le projet fournit des frameworks spécialisés pour le développement et le déploiement de grands modèles de langage, y compris des outils pour l'inférence GPU distribuée et le service haute performance. Il inclut également des modèles détaillés pour l'orchestration de clusters de calcul haute performance, couvrant l'allocation des ressources GPU et la gestion des charges de travail multi-nœuds. La bibliothèque couvre une large surface de capacités, y compris la communication réseau sécurisée et la cryptographie, l'ORM et la gestion de base de données, et l'implémentation de structures de données et d'algorithmes complexes. Elle fournit également des utilitaires pour la gestion de la mémoire, l'interopérabilité native via des interfaces de fonctions étrangères (FFI) et l'intégration au niveau du système d'exploitation.
Implements integration layers for mapping native memory to NumPy array structures for zero-copy transfer.
orjson is a high-performance Python library for serializing and deserializing JSON data. It functions as both a JSON parsing library and a serialization engine, converting data between native Python objects and UTF-8 encoded bytes. The project provides specialized support for converting complex Python data structures, including dataclasses, datetime objects, and NumPy arrays and scalars, into JSON format. It also allows for the insertion of pre-serialized JSON blobs into documents to maintain processing speed. The library includes capabilities for memory-efficient deserialization through key
Converts NumPy arrays and scalars into JSON format without requiring the array library.
BertViz est un ensemble d'outils de diagnostic pour visualiser les têtes d'attention et les comportements internes des modèles afin d'interpréter comment les modèles de langage traitent le texte. Il sert d'outil d'interprétabilité et de débogueur pour les modèles de traitement du langage naturel, fournissant spécifiquement des cartes interactives des mécanismes d'attention au sein des architectures Transformer. Le projet permet l'analyse des relations entre jetons à travers des vues détaillées de têtes d'attention et de couches spécifiques. Il prend en charge la visualisation de l'attention globale à travers toutes les couches, le mappage de l'attention encodeur-décodeur et l'inspection de neurones individuels au sein des vecteurs de requête et de clé pour révéler leur contribution aux calculs d'attention. L'outil fournit des capacités pour filtrer les vues par couche, tête ou paires de phrases. Les visualisations sont rendues directement dans les environnements de notebook via l'injection HTML et JavaScript, et elles peuvent être exportées sous forme de fichiers HTML autonomes pour un partage externe.
Converts high-dimensional model tensors into JSON arrays for frontend transmission.
scikit-image is a Python image processing library and scientific image analysis toolkit. It provides a framework for digital image processing and computer vision, utilizing numerical arrays for pixel-level manipulations. The library enables the quantification of image properties and the detection of visual features, such as edges and blobs. It includes tools for image segmentation and the extraction of textures and patterns to characterize objects within visual data. Capabilities cover image manipulation through color space conversion, geometric transformations, and digital restoration. It a
Leverages NumPy multidimensional arrays to perform high-performance vectorized pixel-level image manipulations.
pyAudioAnalysis est une bibliothèque et un framework Python pour le traitement et l'analyse de signaux audio. Il fournit des outils pour extraire des représentations mathématiques du son, telles que des spectrogrammes, et implémente un système pour entraîner et évaluer des modèles de machine learning afin de classifier des segments audio basés sur des modèles acoustiques. Le projet inclut des utilitaires dédiés pour la segmentation audio, qui permettent la suppression du silence et la détection d'événements audio spécifiques pour diviser les enregistrements en sections significatives. Il fournit également des capacités de visualisation de données qui utilisent la réduction de dimensionnalité pour mapper les similarités de contenu et identifier des clusters au sein des données sonores. La bibliothèque couvre un large éventail de capacités de traitement du signal, incluant l'extraction de caractéristiques dans le domaine spectral, l'analyse temporelle et la régression audio pour estimer des valeurs continues. Ces fonctions sont accessibles à la fois en tant que bibliothèque programmable et via une interface en ligne de commande pour le traitement par lots de fichiers audio.
Leverages NumPy array structures for fast mathematical operations on multidimensional audio signal data.
PRMLT provides self-contained MATLAB implementations of every algorithm from the Pattern Recognition and Machine Learning textbook by Christopher Bishop. The code reproduces the book's exact formulas and notation, making each implementation directly traceable to the source material for educational verification and study. The implementations cover the full range of core machine learning methods from the textbook, including classification, clustering, regression, density estimation, and neural network algorithms. Each module is self-contained with heavy comments, and the code uses compact, vect
Compact, vectorized Matlab functions that execute machine learning algorithms efficiently on array data using matrix operations.
Warp is a Python framework that JIT-compiles Python functions into CUDA kernels for GPU-accelerated parallel computation, with built-in automatic differentiation and multi-framework array interoperability. At its core, it provides a GPU kernel compilation system that enables writing and executing custom GPU kernels directly from Python, while supporting automatic gradient computation through those kernels for integration with machine learning pipelines. The framework also includes tile-based cooperative computing, where thread blocks partition into tiles for shared-memory and tensor-core opera
Converts Warp arrays to and from NumPy arrays without copying data.
Anomalib is a PyTorch-based library for visual anomaly detection, offering a modular framework, a comprehensive model zoo, and a benchmarking suite designed for industrial defect detection. It provides a wide range of algorithms—including generative, discriminative, teacher-student, and vision-language approaches—that support unsupervised, few-shot, and zero-shot settings. The library enables deployment through model export to ONNX and OpenVINO for edge devices, and includes a no-code web application for training and inference. It also features a command-line interface for orchestrating multi
Anomalib provides efficient numpy-based data structures for handling image and metadata arrays in anomaly detection workflows.
Orange3 is a visual data mining platform that provides an interactive canvas for building data analysis workflows without writing code. At its core, it offers a widget-based visual programming environment where users connect configurable components to perform data preprocessing, machine learning model training, statistical evaluation, and interactive visualization. The platform is built on NumPy-backed data tables with domain descriptors that define variable names, types, and roles, and includes a lazy SQL query proxy for working with database tables without loading all data into memory. The
Stores tabular data as two-dimensional NumPy arrays for efficient vectorized operations.
GluonTS est une bibliothèque de séries temporelles probabilistes et un framework de prévision par deep learning. Il fournit une boîte à outils pour construire, entraîner et évaluer des architectures de réseau neuronal qui prédisent les valeurs futures sous forme de distributions de probabilité pour quantifier l'incertitude. Le projet se distingue en prenant en charge la prévision zero-shot et en intégrant diverses approches de modélisation, y compris les réseaux neuronaux probabilistes profonds et des wrappers pour des bibliothèques statistiques externes telles que Prophet et R forecast. Il implémente des primitives architecturales spécialisées comme les convolutions causales et les réseaux résiduels inversibles pour empêcher la fuite d'informations et mapper les représentations latentes en distributions de probabilité valides. Le framework couvre une surface d'ingénierie de données complète, y compris la mise à l'échelle des séries temporelles, les transformations bijectives et la modélisation hiérarchique. Il utilise Apache Arrow et Parquet pour la diffusion d'ensembles de données haute performance et la gestion de l'accès aléatoire. Pour l'évaluation des modèles, il inclut une suite d'évaluation pour mesurer la précision des prévisions et la couverture probabiliste en utilisant des métriques comme la perte quantile et les scores de probabilité de rang continu. La bibliothèque prend en charge le déploiement de modèles via l'intégration avec Amazon SageMaker.
Converts NumPy arrays and scalar types into JSON-serializable formats for storage and transmission.
r4ds est un cursus de science des données et une ressource pédagogique conçue pour maîtriser le langage de programmation R. Il fournit un chemin d'apprentissage structuré pour le processus de bout en bout d'importation, de nettoyage, de transformation et de visualisation des données. Le projet met l'accent sur un guide de science des données reproductible et un cursus complet pour le data wrangling. Il inclut des tutoriels spécialisés sur la grammaire des graphiques pour la visualisation de données en couches et des publications techniques créées avec Quarto qui mélangent code exécutable et prose narrative. Le matériel couvre un large éventail de capacités analytiques, incluant l'ingestion de données à partir de sources diverses, la jointure de données relationnelles et la gestion des variables catégorielles. Il aborde également le nettoyage de données, la modélisation mathématique et la génération de rapports et présentations professionnels multi-formats. Le cursus se concentre sur l'application pratique de la programmation fonctionnelle et des principes de tidy data pour créer des analyses transparentes et répétables.
Implements high-speed numerical calculations by applying operations across entire data vectors simultaneously.
Lepton est un outil spécialisé et un format de fichier conçu pour la compression sans perte et le stockage efficace des données d'image JPEG. Il fonctionne comme un compresseur sans perte et un optimiseur de stockage qui réduit la taille des fichiers sans altérer les données de pixels originales, garantissant une reconstruction parfaite au bit près des images. Le projet se concentre sur la réduction de l'espace disque et des besoins en bande passante réseau pour les archives d'images numériques. Il offre des fonctionnalités de compression et de décompression de fichiers JPEG pour maintenir un stockage d'images de haute qualité tout en minimisant l'empreinte globale des données. L'implémentation utilise diverses techniques de codage entropique et de traitement de données, notamment le codage arithmétique et de Huffman, la modélisation prédictive et le traitement par flux. Il intègre également des opérations sur tableaux optimisées pour le traitement de grands blocs de données d'image.
Leverages NumPy for fast array operations on large image data blocks.
Ce projet est une bibliothèque d'apprentissage automatique Python et une boîte à outils de science des données conçue pour construire des modèles prédictifs et analyser des jeux de données complexes. Elle fournit une collection d'implémentations pour des algorithmes supervisés et non supervisés courants utilisant le framework Scikit-Learn. La boîte à outils inclut une suite de modélisation prédictive pour générer des prédictions à partir de données historiques et un framework d'analyse statistique pour appliquer la modélisation bayésienne et les tests de causalité. Elle dispose également d'une suite de visualisation de données basée sur Matplotlib pour rendre des graphiques statiques afin d'interpréter les frontières de classificateur et les tendances des données. Le projet couvre les flux de travail de clustering de données pour identifier les modèles et les segments, l'analyse exploratoire des données et le prétraitement des données en utilisant Pandas et NumPy.
Uses NumPy vectorized operations on contiguous memory arrays to ensure high computational efficiency for mathematical operations.
Ce projet est un framework de calcul scientifique pour l'écosystème .NET, fournissant une suite complète de bibliothèques pour l'analyse numérique, les statistiques et l'optimisation mathématique. Il sert de boîte à outils fondamentale pour développer des applications en machine learning, traitement numérique du signal et vision par ordinateur. Le framework fournit des outils spécialisés pour l'entraînement et le déploiement de modèles prédictifs, incluant les réseaux de neurones, les machines à vecteurs de support (SVM) et les arbres de décision. Il se distingue par des intégrations poussées pour l'analyse visuelle en temps réel, comme le suivi d'objets et la détection de traits faciaux, ainsi qu'une bibliothèque dédiée au traitement numérique du signal pour capturer et filtrer les signaux audio et de capteurs. La surface de capacités s'étend à la décomposition de matrices de haut niveau et à l'algèbre linéaire, à la modélisation d'états probabilistes et aux algorithmes de recherche heuristique. Il couvre également un large éventail d'utilitaires de manipulation de données, de la réduction de dimensionnalité et la normalisation à l'organisation de données spatiales et aux composants de visualisation scientifique. Le système inclut des contrôleurs d'intégration matérielle pour la configuration de caméras, la gestion des ports GPIO et le matériel de détection de profondeur spécialisé.
Saves and loads multi-dimensional arrays using standard .npy and .npz NumPy formats.
PyQtGraph is a scientific plotting and graphics framework built for PyQt and PySide applications, providing fast, interactive 2D and 3D visualizations with GPU-accelerated rendering. It serves as both a real-time signal monitoring system for streaming time-series data and a toolkit for constructing interactive data dashboards with dockable panels, parameter trees, and custom widgets. The library also includes a node-based visual flowchart tool for building data processing pipelines and a scientific graphics export system that saves plots as PNG, SVG, or CSV and converts items to Matplotlib for
Performs numerical operations and data transformations directly on NumPy arrays for accelerated computation.