Why is the-pocket/pocketflow-tutorial-codebase-knowledge a recommended Element-wise Array Operations GitHub Repositories repository?

Provides high-performance element-wise array operations leveraging compiled code for numerical efficiency.

Why is lyhue1991/eat_tensorflow2_in_30_days a recommended Element-wise Array Operations GitHub Repositories repository?

Executes mathematical and logical operations independently across every element of a tensor.

Why is xlite-dev/leetcuda a recommended Element-wise Array Operations GitHub Repositories repository?

Performs element-wise addition across float32 and float16 arrays using vectorized memory access.

Why is torch/torch7 a recommended Element-wise Array Operations GitHub Repositories repository?

Executes custom functions on every individual element of a tensor to update its values.

Why is hybridgroup/gocv a recommended Element-wise Array Operations GitHub Repositories repository?

Performs high-performance mathematical operations across multi-dimensional image arrays.

Why is louthy/language-ext a recommended Element-wise Array Operations GitHub Repositories repository?

Allows applying transformation functions across every element of an immutable array to produce a new result array.

Why is nvidia/warp a recommended Element-wise Array Operations GitHub Repositories repository?

Applies element-wise arithmetic operations between tiles or between a tile and a constant within GPU kernels.

Why is apache/pinot a recommended Element-wise Array Operations GitHub Repositories repository?

Calculates the element-wise sum of multiple double arrays across grouped records, padding shorter arrays with zeros.

Why is mrdbourke/zero-to-mastery-ml a recommended Element-wise Array Operations GitHub Repositories repository?

Provides high-performance operations that apply mathematical functions across every element of multi-dimensional arrays.

Why is carp-lang/carp a recommended Element-wise Array Operations GitHub Repositories repository?

Provides a function to sum all elements of a static array.

21 repositorios

Awesome GitHub RepositoriesElement-wise Array Operations

High-performance operations that apply functions across every element of a multi-dimensional array.

Distinct from Element-wise Comparisons: None of the candidates cover general compiled element-wise mapping across multi-dimensional arrays; they focus on comparisons or removal.

Explore 21 awesome GitHub repositories matching scientific & mathematical computing · Element-wise Array Operations. Refine with filters or upvote what's useful.

Encuentra los mejores repositorios con IA.Buscaremos los repositorios que mejor coincidan usando IA.

the-pocket/pocketflow-tutorial-codebase-knowledge
The-Pocket/PocketFlow-Tutorial-Codebase-Knowledge
12,396Ver en GitHub
This project is a comprehensive suite of AI tools and frameworks, featuring an LLM multi-agent orchestrator, an autonomous agent runtime, and a stateful application framework. It provides the infrastructure to build and manage specialized AI agents capable of coordinating complex tasks through graph-based workflows and shared state. The system is distinguished by its implementation of the Model Context Protocol, allowing for standardized resource discovery and communication between AI clients and servers. It further includes an AI-powered documentation generator designed to analyze source cod
Provides high-performance element-wise array operations leveraging compiled code for numerical efficiency.
Pythoncodinglarge-language-modellarge-language-models
Ver en GitHub12,396
lyhue1991/eat_tensorflow2_in_30_days
lyhue1991/eat_tensorflow2_in_30_days
9,933Ver en GitHub
This project is a structured learning curriculum and technical reference for mastering deep learning with TensorFlow. It provides a comprehensive guide for building, training, and deploying neural networks, combining theoretical fundamentals with practical implementation examples. The repository distinguishes itself by covering the end-to-end machine learning workflow, from low-level tensor mathematics and linear algebra to the creation of complex model architectures. It includes specific guidance on developing data pipelines for diverse data types, such as images, text, and time-series seque
Executes mathematical and logical operations independently across every element of a tensor.
Pythontensorflowtensorflow-examplestensorflow-tutorial
Ver en GitHub9,933
xlite-dev/leetcuda
xlite-dev/LeetCUDA
9,694Ver en GitHub
LeetCUDA is a collection of high-performance GPU kernel libraries focusing on memory optimization, activation functions, and attention mechanisms. It serves as a reference library for CUDA kernel implementations, ranging from basic element-wise operations to complex neural network components, and provides Python bindings to integrate these kernels into deep learning workflows. The project is distinguished by its focus on low-level hardware optimizations. This includes the use of tensor cores for half-precision matrix multiplication, asynchronous data pipelining with double buffering, and shar
Performs element-wise addition across float32 and float16 arrays using vectorized memory access.
Cudacudacuda-12cuda-cpp
Ver en GitHub9,694
torch/torch7
torch/torch7
9,127Ver en GitHub
Torch7 is a scientific computing environment and tensor computation library used for deep learning research and numerical analysis. It functions as a Lua-based framework for training neural networks and learning agents, providing a toolkit for implementing architectures and training through reinforcement learning algorithms. The project is distinguished by its tight integration with C, utilizing a binding layer to map high-level scripting to low-level C structures for direct memory access. It supports hardware-accelerated computation by offloading linear algebra and convolution operations to
Executes custom functions on every individual element of a tensor to update its values.
C
Ver en GitHub9,127
hybridgroup/gocv
hybridgroup/gocv
7,463Ver en GitHub
GoCV is a computer vision library and Go language binding for OpenCV. It serves as an image processing toolkit and deep learning inference engine, providing programmatic access to a wide range of algorithms for image manipulation, object detection, and video analysis. The project differentiates itself through high-performance native bindings and hardware acceleration. It utilizes a foreign function interface to map Go calls to C++ functions and includes a hardware-agnostic backend dispatch to route neural network tasks to computation engines such as CUDA and OpenVINO. The library covers a br
Performs high-performance mathematical operations across multi-dimensional image arrays.
Go
Ver en GitHub7,463
louthy/language-ext
louthy/language-ext
7,057Ver en GitHub
language-ext is a functional programming framework for C# that provides a suite of immutable data structures and monadic types. It enables the implementation of pure functional programming patterns, utilizing containers to manage side effects, optional values, and error handling. The library is distinguished by its advanced concurrency and state management tools, including a software transactional memory system and lock-free atomic references. It also provides specialized utilities for distributed systems, such as vector clocks for causality tracking and deterministic data conflict resolution
Allows applying transformation functions across every element of an immutable array to produce a new result array.
C#
Ver en GitHub7,057
nvidia/warp
NVIDIA/warp
6,233Ver en GitHub
Warp is a Python framework that JIT-compiles Python functions into CUDA kernels for GPU-accelerated parallel computation, with built-in automatic differentiation and multi-framework array interoperability. At its core, it provides a GPU kernel compilation system that enables writing and executing custom GPU kernels directly from Python, while supporting automatic gradient computation through those kernels for integration with machine learning pipelines. The framework also includes tile-based cooperative computing, where thread blocks partition into tiles for shared-memory and tensor-core opera
Applies element-wise arithmetic operations between tiles or between a tile and a constant within GPU kernels.
Pythoncudadifferentiable-programminggpu
Ver en GitHub6,233
apache/pinot
apache/pinot
6,098Ver en GitHub
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Calculates the element-wise sum of multiple double arrays across grouped records, padding shorter arrays with zeros.
Java
Ver en GitHub6,098
mrdbourke/zero-to-mastery-ml
mrdbourke/zero-to-mastery-ml
5,839Ver en GitHub
Este proyecto es un currículo educativo de machine learning y plataforma de aprendizaje entregada a través de Jupyter Notebooks interactivos. Sirve como una guía completa para dominar el toolkit de ciencia de datos de Python, proporcionando tutoriales estructurados para computación numérica, manipulación de datos tabulares y visualización estadística. El currículo incluye guías de implementación específicas para Scikit-Learn y un curso práctico sobre TensorFlow para construir, entrenar y desplegar redes neuronales y modelos de visión artificial. Cubre el proceso de extremo a extremo de construcción de modelos predictivos, desde la formulación inicial del problema y categorización de tareas hasta el despliegue de modelos mediante interfaces web interactivas. El proyecto cubre una amplia superficie de capacidades incluyendo computación numérica con arrays multidimensionales, análisis exploratorio de datos y rutinas de preprocesamiento de datos. Proporciona flujos de trabajo detallados para aprendizaje supervisado y no supervisado, pipelines de machine learning automatizado, optimización de hiperparámetros y evaluación de modelos utilizando métricas de clasificación y validación cruzada. El contenido educativo está organizado como una serie de notebooks que intercalan código Python con explicaciones narrativas para documentar flujos de trabajo de ciencia de datos.
Provides high-performance operations that apply mathematical functions across every element of multi-dimensional arrays.
Jupyter Notebookdata-sciencedeep-learningmachine-learning
Ver en GitHub5,839
carp-lang/carp
carp-lang/Carp
5,815Ver en GitHub
Carp is a statically typed Lisp compiler that compiles Lisp-like syntax directly to C source code, enabling seamless integration with existing C libraries and low-level system programming. It manages memory deterministically at compile time using ownership tracking and linear types, eliminating garbage collection pauses and runtime overhead while ensuring type safety through an inferred static type system. The language distinguishes itself through compile-time macro expansion and metaprogramming capabilities, allowing code generation and transformation before final binary output. It enforces
Provides a function to sum all elements of a static array.
Haskellfunctionalfunctional-programminggame-development
Ver en GitHub5,815
facebookresearch/flashlight
facebookresearch/flashlight
5,443Ver en GitHub
Flashlight es una biblioteca de aprendizaje automático en C++ y un framework de aprendizaje profundo diseñado para construir y entrenar redes neuronales. Funciona como una biblioteca de manipulación de tensores y un motor de diferenciación automática que rastrea operaciones para calcular gradientes mediante retropropagación (backpropagation) para la optimización de modelos. El proyecto se distingue por su rol como framework de entrenamiento distribuido, utilizando sincronización de gradientes all-reduce y entornos distribuidos para escalar cargas de trabajo de aprendizaje automático a través de múltiples nodos y dispositivos. Cuenta con una interfaz de memoria agnóstica al backend y gestión basada en RAII para desacoplar las operaciones de tensores del hardware físico. El framework cubre una amplia superficie de capacidades, incluyendo la construcción de arquitecturas de redes neuronales con capas convolucionales, lineales y recurrentes. Proporciona utilidades extensas para álgebra de tensores, gestión y batching de datasets, serialización binaria versionada para estados de modelos y herramientas de monitorización para rastrear métricas de entrenamiento y uso de memoria.
Executes high-performance mathematical transformations, such as exponentials and logarithms, across every element of a tensor.
C++
Ver en GitHub5,443
tile-ai/tilelang
tile-ai/tilelang
5,226Ver en GitHub
TileLang is a Python-embedded domain-specific language compiler that JIT-compiles and autotunes GPU kernels. It uses a tile-based DSL, automatic software pipelining, and parallel autotuning to generate optimized GPU kernels at runtime. It supports tensor core operations with Pythonic syntax, automatic memory management, and thread mapping. The compiler searches over tile sizes, thread counts, and scheduling policies, compiling and benchmarking candidates in parallel to find the fastest kernel. It also caches compiled binaries and tuning results to disk for reuse across sessions. TileLang inc
Uses templates to declare element-wise operations and auto-configure them for target hardware.
Python
Ver en GitHub5,226
javascriptdata/danfojs
javascriptdata/danfojs
5,050Ver en GitHub
Danfo.js es una biblioteca de análisis y preprocesamiento de datos para JavaScript que proporciona estructuras de datos etiquetadas de alto rendimiento. Implementa dataframes y series para permitir análisis de datos complejos, computación estadística y la manipulación de datos tabulares estructurados. El proyecto sirve como una biblioteca de preprocesamiento para machine learning, ofreciendo utilidades para codificación de etiquetas categóricas, one-hot encoding y escalado y estandarización de características numéricas. Facilita específicamente la conversión de estructuras de datos etiquetadas en tensores para el entrenamiento y evaluación de modelos. La biblioteca cubre un amplio conjunto de capacidades, incluyendo estadísticas descriptivas, operaciones relacionales como merge y join, y procesamiento de series temporales. Incluye herramientas para limpieza, filtrado y agrupación de datos, así como una interfaz de visualización para generar gráficos interactivos directamente desde los dataframes. El sistema soporta la importación y exportación de datos mediante formatos CSV, JSON y Excel.
Executes high-performance mathematical functions across entire data series simultaneously using tensor acceleration.
TypeScriptdanfojsdata-analysisdata-analytics
Ver en GitHub5,050
nyandwi/machine_learning_complete
Nyandwi/machine_learning_complete
4,983Ver en GitHub
This is an interactive notebook-based course that teaches machine learning from Python fundamentals through deep learning and natural language processing. It uses real datasets and multiple frameworks within a structured, hands-on curriculum that combines concise explanations with executable code cells, built-in datasets, and embedded exercise checkpoints. Learning progresses through data preparation and exploration, classical machine learning workflows, computer vision with convolutional neural networks, and natural language processing with deep learning, all delivered as a cohesive progressi
Executes high-performance arithmetic, trigonometric, and logarithmic operations across multi-dimensional arrays.
Jupyter Notebookcomputer-visiondata-analysisdata-science
Ver en GitHub4,983
arrayfire/arrayfire
arrayfire/arrayfire
4,888Ver en GitHub
ArrayFire es un framework de computación agnóstico al hardware y un motor de tensores compilado JIT diseñado para la computación numérica de alto rendimiento. Sirve como una biblioteca de computación numérica en GPU y un kit de herramientas de procesamiento de señales paralelo que abstrae los backends de hardware, permitiendo que el mismo código base se ejecute en diversas arquitecturas de GPU y CPUs. El proyecto se distingue por un motor JIT que utiliza la compilación de expresiones para fusionar operaciones y minimizar la sobrecarga de memoria. Emplea un grafo de ejecución diferida para optimizar las cadenas de cálculo y proporciona primitivas de interoperabilidad para compartir datos y contextos de ejecución con plataformas de computación externas como CUDA y OpenCL. La biblioteca cubre una amplia gama de capacidades, incluyendo álgebra lineal paralela, procesamiento digital de señales y visión artificial acelerada. Proporciona herramientas para la implementación de aprendizaje automático, simulación de modelos financieros y la resolución de ecuaciones diferenciales parciales para simulaciones de sistemas físicos. Su sistema de gestión de tensores maneja la asignación de matrices multidimensionales, el corte (slicing) y las transferencias de datos entre host y dispositivo.
Performs high-performance element-wise array operations across multi-dimensional tensors.
C++arrayfirecc-plus-plus
Ver en GitHub4,888
sodiray/radash
sodiray/radash
4,845Ver en GitHub
Radash es una librería de utilidades funcionales de TypeScript diseñada para la transformación de datos, validación y gestión de flujos de trabajo. Proporciona una colección de funciones auxiliares tipadas para manipular arrays, objetos y cadenas. El proyecto cuenta con un toolkit de flujo de trabajo asíncrono para gestionar promesas, reintentos y límites de concurrencia, junto con una suite de validadores booleanos para verificar tipos primitivos, objetos y promesas. También implementa patrones de programación funcional como composición de funciones, aplicación parcial y patrones de respuesta de error primero. La librería cubre una amplia superficie de capacidades, incluyendo gestión de estado de objetos con clonación profunda y fusión, manipulaciones complejas de arrays y formateo de cadenas. Adicionalmente proporciona herramientas para la optimización de ejecución, como limitación de tasa (rate limiting) y caché de resultados.
Provides a utility to sum numeric values in a list, including support for extracting values from objects.
TypeScriptfunctionshacktoberfestjavascript
Ver en GitHub4,845
rust-ndarray/ndarray
rust-ndarray/ndarray
4,290Ver en GitHub
ndarray es una biblioteca de arreglos multidimensionales para Rust que sirve como framework de álgebra lineal y herramienta de computación científica. Proporciona la infraestructura central para crear y manipular arreglos de n-dimensiones, funcionando tanto como un procesador de arreglos paralelo como un kit de herramientas para el análisis de datos numéricos. La biblioteca se distingue por proporcionar cortes (slicing) y vistas de memoria eficientes, lo que permite compartir datos sin copiarlos. Aprovecha bibliotecas matemáticas de backend optimizadas para la multiplicación de matrices de alta velocidad y distribuye iteraciones matemáticas pesadas a través de múltiples hilos de CPU para acelerar el procesamiento. El proyecto cubre una amplia gama de operaciones matemáticas, incluyendo aritmética elemento a elemento, agregación de datos basada en ejes y cálculos de producto punto. También incluye utilidades integrales para la manipulación de arreglos como el cambio de forma, aplanamiento, apilamiento y generación de cuadrículas de coordenadas, junto con soporte para la generación de arreglos aleatorios y serialización.
Executes high-performance element-wise operations and mathematical functions across multidimensional arrays.
Rust
Ver en GitHub4,290
uxlfoundation/onednn
uxlfoundation/oneDNN
4,009Ver en GitHub
oneDNN es una biblioteca para la aceleración del aprendizaje profundo que proporciona bloques de construcción optimizados para el entrenamiento e inferencia de redes neuronales. Gestiona la computación de tensores a través de hardware CPU y GPU, permitiendo la ejecución de primitivas de alto rendimiento para el entrenamiento de modelos y la optimización de la inferencia de redes neuronales. El proyecto se distingue por la optimización de kernels específica para el hardware y el uso de compilación just-in-time para apuntar a conjuntos de instrucciones de procesador específicos. Soporta la ejecución de redes neuronales cuantizadas utilizando cuantización estática y dinámica para reducir el uso de memoria y aumentar el rendimiento. La biblioteca cubre una amplia gama de capacidades, incluyendo primitivas de aprendizaje profundo como convoluciones, multiplicación de matrices y ejecución de redes neuronales recurrentes. Implementa optimizaciones de rendimiento avanzadas, incluyendo fusión de operaciones, optimización de grafos de computación y gestión de formatos de memoria. La integración se proporciona a través de una ABI C estable y un wrapper C++, con soporte para SYCL, OpenCL y bibliotecas de álgebra lineal externas. El sistema incluye herramientas de observabilidad para la creación de perfiles de rendimiento de hardware, benchmarking de primitivas y registro de ejecución detallado.
Applies high-performance arithmetic, comparison, or selection operators between two tensors element-wise.
C++aarch64amxavx512
Ver en GitHub4,009
dpilger26/numcpp
dpilger26/NumCpp
3,963Ver en GitHub
NumCpp es un framework de C++ y biblioteca de computación numérica que proporciona un kit de herramientas para la gestión de arrays multidimensionales y rutinas matemáticas. Funciona como una implementación en C++ del ecosistema NumPy, ofreciendo un framework de computación científica para gestionar tensores y realizar ecuaciones algebraicas complejas. El proyecto permite la manipulación de arrays de alto rendimiento dentro de un entorno C++ sin depender de un runtime de Python. Se distingue por proporcionar una interfaz similar a NumPy para ejecutar álgebra lineal, gestionar estructuras de datos multidimensionales y realizar procesamiento numérico. La biblioteca cubre una amplia gama de capacidades, incluyendo operaciones algebraicas de matrices, gestión de geometría de arrays mediante slicing y reshaping, y la generación de distribuciones aleatorias. También incluye herramientas para el análisis de datasets, estadísticas de arrays y la importación/exportación de datos numéricos mediante formatos binarios y de texto.
Implements high-performance element-wise operations that apply mathematical functions across every array member.
C++
Ver en GitHub3,963
xtensor-stack/xtensor
xtensor-stack/xtensor
3,748Ver en GitHub
xtensor is a C++ multidimensional array library for numerical computing that provides N-dimensional containers with an interface mirroring the NumPy API. It utilizes a lazy evaluation expression engine to defer numerical computations until assignment, which minimizes memory allocations and intermediate copies. The library features a foreign memory array adaptor that allows it to wrap external buffers, such as NumPy arrays, to perform numerical operations in-place without duplicating data. It further optimizes performance through lazy broadcasting and a system that manages the lifetime of temp
Executes high-performance element-wise arithmetic and universal functions across multi-dimensional arrays.
C++c-plus-plus-14multidimensional-arraysnumpy
Ver en GitHub3,748

Awesome Element-wise Array Operations GitHub Repositories

The-Pocket/PocketFlow-Tutorial-Codebase-Knowledge

lyhue1991/eat_tensorflow2_in_30_days

xlite-dev/LeetCUDA

torch/torch7

hybridgroup/gocv

louthy/language-ext

NVIDIA/warp

apache/pinot

mrdbourke/zero-to-mastery-ml

carp-lang/Carp

facebookresearch/flashlight

tile-ai/tilelang

javascriptdata/danfojs

Nyandwi/machine_learning_complete

arrayfire/arrayfire

sodiray/radash

rust-ndarray/ndarray

uxlfoundation/oneDNN

dpilger26/NumCpp

xtensor-stack/xtensor

Explorar subetiquetas