24 dépôts
Optimized data storage structures for cache-efficient processing.
Distinguishing note: Focuses on low-level memory organization rather than high-level database management.
Explore 24 awesome GitHub repositories matching data & databases · Memory Layouts. Refine with filters or upvote what's useful.
Pandas is a high-performance data analysis library that provides a comprehensive framework for manipulating, cleaning, and transforming structured datasets. It centers on labeled one-dimensional and two-dimensional data structures, allowing users to construct, filter, and reshape tabular information while performing complex arithmetic and logical operations. The library distinguishes itself through a sophisticated indexing engine that enables automatic data alignment during calculations and relational merges. By utilizing a block-based memory layout, it optimizes cache locality for vectorized
Provides contiguous memory block storage to optimize cache locality and vectorized operations.
NumPy is a foundational library for scientific computing in Python, providing a comprehensive framework for managing and manipulating large-scale numerical information. It centers on high-performance multidimensional array objects that serve as the primary data structure for complex mathematical operations and data analysis workflows. The library distinguishes itself through specialized mechanisms for handling multidimensional data, including advanced indexing, slicing, and broadcasting techniques that allow for efficient operations across arrays of varying shapes. It utilizes strided metadat
Uses strided metadata to enable efficient, zero-copy slicing of multidimensional arrays.
This project is a machine learning array framework and tensor computation library designed for high-performance numerical computing. It provides a comprehensive suite of tools for constructing and training neural networks, featuring an automatic differentiation engine that facilitates gradient-based optimization and complex mathematical modeling. The library distinguishes itself through a unified memory architecture that allows data to be shared across CPU and GPU devices without explicit copies, significantly reducing data movement overhead. Its execution model relies on a lazy evaluation en
Forces arrays into row-major memory layouts to ensure alignment and compatibility.
This project is a cross-platform graphics and compute framework that provides a unified, hardware-agnostic abstraction layer for rendering and parallel processing. It enables developers to build high-performance applications that execute consistently across diverse operating systems and hardware backends, including Vulkan, Metal, and DirectX. By mapping high-level graphics commands to native APIs, it serves as a portable foundation for both real-time 3D rendering and general-purpose GPU computing. The framework distinguishes itself through a robust architecture that supports both native deskt
Configures alignment and padding of vertex, index, and uniform data structures for hardware-specific memory requirements.
Arrow is a cross-language development platform for in-memory data. It provides a standardized, language-independent columnar memory format designed to accelerate analytical operations and improve memory efficiency on modern computing hardware. By utilizing a schema-driven approach, the framework enables the efficient organization of both flat and nested data structures. The project functions as an analytical data processing engine that facilitates high-performance computation directly on memory-resident datasets. It distinguishes itself through a zero-copy architecture, which allows multiple
Organizes data in contiguous memory blocks to maximize CPU cache efficiency and enable vectorized processing.
SciPy is a scientific computing library for Python that provides a comprehensive collection of mathematical algorithms and numerical tools for research and engineering. It functions as a high-performance numerical analysis framework, bridging high-level Python code with compiled C and Fortran routines to execute complex computations at hardware speeds. The library is built upon array-based data structures that utilize strided memory layouts to enable efficient data manipulation and slicing. By employing vectorized operation dispatch and linking to optimized hardware-specific linear algebra li
Utilizes strided memory layouts to enable efficient slicing and manipulation of multidimensional data without copying.
This project is a curated collection of programming exercises designed to build proficiency in numerical computing and data manipulation. It provides a structured learning path for mastering multidimensional array operations, vectorized arithmetic, and statistical analysis. The repository focuses on developing practical expertise in array-based workflows, emphasizing techniques such as memory management, efficient data processing, and the replacement of explicit loops with vectorized operations. Users engage with hands-on challenges that cover the full lifecycle of numerical data, from initia
Organizes data into user-defined fields within contiguous memory blocks to represent complex records.
Odin is a compiled, statically typed systems programming language designed for high-performance software development. It focuses on pragmatic low-level memory control, providing a toolset for manual memory management and precise control over hardware utilization. The language is distinguished by its flexible memory model, which includes custom allocators and precise data layout capabilities to optimize resource usage. It features a comprehensive foreign function interface for importing assembly files and linking with external libraries using configurable calling conventions. The type system
Enables efficient data packing using bit fields and specific record layouts for cache-efficient processing.
cuDF is a GPU-accelerated dataframe library and data processing engine designed for manipulating and analyzing large tabular datasets. It provides a high-level API for executing filtering, joining, and aggregating operations directly on GPU hardware. The project integrates the Apache Arrow memory format to enable zero-copy data transfers and includes a just-in-time compiler for executing custom user-defined functions on the GPU. The library features specialized acceleration for existing workflows by redirecting standard Pandas dataframe calls and Polars query plans to a GPU backend. It also p
Implements optimized columnar memory layouts to maximize GPU bandwidth and SIMD execution efficiency.
Torch7 is a scientific computing environment and tensor computation library used for deep learning research and numerical analysis. It functions as a Lua-based framework for training neural networks and learning agents, providing a toolkit for implementing architectures and training through reinforcement learning algorithms. The project is distinguished by its tight integration with C, utilizing a binding layer to map high-level scripting to low-level C structures for direct memory access. It supports hardware-accelerated computation by offloading linear algebra and convolution operations to
Implements strided memory layouts to manipulate tensor dimensions and shapes without duplicating data buffers.
Vaex is a high-performance Apache Arrow DataFrame library and out-of-core data processing engine designed to handle billion-row tabular datasets in Python. It functions as a lazy evaluation framework that defers computations and transformations until results are required, enabling the processing of datasets that exceed available system RAM by mapping files directly from disk. The project distinguishes itself as a tool for big data visualization and exploration, specifically integrated for use within interactive notebooks. It provides specialized capabilities for machine learning feature engin
Implements an Apache Arrow columnar memory layout to enable high-speed data access and efficient interoperability.
FastImageCache is an iOS image caching library that provides a persistent disk-based image store. It utilizes a persistent bitmap cache to store images in uncompressed formats and incorporates an image pre-processing pipeline to optimize assets before they are committed to storage. The library optimizes rendering performance by using memory-mapped image tables for constant-time retrieval and byte-aligned data layouts to prevent memory copies. It organizes images of identical dimensions into shared tables and manages disk space through a least-recently-used cache eviction system. The project
Optimizes rendering performance by aligning image rows to memory boundaries to prevent expensive memory copies.
go-tools is a collection of utilities for Go static analysis and memory layout optimization. It provides a toolset designed to analyze source code to detect bugs and dead code, alongside specialized tools for optimizing how structs are arranged in memory. The project includes a memory alignment visualizer to display physical memory layouts and padding, as well as a struct layout optimizer that reorders fields to minimize memory padding. Additionally, it provides a boilerplate generator to automate the creation of registration and test files required for developing custom Go analyzers. The to
Provides a utility for inspecting memory alignment, field sizes, and padding of Go structs.
Provides native handling of interleaved, planar, and custom memory layouts without data copying.
Ce projet est une collection complète de bibliothèques et de toolkits C++ fournissant des implémentations de référence pour les structures de données, les algorithmes de graphes et la logique binaire. Il sert de référence d'algorithmes C++ contenant plus de 180 problèmes de programmation résolus et un toolkit spécialisé pour la programmation compétitive. Le dépôt se distingue par ses bibliothèques étendues de manipulation de bits de bas niveau pour les contrôles de parité, la détection d'endianness et la logique basée sur XOR. Il fournit également un large éventail de solutions de référence pour des défis algorithmiques complexes impliquant le backtracking, la théorie des graphes et la programmation dynamique. La surface de fonctionnalités couvre les organisateurs de données linéaires et hiérarchiques fondamentaux, y compris les listes chaînées, les piles, les files d'attente et les arbres de recherche binaire. Il inclut une suite complète d'algorithmes de graphes pour la recherche de chemin et les arbres couvrants, diverses méthodes de tri et de recherche, des transformations de matrices et des utilitaires de traitement de chaînes. De plus, il couvre les fonctions de calcul mathématique, la compression de données sans perte et les chiffrements cryptographiques de base.
Implements byte order reversal to convert data between big-endian and little-endian representations.
Magnum est une suite de middleware C++ pour le développement graphique multiplateforme et la visualisation de données en temps réel. Il fournit une couche de rendu agnostique au matériel qui traduit les commandes graphiques en appels spécifiques à la plateforme, assurant un comportement cohérent à travers différents pilotes GPU et API tels que Vulkan. Le projet se concentre sur le découplage de la logique d'application du matériel sous-jacent grâce à des utilitaires graphiques et système abstraits. Il dispose d'un importateur de ressources basé sur des plugins pour les actifs 3D et l'audio, d'un graphe de scène hiérarchique pour les transformations spatiales et d'un système d'événements basé sur des signaux haute performance pour la communication. Les capacités étendues incluent l'algèbre linéaire et les mathématiques vectorielles, le traitement de la géométrie de maillage et la gestion des contextes GPU. La boîte à outils couvre également la lecture audio spatiale, l'intégration matérielle VR et les optimisations de mémoire de bas niveau comme les mises en page stridées et les allocations alignées. La bibliothèque peut être intégrée dans des projets parents en tant que sous-projet CMake.
Organizes interleaved data into contiguous blocks and strided views to enhance data locality and SIMD efficiency.
c3c is the compiler for the C3 programming language, transforming source code into executable binaries, static libraries, or dynamic libraries using an LLVM backend. It implements a system based on result-based error handling, scoped memory pooling, and a semantic macro system. The compiler provides first-class support for hardware-backed SIMD vectors that map directly to processor instructions and enables runtime polymorphism through interface-based dynamic dispatch. The project covers a broad set of low-level capabilities, including manual and pooled memory management, inline assembly inte
Controls bit-level data layout for big-endian and little-endian storage and overlapping ranges.
nalgebra est une bibliothèque d'algèbre linéaire pour Rust qui fournit des opérations sur les matrices et les vecteurs avec prise en charge des dimensions à la compilation et à l'exécution. Elle fonctionne comme une bibliothèque d'analyse numérique et une bibliothèque de matrices creuses, offrant un framework mathématique capable de s'exécuter dans des environnements embarqués et WebAssembly sans nécessiter la bibliothèque standard Rust. Le projet se distingue comme une bibliothèque de transformation géométrique, utilisant des coordonnées homogènes, des quaternions et des isométries pour gérer les rotations, translations et projections 3D. Il implémente une variété de décompositions de matrices — notamment LU, QR, Cholesky, SVD et décomposition en valeurs propres — pour résoudre des systèmes linéaires et analyser des matrices. La bibliothèque couvre de larges domaines de capacités, notamment le calcul géométrique pour les transformations spatiales, les utilitaires d'infographie pour la composition de matrices de projection et l'exportation de données de shader, et la gestion spécialisée des matrices creuses utilisant le stockage compressé par lignes et colonnes. Elle fournit également des outils de gestion de données pour l'initialisation, le redimensionnement et l'analyse de fichiers Matrix Market.
Provides non-owning references to matrix sub-sections using memory offsets to avoid data copying.
ndarray est une bibliothèque de tableaux multidimensionnels pour Rust qui sert de framework d'algèbre linéaire et d'outil de calcul scientifique. Elle fournit l'infrastructure de base pour créer et manipuler des tableaux n-dimensionnels, fonctionnant à la fois comme un processeur de tableaux parallèle et une boîte à outils pour l'analyse de données numériques. La bibliothèque se distingue en fournissant un découpage (slicing) et des vues mémoire efficaces, permettant le partage de données sans copie. Elle tire parti de bibliothèques mathématiques backend optimisées pour la multiplication de matrices à haute vitesse et distribue les itérations mathématiques lourdes sur plusieurs threads CPU pour accélérer le traitement. Le projet couvre un large éventail d'opérations mathématiques, notamment l'arithmétique élément par élément, l'agrégation de données basée sur les axes et les calculs de produit scalaire. Elle inclut également des utilitaires complets pour la manipulation de tableaux tels que le remodelage, l'aplatissement, l'empilement et la génération de grilles de coordonnées, ainsi qu'une prise en charge de la génération de tableaux aléatoires et de la sérialisation.
Maps multidimensional indices to flat memory buffers using axis-specific step sizes for efficient zero-copy slicing.
NumCpp est un framework C++ et une bibliothèque de calcul numérique qui fournit une boîte à outils pour la gestion de tableaux multidimensionnels et des routines mathématiques. Il fonctionne comme une implémentation C++ de l'écosystème NumPy, offrant un framework de calcul scientifique pour gérer des tenseurs et effectuer des équations algébriques complexes. Le projet permet une manipulation de tableaux haute performance dans un environnement C++ sans dépendre d'un runtime Python. Il se distingue en fournissant une interface similaire à NumPy pour exécuter de l'algèbre linéaire, gérer des structures de données multidimensionnelles et effectuer des traitements numériques. La bibliothèque couvre un large éventail de capacités, incluant les opérations algébriques matricielles, la gestion de la géométrie des tableaux via le slicing et le reshaping, et la génération de distributions aléatoires. Elle inclut également des outils pour l'analyse de jeux de données, les statistiques sur les tableaux, et l'import/export de données numériques via des formats binaires et texte.
Utilizes strided memory mapping to allow efficient array reshaping and slicing without copying data.