7 रिपॉजिटरी
Executes multiple data operations in a single instruction cycle to maximize throughput for high-bandwidth multimedia processing tasks.
Distinct from SIMD-Accelerated Arithmetic: Distinct from SIMD-Accelerated Arithmetic: focuses on the broader application of SIMD for data parallelism in multimedia rather than just arithmetic operations.
Explore 7 awesome GitHub repositories matching data & databases · SIMD-Based Data Parallelism. Refine with filters or upvote what's useful.
AISystem is a comprehensive AI full-stack infrastructure project covering the entire pipeline from AI chip architecture to high-level training frameworks. It encompasses the development of AI compiler frameworks, inference engines, and distributed training orchestrators designed to coordinate workloads across a heterogeneous compute stack of CPUs, GPUs, and NPUs. The project focuses on the deep integration of software and hardware, employing software-hardware co-design to align tensor layouts with physical memory structures. It provides specialized capabilities for accelerating Transformer mo
Applies a single instruction across multiple data elements simultaneously to accelerate vector operations.
This project serves as an educational resource for learning and implementing low-level assembly language optimizations. It provides a structured guide for developers to master hardware-specific instructions and manual performance tuning, focusing on the translation of high-level code into efficient machine-level operations for resource-constrained environments. The materials emphasize techniques for maximizing computational throughput in multimedia processing. By covering instruction-level parallelism, register management, and data parallelism, the project enables the development of software
Executes multiple data operations in a single instruction cycle to maximize throughput for high-bandwidth multimedia processing tasks.
xxHash is a high-performance, non-cryptographic hash library designed for rapid checksum generation and data integrity verification. It functions as an incremental hashing engine, allowing for the processing of large or streaming data inputs by maintaining a persistent internal state across sequential chunks. The library is engineered as a computational framework that maximizes throughput by utilizing wide CPU registers and branchless instruction pipelining. It achieves high-speed performance by aligning data access with CPU cache lines and employing multi-stage mixing functions that ensure c
Processes data in parallel using wide CPU registers to maximize throughput during large memory block hashing operations.
BLAKE3 सुरक्षित डेटा डाइजेस्ट और फिंगरप्रिंट्स की गणना करने के लिए उपयोग किए जाने वाले BLAKE3 क्रिप्टोग्राफिक हैश एल्गोरिदम का एक उच्च-प्रदर्शन कार्यान्वयन है। यह एक समानांतर क्रिप्टोग्राफिक हैश टूल के रूप में कार्य करता है जो बड़े डेटासेट को तेज़ी से प्रोसेस करने के लिए कई प्रोसेसर थ्रेड्स में वर्कलोड वितरित करता है। प्रोजेक्ट कीड हैशिंग और मैसेज ऑथेंटिकेशन कोड्स के जनरेशन के लिए विशेष उपकरण प्रदान करता है। इसमें क्रिप्टोग्राफिक की डेरिवेशन के लिए कार्यक्षमता भी शामिल है, जो मास्टर की और संदर्भ स्ट्रिंग्स से अद्वितीय गुप्त सब-कीज़ बनाने की अनुमति देती है। कार्यान्वयन समानांतर हैश गणना और सत्यापित डेटा स्ट्रीमिंग के माध्यम से डेटा अखंडता सत्यापन का समर्थन करता है। ये क्षमताएं Rust और C वातावरण के लिए एक क्रॉस-भाषा लाइब्रेरी के रूप में प्रदान की जाती हैं और इसमें फ़ाइलों या मानक इनपुट के डाइजेस्ट की गणना करने के लिए एक कमांड-लाइन इंटरफ़ेस शामिल है।
Maximizes CPU throughput by processing multiple data blocks simultaneously using SIMD lanes.
Highway एक पोर्टेबल C++ लाइब्रेरी और हार्डवेयर एब्स्ट्रैक्शन लेयर है जिसे सिंगल इंस्ट्रक्शन मल्टीपल डेटा (SIMD) कोड लिखने के लिए डिज़ाइन किया गया है। यह एक एकीकृत इंटरफेस प्रदान करता है जो डेटा-पैरेलल लॉजिक को विभिन्न CPU इंस्ट्रक्शन सेटों पर मैप करता है, जिससे उच्च-प्रदर्शन वाले सॉफ्टवेयर का विकास संभव होता है जो आर्किटेक्चर-विशिष्ट असेंबली की आवश्यकता के बिना विभिन्न प्रोसेसर आर्किटेक्चर पर चलता है। प्रोजेक्ट में एक डायनामिक इंस्ट्रक्शन डिस्पैचर है जो पता लगाए गए हार्डवेयर के आधार पर रनटाइम पर सबसे कुशल CPU इंस्ट्रक्शन सेट का चयन करता है। यह स्टेटिक टारगेट स्पेशलाइजेशन और नए हार्डवेयर टारगेट या कस्टम SIMD ऑपरेशंस को जोड़ने के लिए एक्स्टेंसिबल तंत्र का भी समर्थन करता है।
Provides a portable interface to write data-parallel code that maps to hardware-accelerated SIMD instructions.
c3c is the compiler for the C3 programming language, transforming source code into executable binaries, static libraries, or dynamic libraries using an LLVM backend. It implements a system based on result-based error handling, scoped memory pooling, and a semantic macro system. The compiler provides first-class support for hardware-backed SIMD vectors that map directly to processor instructions and enables runtime polymorphism through interface-based dynamic dispatch. The project covers a broad set of low-level capabilities, including manual and pooled memory management, inline assembly inte
Executes parallel arithmetic and logical operations on hardware-backed vectors to maximize computational throughput.
Rack एक वर्चुअल Eurorack मॉड्यूलर सिंथेसाइज़र एमुलेटर और एक मॉड्यूलर सिंथेसिस SDK है। यह वर्चुअल मॉड्यूल, ऑसिलेटर और फ़िल्टर का उपयोग करके इलेक्ट्रॉनिक संगीत सिग्नल बनाने और रूट करने के लिए एक डिजिटल वातावरण प्रदान करता है, जो वोल्टेज-आधारित सिग्नल रूटिंग के माध्यम से एनालॉग हार्डवेयर के व्यवहार का अनुकरण करता है। यह सिस्टम एक MIDI और CV कनवर्टर के रूप में कार्य करता है, सॉफ़्टवेयर और बाहरी हार्डवेयर के बीच सिग्नल का अनुवाद करता है, और डिजिटल ऑडियो वर्कस्टेशन के भीतर एक VST या उद्योग-मानक इंस्ट्रूमेंट प्लगइन के रूप में काम कर सकता है। यह एक VST प्लगइन होस्ट के रूप में भी कार्य करता है, जो उपलब्ध ध्वनि प्रसंस्करण उपकरणों का विस्तार करने के लिए बाहरी वर्चुअल इंस्ट्रूमेंट्स और प्रभावों को एम्बेड करता है। प्लेटफ़ॉर्म में भौतिक मॉडलिंग सिंथेसिस, स्पेक्ट्रल प्रोसेसिंग और समय-आधारित प्रभावों सहित ऑडियो प्रसंस्करण क्षमताओं की एक विस्तृत श्रृंखला शामिल है। यह SVG-संचालित इंटरफ़ेस निर्माण के साथ कस्टम ऑडियो मॉड्यूल बनाने के लिए एक डेवलपमेंट किट के साथ, वोल्टेज जनरेशन, नोट अनुक्रमण और पॉलीफोनिक सिग्नल प्रोसेसिंग के लिए उपकरण प्रदान करता है। एप्लिकेशन लॉन्चिंग, प्रोजेक्ट बूटस्ट्रैपिंग और वेक्टर ग्राफ़िक्स से सोर्स फ़ाइलों के उत्पादन को स्वचालित करने के लिए एक कमांड लाइन इंटरफ़ेस उपलब्ध है।
Utilizes SIMD vector instructions to process multiple audio channels in parallel for CPU efficiency.