3 مستودعات
The process of writing and managing low-level logic for GPU device execution.
Distinguishing note: Candidates focus on Android kernels or multi-device launches; this is general GPU-side kernel logic development.
Explore 3 awesome GitHub repositories matching operating systems & systems programming · GPU Kernel Development. Refine with filters or upvote what's useful.
rust-cuda هو إطار عمل لبرمجة GPU ومترجم أجهزة يسمح بتطوير وتنفيذ النواة (kernels) عالية الأداء على أجهزة NVIDIA باستخدام Rust. يوفر غلافاً للمشغل (driver wrapper) لإدارة تخصيص ذاكرة الجهاز وتشغيل النواة، ويعمل بفعالية كنظام لكتابة منطق حساب GPU دون الاعتماد على C++. يتضمن المشروع مكتبة حسابية مع بدائيات محسنة للأجهزة لتسريع الشبكات العصبية وتتبع الأشعة المسرع بالأجهزة. ويستخدم سلسلة أدوات تجميع تترجم الكود المصدري إلى تمثيل وسيط منخفض المستوى للتنفيذ على معالجات الرسومات. يغطي إطار العمل إدارة موارد الجهاز، وتطوير النواة، ومحاكاة العمليات الحسابية ذات الدقة العالية. كما يدعم توليد الأرقام العشوائية على جانب الجهاز وتحسينات الحساب الخاصة بالهدف. تتوفر صور حاويات مهيأة مسبقاً لتبسيط توفير سلسلة أدوات المترجم وبيئة التطوير عبر بنيات أجهزة مختلفة.
Provides a framework for managing thread indices and memory allocation to create device-side logic.
AITemplate is an ahead-of-time deep learning compiler that translates PyTorch neural networks into standalone C++ source code. It functions as a PyTorch to C++ compiler and a GPU kernel fusion engine, producing self-contained executable binaries that run inference without requiring a Python interpreter or deep learning framework runtime. The project generates optimized CUDA and HIP C++ code specifically for NVIDIA TensorCores and AMD MatrixCores. It focuses on maximizing throughput for half-precision floating-point operations through a system that combines multiple neural network operators in
Provides the ability to define new neural network primitives and map them to hardware-specific code generation templates.
HIP هي لغة نواة GPU لـ C++ ووقت تشغيل عبر المنصات مصمم لكتابة تطبيقات حوسبة عالية الأداء وقابلة للنقل. توفر واجهة برمجة تسمح لقاعدة كود مصدر واحدة بالتنفيذ على كل من بنيات GPU لـ AMD و NVIDIA. يعمل المشروع كطبقة توافق تمكن من تحويل وترحيل كود مصدر CUDA الحالي للتشغيل على أجهزة AMD. يتم تحقيق ذلك من خلال تعيين بناء الجملة الذي يعكس CUDA وعملية ترجمة من مصدر إلى مصدر أثناء التجميع. تغطي مجموعة الأدوات السطح الأوسع لتطوير GPGPU عبر المنصات، بما في ذلك تحسين الحوسبة غير المتجانسة وإنشاء نوى قابلة للنقل. وتستخدم تجريد وقت التشغيل لتعيين استدعاءات API الموحدة لمكتبات تعريف البائع الخاصة لإدارة الذاكرة والنواة.
Enables the development of single-source C++ kernels that execute on multiple GPU architectures.