1 个仓库
Mechanisms for selecting the most efficient low-level implementation of a mathematical operation based on performance and accuracy targets.
Distinct from Algorithmic Performance Optimizations: Focuses on switching between specific kernel implementations (e.g., Winograd vs GEMM) rather than general complexity analysis.
Explore 1 awesome GitHub repository matching software engineering & architecture · Kernel Implementation Selection. Refine with filters or upvote what's useful.
oneDNN 是一个深度学习加速库,为神经网络训练和推理提供优化的构建块。它管理跨 CPU 和 GPU 硬件的张量计算,支持执行用于模型训练和神经网络推理优化的高性能原语。 该项目通过硬件特定的内核优化和使用即时编译来针对特定处理器指令集脱颖而出。它支持使用静态和动态量化来执行量化神经网络,以减少内存使用并提高吞吐量。 该库涵盖了广泛的功能,包括卷积、矩阵乘法和循环神经网络执行等深度学习原语。它实现了先进的性能优化,包括操作融合、计算图优化和内存格式管理。通过稳定的 C ABI 和 C++ 包装器提供集成,并支持 SYCL、OpenCL 和外部线性代数库。 该系统包括用于硬件性能分析、原语基准测试和详细执行日志记录的观测工具。
Selects between direct, Winograd, or implicit GEMM implementations to balance performance, memory, and numerical accuracy.