1 个仓库
Low-level control over threading and blocking logic for fine-grained hardware customization on CPUs.
Distinct from Microkernel: Does not refer to an OS microkernel, but to micro-kernels of computation; not matching available hardware or OS microkernel tags.
Explore 1 awesome GitHub repository matching operating systems & systems programming · Microkernel Execution Control. Refine with filters or upvote what's useful.
oneDNN 是一个深度学习加速库,为神经网络训练和推理提供优化的构建块。它管理跨 CPU 和 GPU 硬件的张量计算,支持执行用于模型训练和神经网络推理优化的高性能原语。 该项目通过硬件特定的内核优化和使用即时编译来针对特定处理器指令集脱颖而出。它支持使用静态和动态量化来执行量化神经网络,以减少内存使用并提高吞吐量。 该库涵盖了广泛的功能,包括卷积、矩阵乘法和循环神经网络执行等深度学习原语。它实现了先进的性能优化,包括操作融合、计算图优化和内存格式管理。通过稳定的 C ABI 和 C++ 包装器提供集成,并支持 SYCL、OpenCL 和外部线性代数库。 该系统包括用于硬件性能分析、原语基准测试和详细执行日志记录的观测工具。
Provides manual control over threading and blocking logic on CPUs via microkernel interfaces to maximize hardware customization.