add-cuda-kernel

flashinfer-ai · Development

为FlashInfer添加CUDA内核的详细教程,涵盖内核实现、启动器创建、Python绑定、测试和基准测试。提供了逐元素缩放操作的具体代码示例,并解释了使用TVM-FFI工具的错误处理。

Step-by-step tutorial for adding new CUDA kernels to FlashInfer

npx skills add https://github.com/flashinfer-ai/flashinfer --skill add-cuda-kernel

星标 5783 · 安装量 0

GitHub · SkillBox 全部技能