benchmark-kernel

flashinfer-ai · Development

提供使用CUPTI硬件级计时对FlashInfer GPU内核进行基准测试的框架。支持多种后端,生成包含TFLOPS和内存带宽等性能指标的CSV报告。

Guide for benchmarking FlashInfer kernels with CUPTI timing

npx skills add https://github.com/flashinfer-ai/flashinfer --skill benchmark-kernel

星标 5783 · 安装量 0

GitHub · SkillBox 全部技能