benchmark-kernel
flashinfer-ai · Development
提供使用CUPTI硬件级计时对FlashInfer GPU内核进行基准测试的框架。支持多种后端,生成包含TFLOPS和内存带宽等性能指标的CSV报告。
Guide for benchmarking FlashInfer kernels with CUPTI timing
npx skills add https://github.com/flashinfer-ai/flashinfer --skill benchmark-kernel
星标 5783 · 安装量 0