vllm/c3x at 01413e0cf5a04da4049ffa38b6ff3df27ccabd06 - vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-25 06:57:13 +08:00

History

[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 )

Signed-off-by: mgoin <mgoin64@gmail.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>

2025-09-11 15:43:14 -07:00

cutlass_gemm_caller.cuh

add cutlass support for blackwell fp8 gemm (#13798 )

2025-03-04 07:55:07 -08:00

scaled_mm_azp_sm90_int8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_blockwise_sm90_fp8_dispatch.cuh

[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 )

2025-09-11 15:43:14 -07:00

scaled_mm_blockwise_sm90_fp8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_blockwise_sm100_fp8_dispatch.cuh

[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 )

2025-09-11 15:43:14 -07:00

scaled_mm_blockwise_sm100_fp8.cu

Sm100 blockwise fp8 swap ab (#18564 )

2025-06-04 07:48:45 -07:00

scaled_mm_blockwise_sm120_fp8_dispatch.cuh

[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 )

2025-09-11 15:43:14 -07:00

scaled_mm_blockwise_sm120_fp8.cu

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

2025-08-07 19:18:28 -07:00

scaled_mm_helper.hpp

[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 )

2025-09-11 15:43:14 -07:00

scaled_mm_kernels.hpp

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

2025-08-07 19:18:28 -07:00

scaled_mm_sm90_fp8_dispatch.cuh

[Kernel] SM90 CUTLASS FP8 GEMM: add support for swap AB + kernel tuning (#20396 )

2025-07-28 23:13:58 +00:00

scaled_mm_sm90_fp8.cu

[Kernel] SM90 CUTLASS FP8 GEMM: add support for swap AB + kernel tuning (#20396 )

2025-07-28 23:13:58 +00:00

scaled_mm_sm90_int8_dispatch.cuh

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_sm90_int8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_sm100_fp8_dispatch.cuh

[Perf] SM100 FP8 GEMM Optimizations after cutlass_profiler (#20071 )

2025-06-26 20:50:09 -07:00

scaled_mm_sm100_fp8.cu

add cutlass support for blackwell fp8 gemm (#13798 )

2025-03-04 07:55:07 -08:00

scaled_mm_sm120_fp8_dispatch.cuh

[NVIDIA] Support Cutlass w8a8 FP8 for Blackwell Geforce GPUs (sm120) (#17280 )

2025-07-02 06:47:19 -06:00

scaled_mm_sm120_fp8.cu

[NVIDIA] Support Cutlass w8a8 FP8 for Blackwell Geforce GPUs (sm120) (#17280 )

2025-07-02 06:47:19 -06:00

scaled_mm.cuh

[feat]: CUTLASS block scaled group gemm for SM100 (#19757 )

2025-07-04 12:58:04 -06:00