vllm/c3x at bd875d2eb71b130cbc2b68bf0e2dd285f5c7348d - vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-22 11:47:12 +08:00

History

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

Signed-off-by: Junhao Li <junhao@ubicloud.com>

2025-08-07 19:18:28 -07:00

cutlass_gemm_caller.cuh

add cutlass support for blackwell fp8 gemm (#13798 )

2025-03-04 07:55:07 -08:00

scaled_mm_azp_sm90_int8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_blockwise_sm90_fp8_dispatch.cuh

[Kernel]Add streamK for block-quantized CUTLASS kernels (#12978 )

2025-02-20 22:14:24 -08:00

scaled_mm_blockwise_sm90_fp8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_blockwise_sm100_fp8_dispatch.cuh

Sm100 blockwise fp8 swap ab (#18564 )

2025-06-04 07:48:45 -07:00

scaled_mm_blockwise_sm100_fp8.cu

Sm100 blockwise fp8 swap ab (#18564 )

2025-06-04 07:48:45 -07:00

scaled_mm_blockwise_sm120_fp8_dispatch.cuh

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

2025-08-07 19:18:28 -07:00

scaled_mm_blockwise_sm120_fp8.cu

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

2025-08-07 19:18:28 -07:00

scaled_mm_helper.hpp

use ceil_div in cutlass block scaling shape check (#17918 )

2025-05-16 03:02:58 -07:00

scaled_mm_kernels.hpp

[Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

2025-08-07 19:18:28 -07:00

scaled_mm_sm90_fp8_dispatch.cuh

[Kernel] SM90 CUTLASS FP8 GEMM: add support for swap AB + kernel tuning (#20396 )

2025-07-28 23:13:58 +00:00

scaled_mm_sm90_fp8.cu

[Kernel] SM90 CUTLASS FP8 GEMM: add support for swap AB + kernel tuning (#20396 )

2025-07-28 23:13:58 +00:00

scaled_mm_sm90_int8_dispatch.cuh

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_sm90_int8.cu

[Kernel] Update cutlass_scaled_mm to support 2d group (blockwise) scaling (#11868 )

2025-01-30 18:33:00 -08:00

scaled_mm_sm100_fp8_dispatch.cuh

[Perf] SM100 FP8 GEMM Optimizations after cutlass_profiler (#20071 )

2025-06-26 20:50:09 -07:00

scaled_mm_sm100_fp8.cu

add cutlass support for blackwell fp8 gemm (#13798 )

2025-03-04 07:55:07 -08:00

scaled_mm_sm120_fp8_dispatch.cuh

[NVIDIA] Support Cutlass w8a8 FP8 for Blackwell Geforce GPUs (sm120) (#17280 )

2025-07-02 06:47:19 -06:00

scaled_mm_sm120_fp8.cu

[NVIDIA] Support Cutlass w8a8 FP8 for Blackwell Geforce GPUs (sm120) (#17280 )

2025-07-02 06:47:19 -06:00

scaled_mm.cuh

[feat]: CUTLASS block scaled group gemm for SM100 (#19757 )

2025-07-04 12:58:04 -06:00