[Bugfix] Make moe_align_block_size AMD-compatible (#3470)

2026-05-26 18:14:31 +08:00 · 2024-03-18 11:26:24 -07:00 · 2024-03-18 11:26:24 -07:00 · 9101d832e6
commit 9101d832e6
parent 93348d9458
1 changed files with 2 additions and 1 deletions
--- a/csrc/moe_align_block_size_kernels.cu
+++ b/csrc/moe_align_block_size_kernels.cu
@ -111,7 +111,8 @@ void moe_align_block_size(
        // set dynamic shared mem
        auto kernel = vllm::moe_align_block_size_kernel<scalar_t>;
-        AT_CUDA_CHECK(cudaFuncSetAttribute(kernel, cudaFuncAttributeMaxDynamicSharedMemorySize, shared_mem));
+        AT_CUDA_CHECK(
            VLLM_DevFuncAttribute_SET_MaxDynamicSharedMemorySize((void *)kernel, shared_mem));
        kernel<<<1, num_experts, shared_mem, stream>>>(
            topk_ids.data_ptr<scalar_t>(),
            sorted_token_ids.data_ptr<int32_t>(),