[BugFix] Illegal memory access for MoE On H20 (#13693)

2026-06-26 20:47:24 +08:00 · 2025-02-24 23:37:32 +08:00 · 2025-02-24 23:37:32 +08:00 · ccc00515fd
commit ccc00515fd
parent 781096e385
1 changed files with 1 additions and 1 deletions
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@ -1271,7 +1271,7 @@ def fused_experts_impl(hidden_states: torch.Tensor,
            # so the cache size and config are already set correctly and
            # do not need to be adjusted.
            intermediate_cache1 = intermediate_cache1[:tokens_in_chunk]
-            intermediate_cache2 = intermediate_cache2[:tokens_in_chunk]
+            intermediate_cache2 = intermediate_cache2[:tokens_in_chunk * topk_ids.shape[1]]
            intermediate_cache3 = intermediate_cache3[:tokens_in_chunk]
            config = get_config_func(tokens_in_chunk)