[BugFix] Revert ROCm Custom Paged Attention Env Flag Check (#17022)

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
2025-12-10 22:28:21 +08:00 · 2025-04-23 10:17:48 +08:00 · 2025-04-23 10:17:48 +08:00 · 7e081ba7ca
commit 7e081ba7ca
parent 1e013fa388
1 changed files with 1 additions and 0 deletions
--- a/vllm/platforms/rocm.py
+++ b/vllm/platforms/rocm.py
@ -118,6 +118,7 @@ def use_rocm_custom_paged_attention(qtype: torch.dtype, head_size: int,
            and (head_size == 64 or head_size == 128)
            and (block_size == 16 or block_size == 32)
            and (gqa_ratio >= 1 and gqa_ratio <= 16) and max_seq_len <= 32768
            and (envs.VLLM_ROCM_CUSTOM_PAGED_ATTN)
            and not (envs.VLLM_ROCM_USE_AITER_PAGED_ATTN
                     and envs.VLLM_ROCM_USE_AITER))