[Bugfix] Fix MRoPE dispatch on CPU (#24712)

Signed-off-by: jiang1.li <jiang1.li@intel.com>
2026-01-29 10:47:14 +08:00 · 2025-09-12 12:56:31 +08:00 · 2025-09-12 12:56:31 +08:00 · 7920de0a2a
commit 7920de0a2a
parent ddcec289c7
1 changed files with 9 additions and 0 deletions
--- a/vllm/model_executor/layers/rotary_embedding/mrope.py
+++ b/vllm/model_executor/layers/rotary_embedding/mrope.py
@ -300,6 +300,15 @@ class MRotaryEmbedding(RotaryEmbedding):
        key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
        return query, key

+    def forward_cpu(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: Optional[torch.Tensor] = None,
+        offsets: Optional[torch.Tensor] = None,
+    ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        return self.forward_native(positions, query, key, offsets)
+
    @classmethod
    def get_input_positions(
        cls,