[Bugfix] Fix MRoPE dispatch on CPU (#24712)

Signed-off-by: jiang1.li <jiang1.li@intel.com>
2025-12-15 18:16:46 +08:00 · 2025-09-12 12:56:31 +08:00 · 2025-09-12 12:56:31 +08:00 · 7920de0a2a
commit 7920de0a2a
parent ddcec289c7
1 changed files with 9 additions and 0 deletions
--- a/vllm/model_executor/layers/rotary_embedding/mrope.py
+++ b/vllm/model_executor/layers/rotary_embedding/mrope.py
@ -300,6 +300,15 @@ class MRotaryEmbedding(RotaryEmbedding):
        key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
        return query, key
    def forward_cpu(
        self,
        positions: torch.Tensor,
        query: torch.Tensor,
        key: Optional[torch.Tensor] = None,
        offsets: Optional[torch.Tensor] = None,
    ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
        return self.forward_native(positions, query, key, offsets)
    @classmethod
    def get_input_positions(
        cls,