[Bugfix][CPU] Fix MRoPE dispatch on the CPU backend (#27800)

Signed-off-by: jiang1.li <jiang1.li@intel.com>
2026-01-25 05:34:26 +08:00 · 2025-10-30 23:12:05 +08:00 · 2025-10-30 23:12:05 +08:00 · eebf00cb0c
commit eebf00cb0c
parent 9956aae4ea
1 changed files with 9 additions and 0 deletions
--- a/vllm/model_executor/layers/rotary_embedding/mrope.py
+++ b/vllm/model_executor/layers/rotary_embedding/mrope.py
@ -357,6 +357,15 @@ class MRotaryEmbedding(RotaryEmbeddingBase):
        key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
        return query, key

+    def forward_cpu(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: torch.Tensor | None = None,
+        offsets: torch.Tensor | None = None,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        return self.forward_native(positions, query, key, offsets)
+
    @staticmethod
    def get_next_input_positions(
        mrope_position_delta: int,