[Bugfix] Support compile for Transformers multimodal (#23095)

Signed-off-by: raushan <raushan@huggingface.co>
2025-12-11 00:44:57 +08:00 · 2025-08-18 15:35:48 +02:00 · 2025-08-18 15:35:48 +02:00 · 0e3bb543f0
commit 0e3bb543f0
parent 569aefd134
1 changed files with 7 additions and 0 deletions
--- a/vllm/model_executor/models/transformers.py
+++ b/vllm/model_executor/models/transformers.py
@ -709,6 +709,13 @@ def flatten_and_concat(x: list[torch.Tensor]) -> torch.Tensor:
    MultiModalProcessor,
    info=MultiModalProcessingInfo,
    dummy_inputs=MultiModalDummyInputsBuilder)
@support_torch_compile(
    dynamic_arg_dims={
        "input_ids": 0,
        "positions": -1,
        "intermediate_tensors": 0,
        "inputs_embeds": 0,
    })  # set `positions` to last dim to support Qwen-mrope
 class TransformersForMultimodalLM(TransformersForCausalLM, SupportsMultiModal):
    # Backwards compatibility for prev released models. State dicts back then
    # had different formats and cannot be loaded with `AutoModel` mapping as is