[Model] Adding torch compile annotations to chatglm (#15624)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
2025-12-13 21:45:25 +08:00 · 2025-03-28 21:14:09 +08:00 · 2025-03-28 21:14:09 +08:00 · 91276c5721
commit 91276c5721
parent 0b4167526d
1 changed files with 2 additions and 0 deletions
--- a/vllm/model_executor/models/chatglm.py
+++ b/vllm/model_executor/models/chatglm.py
@ -10,6 +10,7 @@ from torch import nn
 from torch.nn import LayerNorm
 from vllm.attention import Attention
 from vllm.compilation.decorators import support_torch_compile
 from vllm.config import CacheConfig, VllmConfig
 from vllm.distributed import get_pp_group, get_tensor_model_parallel_world_size
 from vllm.model_executor.layers.activation import SiluAndMul
@ -293,6 +294,7 @@ class GLMTransformer(nn.Module):
        return hidden_states
@support_torch_compile
 class ChatGLMModel(nn.Module):
    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):