Fix nemotron_nas intermediate_size computation (#30795)

Signed-off-by: Grzegorz Karch <gkarch@nvidia.com>
2025-12-24 14:06:32 +08:00 · 2025-12-17 02:06:28 +01:00 · 2025-12-17 02:06:28 +01:00 · f5db6385a1
commit f5db6385a1
parent c0a88df7f7
1 changed files with 7 additions and 4 deletions
--- a/vllm/model_executor/models/nemotron_nas.py
+++ b/vllm/model_executor/models/nemotron_nas.py
@ -169,10 +169,13 @@ class DeciLMDecoderLayer(nn.Module):
            self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)

        if not self._is_no_op_ffn:
-            ffn_mult = block_config.ffn.ffn_mult
-            intermediate_size = _ffn_mult_to_intermediate_size(
-                ffn_mult, config.hidden_size
-            )
+            if hasattr(block_config.ffn, "ffn_mult"):
+                ffn_mult = block_config.ffn.ffn_mult
+                intermediate_size = _ffn_mult_to_intermediate_size(
+                    ffn_mult, config.hidden_size
+                )
+            else:
+                intermediate_size = block_config.ffn.intermediate_size

            self.mlp = LlamaMLP(
                hidden_size=self.hidden_size,