support medusa

Signed-off-by: Xingyu Liu <charlotteliu12x@gmail.com>
2026-05-19 00:47:01 +08:00 · 2025-12-09 20:47:53 -08:00 · 2025-12-09 20:47:53 -08:00 · aab35fc31c
commit aab35fc31c
parent f72949b288
2 changed files with 12 additions and 0 deletions
--- a/vllm/config/speculative.py
+++ b/vllm/config/speculative.py
@ -401,6 +401,9 @@ class SpeculativeConfig:
                            model_type="eagle",
                        )
                        self.draft_model_config.hf_config = eagle_config
+                        self.draft_model_config.model_arch_config = (
+                            self.draft_model_config.get_model_arch_config()
+                        )

                if self.num_speculative_tokens is not None and hasattr(
                    self.draft_model_config.hf_config, "num_lookahead_tokens"
--- a/vllm/transformers_utils/model_arch_config_convertor.py
+++ b/vllm/transformers_utils/model_arch_config_convertor.py
@ -276,6 +276,14 @@ class TerratorchModelArchConfigConvertor(ModelArchConfigConvertorBase):
        return 0


+class MedusaModelArchConfigConvertor(ModelArchConfigConvertorBase):
+    def get_head_size(self) -> int:
+        return 0
+
+    def get_total_num_kv_heads(self) -> int:
+        return 0
+
+
 class Zamba2ModelArchConfigConvertor(ModelArchConfigConvertorBase):
    def get_head_size(self) -> int:
        return getattr(self.hf_text_config, "attention_head_dim", 0)
@ -367,6 +375,7 @@ MODEL_ARCH_CONFIG_CONVERTORS = {
    "mamba": MambaModelArchConfigConvertor,
    "falcon_mamba": MambaModelArchConfigConvertor,
    "timm_wrapper": TerratorchModelArchConfigConvertor,
+    "medusa": MedusaModelArchConfigConvertor,
    "zamba2": Zamba2ModelArchConfigConvertor,
    "mpt": MPTModelArchConfigConvertor,
    "dbrx": DbrxModelArchConfigConvertor,