more cleanup

Signed-off-by: Sage Moore <sage@neuralmagic.com>
2026-07-21 11:47:09 +08:00 · 2025-07-03 16:35:52 +00:00 · 2025-07-03 16:35:52 +00:00 · 510e839429
commit 510e839429
parent f7b6e600b8
1 changed files with 2 additions and 0 deletions
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@ -1553,6 +1553,8 @@ class GPUModelRunner(LoRAModelRunnerMixin):

        def model_inputs(tokens_slice: slice, use_dummy_input: bool) -> tuple:
            if use_dummy_input:
+                logger.info(f"NUM DUMMY TOKENS: {num_dummy_tokens} token slize: {tokens_slice}")
+                assert num_dummy_tokens == tokens_slice.stop - tokens_slice.start
                return self._get_dummy_model_inputs(num_dummy_tokens)
            else:
                assert scheduler_output is not None