use device param in load_model method (#13037)

2026-01-26 20:34:31 +08:00 · 2025-02-19 16:05:02 +08:00 · 2025-02-19 16:05:02 +08:00 · fdc5df6f54
commit fdc5df6f54
parent 3b05cd4555
1 changed files with 1 additions and 1 deletions
--- a/vllm/worker/model_runner.py
+++ b/vllm/worker/model_runner.py
@ -1107,7 +1107,7 @@ class GPUModelRunnerBase(ModelRunnerBase[TModelInputForGPU]):

    def load_model(self) -> None:
        logger.info("Starting to load model %s...", self.model_config.model)
-        with DeviceMemoryProfiler() as m:
+        with DeviceMemoryProfiler(self.device) as m:
            self.model = get_model(vllm_config=self.vllm_config)

        self.model_memory_usage = m.consumed_memory