[Misc] fix typo and add detailed log (#28178)

Signed-off-by: Andy Xie <andy.xning@gmail.com>
2026-03-16 15:47:22 +08:00 · 2025-11-09 13:33:46 +08:00 · 2025-11-09 13:33:46 +08:00 · e5e9067e61
commit e5e9067e61
parent 3a7d580343
2 changed files with 2 additions and 2 deletions
--- a/examples/offline_inference/load_sharded_state.py
+++ b/examples/offline_inference/load_sharded_state.py
@ -11,7 +11,7 @@ python save_sharded_state.py \
    --model /path/to/load \
    --quantization deepspeedfp \
    --tensor-parallel-size 8 \
-    --output /path/to/save/sharded/modele
+    --output /path/to/save/sharded/model

 python load_sharded_state.py \
    --model /path/to/saved/sharded/model \
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@ -3035,7 +3035,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
            time_after_load = time.perf_counter()
        self.model_memory_usage = m.consumed_memory
        logger.info_once(
-            "Model loading took %.4f GiB and %.6f seconds",
+            "Model loading took %.4f GiB memory and %.6f seconds",
            self.model_memory_usage / GiB_bytes,
            time_after_load - time_before_load,
            scope="local",