[BugFix] Fix --disable-log-stats in V1 server mode (#17600)

Signed-off-by: Nick Hill <nhill@redhat.com>
2025-12-17 05:55:01 +08:00 · 2025-05-07 21:08:15 -07:00 · 2025-05-07 21:08:15 -07:00 · 3d13ca0e24
commit 3d13ca0e24
parent 66ab3b13c9
2 changed files with 7 additions and 5 deletions
--- a/vllm/v1/engine/async_llm.py
+++ b/vllm/v1/engine/async_llm.py
@ -120,8 +120,9 @@ class AsyncLLM(EngineClient):
            executor_class=executor_class,
            log_stats=self.log_stats,
        )
-        for stat_logger in self.stat_loggers[0]:
+        if self.stat_loggers:
-            stat_logger.log_engine_initialized()
+            for stat_logger in self.stat_loggers[0]:
                stat_logger.log_engine_initialized()
        self.output_handler: Optional[asyncio.Task] = None
        try:
            # Start output handler eagerly if we are in the asyncio eventloop.
--- a/vllm/v1/engine/core_client.py
+++ b/vllm/v1/engine/core_client.py
@ -442,9 +442,10 @@ class MPClient(EngineCoreClient):
            logger.info("Core engine process %d ready.", eng_id)
            identities.discard(eng_id)
            # Setup KV cache config with initialization state from
-            # engine core process.
+            # engine core process. Sum values from all engines in DP case.
-            self.vllm_config.cache_config.num_gpu_blocks = message_dict[
+            num_gpu_blocks = self.vllm_config.cache_config.num_gpu_blocks or 0
-                'num_gpu_blocks']
+            num_gpu_blocks += message_dict['num_gpu_blocks']
            self.vllm_config.cache_config.num_gpu_blocks = num_gpu_blocks
    def _init_core_engines(
        self,