OffloadingConnector: Fix GPU block tracking bug (#25856)

Signed-off-by: Or Ozeri <oro@il.ibm.com>
2026-03-16 15:47:22 +08:00 · 2025-09-30 22:53:04 +03:00 · 2025-09-30 22:53:04 +03:00 · cfd302db9b
commit cfd302db9b
parent fb610ae684
1 changed files with 3 additions and 2 deletions
--- a/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/offloading_connector.py
@ -278,8 +278,9 @@ class OffloadingConnectorScheduler:
                req, start_idx=start_block_idx, end_idx=num_blocks)
            store_output = self.manager.prepare_store(new_block_hashes)
            if store_output is None:
-                logger.warning("Cannot store %s blocks", num_new_blocks)
-                break
+                logger.warning("Request %s: cannot store %s blocks", req_id,
+                               num_new_blocks)
+                continue

            self._next_stored_block_idx[req_id] = num_blocks