[Misc] Remove unused slot_mapping buffer (#23502)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
2026-07-18 20:37:12 +08:00 · 2025-08-24 14:03:36 -07:00 · 2025-08-24 14:03:36 -07:00 · ad78868450
commit ad78868450
parent e2db1164a1
1 changed files with 0 additions and 3 deletions
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@ -254,9 +254,6 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
        self.seq_lens = torch.zeros(self.max_num_reqs,
                                    dtype=torch.int32,
                                    device=self.device)
-        self.slot_mapping = torch.zeros(self.max_num_tokens,
-                                        dtype=torch.int64,
-                                        device=self.device)

        # None in the first PP rank. The rest are set after load_model.
        self.intermediate_tensors: Optional[IntermediateTensors] = None