Fill TorchSDPAAttentionMetadata seq_lens_field for prefill (#10799)

Signed-off-by: Max de Bayser <mbayser@br.ibm.com>
2026-01-20 18:54:34 +08:00 · 2024-12-01 23:05:32 -03:00 · 2024-12-01 23:05:32 -03:00 · e25810ae29
commit e25810ae29
parent 073a4bd1c0
1 changed files with 5 additions and 1 deletions
--- a/vllm/attention/backends/torch_sdpa.py
+++ b/vllm/attention/backends/torch_sdpa.py
@ -341,7 +341,11 @@ class TorchSDPAMetadataBuilder(AttentionMetadataBuilder[TorchSDPAMetadata]):
            )
        else:
            block_tables = torch.tensor([])
-            seq_lens_tensor = torch.tensor([])
+            seq_lens_tensor = torch.tensor(
+                input_data.seq_lens[:input_data.num_prefills],
+                dtype=torch.int32,
+                device="cpu",
+            )

        # For multi-modal models
        placeholder_index_maps = None