[BugFix] Fix seeded random sampling with encoder-decoder models (#8870)

Co-authored-by: Roger Wang <ywang@roblox.com>
2025-12-13 17:25:38 +08:00 · 2024-09-29 10:43:14 +01:00 · 2024-09-29 10:43:14 +01:00 · 31f46a0d35
commit 31f46a0d35
parent 3d49776bbb
1 changed files with 3 additions and 1 deletions
--- a/vllm/worker/enc_dec_model_runner.py
+++ b/vllm/worker/enc_dec_model_runner.py
@ -268,11 +268,13 @@ class EncoderDecoderModelRunner(GPUModelRunnerBase[EncoderDecoderModelInput]):
            encoder_input_positions=encoder_input_positions_tensor,
        )
        generators = self.get_generators(finished_requests_ids)
        sampling_metadata = SamplingMetadata.prepare(seq_group_metadata_list,
                                                     model_input.seq_lens,
                                                     model_input.query_lens,
                                                     self.device,
-                                                     self.pin_memory)
+                                                     self.pin_memory,
                                                     generators=generators)
        is_prompt = (seq_group_metadata_list[0].is_prompt
                     if seq_group_metadata_list else None)
        return dataclasses.replace(model_input,