[Minor] Fix typo and remove unused code (#2305)

2025-12-16 10:26:07 +08:00 · 2024-01-03 11:23:15 +08:00 · 2024-01-03 11:23:15 +08:00 · 9140561059
commit 9140561059
parent 77af974b40
2 changed files with 1 additions and 22 deletions
--- a/vllm/model_executor/layers/sampler.py
+++ b/vllm/model_executor/layers/sampler.py
@ -112,27 +112,6 @@ def _prune_hidden_states(
                                      sampling_metadata.selected_token_indices)


-def _get_prompt_and_output_tokens(
-    sampling_metadata: SamplingMetadata,
-) -> Tuple[List[List[int]], List[List[int]]]:
-    prompt_tokens: List[List[int]] = []
-    output_tokens: List[List[int]] = []
-    for i, seq_group in enumerate(sampling_metadata.seq_groups):
-        seq_ids, sampling_params = seq_group
-        if (i < sampling_metadata.num_prompts
-                and sampling_params.prompt_logprobs is not None):
-            # NOTE: prompt token positions do not need output tokens to
-            # compute penalties.
-            prompt_len = sampling_metadata.prompt_lens[i]
-            prompt_tokens.extend([] for _ in range(prompt_len - 1))
-            output_tokens.extend([] for _ in range(prompt_len - 1))
-        for seq_id in seq_ids:
-            seq_data = sampling_metadata.seq_data[seq_id]
-            prompt_tokens.append(seq_data.prompt_token_ids)
-            output_tokens.append(seq_data.output_token_ids)
-    return prompt_tokens, output_tokens
-
-
 def _get_bin_counts_and_mask(
    tokens: torch.Tensor,
    vocab_size: int,
--- a/vllm/sampling_params.py
+++ b/vllm/sampling_params.py
@ -100,7 +100,7 @@ class SamplingParams:
        temperature: float = 1.0,
        top_p: float = 1.0,
        top_k: int = -1,
-        min_p: int = 0.0,
+        min_p: float = 0.0,
        use_beam_search: bool = False,
        length_penalty: float = 1.0,
        early_stopping: Union[bool, str] = False,