[PERF] Use faster way of decode in tokenizer: avoid useless list-to-list conversion (#20000)

Signed-off-by: Vadim Gimpelson <vadim.gimpelson@centml.ai>
2025-12-15 00:45:24 +08:00 · 2025-08-02 12:43:52 +04:00 · 2025-08-02 12:43:52 +04:00 · 58eee5f2e0
commit 58eee5f2e0
parent 067c34a155
1 changed files with 4 additions and 3 deletions
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@ -50,11 +50,12 @@ def decode_tokens(
    `skip_special_tokens=None` means to use the backend's default
    settings.
    """
+    decode_method = getattr(tokenizer, "_decode", tokenizer.decode)
    if skip_special_tokens is not None:
-        return tokenizer.decode(token_ids,
+        return decode_method(token_ids,
                             skip_special_tokens=skip_special_tokens)

-    return tokenizer.decode(token_ids)
+    return decode_method(token_ids)


 def encode_tokens(