From a25866ac8d8f6eb50e18db65e856b8330854c878 Mon Sep 17 00:00:00 2001
From: zh Wang <rekind133@outlook.com>
Date: Thu, 10 Apr 2025 01:03:34 +0800
Subject: [PATCH] [Bugfix] Fix profiling.py (#16202)

Signed-off-by: zh Wang <rekind133@outlook.com>
---
 examples/offline_inference/profiling.py | 5 ++---
 1 file changed, 2 insertions(+), 3 deletions(-)

diff --git a/examples/offline_inference/profiling.py b/examples/offline_inference/profiling.py
index ffa76b4e4f2c..6e1d4722440a 100644
--- a/examples/offline_inference/profiling.py
+++ b/examples/offline_inference/profiling.py
@@ -234,9 +234,8 @@ def run_profile(context: ProfileContext, csv_output: Optional[str],
             sampling_params.max_tokens = next(output_len_generator)
             assert isinstance(sampling_params.max_tokens, int)
 
-            prompt_token_ids = torch.randint(
-                llm.llm_engine.model_config.get_vocab_size(),
-                size=(prompt_len, )).tolist()
+            prompt_token_ids = torch.randint(llm.get_tokenizer().vocab_size,
+                                             size=(prompt_len, )).tolist()
 
             llm.llm_engine.add_request(
                 request_id=f"seq{i}",