[TPU][Bugfix] fix OOM issue in CI test (#21550)

Signed-off-by: Chengji Yao <chengjiyao@google.com>
2026-03-17 17:17:12 +08:00 · 2025-07-24 23:01:53 -07:00 · 2025-07-24 23:01:53 -07:00 · 40d86ee412
commit 40d86ee412
parent 85d051f026
1 changed files with 1 additions and 1 deletions
--- a/tests/v1/tpu/test_basic.py
+++ b/tests/v1/tpu/test_basic.py
@ -59,7 +59,7 @@ def test_basic(
                # actually test chunked prompt
                max_num_batched_tokens=1024,
                max_model_len=8192,
-                gpu_memory_utilization=0.7,
+                gpu_memory_utilization=0.95,
                max_num_seqs=max_num_seqs,
                tensor_parallel_size=tensor_parallel_size) as vllm_model:
            vllm_outputs = vllm_model.generate_greedy(example_prompts,