updated

Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>
2026-07-12 08:37:09 +08:00 · 2025-03-26 01:45:24 +00:00 · 2025-03-26 01:45:24 +00:00 · 7c16128106
commit 7c16128106
parent 7bb88b2edc
1 changed files with 27 additions and 0 deletions
--- a/benchmarks/sweep.sh
+++ b/benchmarks/sweep.sh
@ -0,0 +1,27 @@
+MODEL=meta-llama/Llama-3.1-8B-Instruct
+REQUEST_RATES=(1 10 15 20)
+INPUT_LEN=1000
+OUTPUT_LEN=100
+TOTAL_SECONDS=120
+
+for REQUEST_RATE in "${REQUEST_RATES[@]}";
+do
+    NUM_PROMPTS=$(($TOTAL_SECONDS * $REQUEST_RATE))
+    
+    echo ""
+    echo "===== RUNNING $MODEL FOR $NUM_PROMPTS PROMPTS WITH $REQUEST_RATE QPS ====="
+    echo ""
+
+    python3 vllm/benchmarks/benchmark_serving.py \
+        --model $MODEL \
+        --dataset-name random \
+        --random-input-len $INPUT_LEN \
+        --random-output-len $OUTPUT_LEN \
+        --request-rate $REQUEST_RATE \
+        --num-prompts $NUM_PROMPTS \
+        --seed $REQUEST_RATE \
+        --ignore-eos \
+        --result-filename "$FRAMEWORK-results.json" \
+        --save-result
+
+done