Remove max_num_seqs in latency benchmark script (#1855)

2026-06-08 15:02:17 +08:00 · 2023-11-30 00:00:32 -08:00 · 2023-11-30 00:00:32 -08:00 · 51d3cb951d
commit 51d3cb951d
parent e74b1736a1
1 changed files with 0 additions and 1 deletions
--- a/benchmarks/benchmark_latency.py
+++ b/benchmarks/benchmark_latency.py
@ -19,7 +19,6 @@ def main(args: argparse.Namespace):
        tokenizer=args.tokenizer,
        quantization=args.quantization,
        tensor_parallel_size=args.tensor_parallel_size,
-        max_num_seqs=args.batch_size,
        trust_remote_code=args.trust_remote_code,
        dtype=args.dtype,
    )