add missing arg

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
2026-07-06 03:47:18 +08:00 · 2025-11-03 07:09:52 +00:00 · 2025-11-03 07:09:52 +00:00 · 7794009661
commit 7794009661
parent b13c4bb25c
1 changed files with 1 additions and 0 deletions
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/flash_infer.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/flash_infer.py
@ -22,6 +22,7 @@ def flashinfer_w8a8_scaled_mm(
    As: torch.Tensor,
    Bs: torch.Tensor,
    bias: torch.Tensor,
+    output_shape: list,
 ) -> torch.Tensor:
    return flashinfer_scaled_fp8_mm(
        A, B, out_dtype=out_dtype, scale_a=As, scale_b=Bs, bias=bias