[Bugfix] fix adding bias twice in ipex GPTQ quantization (#18363)

Signed-off-by: rand-fly <randfly@outlook.com>
2025-12-25 22:28:44 +08:00 · 2025-05-20 15:54:33 +08:00 · 2025-05-20 15:54:33 +08:00 · bca55b556f
commit bca55b556f
parent d981396778
1 changed files with 0 additions and 2 deletions
--- a/vllm/model_executor/layers/quantization/ipex_quant.py
+++ b/vllm/model_executor/layers/quantization/ipex_quant.py
@ -181,8 +181,6 @@ class IPEXGPTQLinearMethod(GPTQLinearMethod):
              bias: Optional[torch.Tensor] = None) -> torch.Tensor:
        reshaped_x = x.reshape(-1, x.shape[-1])
        out = layer.ipex_qlinear(reshaped_x)
-        if bias is not None:
-            out.add_(bias)
        return out.reshape(x.shape[:-1] + (layer.ipex_output_size, ))