format

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
2026-06-07 12:22:13 +08:00 · 2025-11-04 14:40:30 +00:00 · 2025-11-04 14:40:30 +00:00 · aaa0d55587
commit aaa0d55587
parent abf597e542
1 changed files with 0 additions and 2 deletions
--- a/vllm/model_executor/layers/quantization/kernels/scaled_mm/pytorch.py
+++ b/vllm/model_executor/layers/quantization/kernels/scaled_mm/pytorch.py
@ -230,14 +230,12 @@ class RowWiseTorchScaledMMLinearKernel(TorchScaledMMLinearKernel):
 class ChannelWiseTorchScaledMMLinearKernel(TorchScaledMMLinearKernel):
    @classmethod
    def can_implement(cls, c: FP8ScaledMMLinearLayerConfig) -> tuple[bool, str | None]:
        per_tensor_activation_scales = (
            c.activation_quant_key.scale.group_shape.is_per_tensor()
        )
        per_tensor_weight_scales = c.weight_quant_key.scale.group_shape.is_per_tensor()
        if per_tensor_activation_scales and per_tensor_weight_scales:
            return (
                False,