[Bugfix] Avoid Warnings in SparseML Activation Quantization (#5120)

2025-12-16 21:56:06 +08:00 · 2024-05-30 17:04:37 -07:00 · 2024-05-30 17:04:37 -07:00 · b35be5403f
commit b35be5403f
parent 45a1a69b98
1 changed files with 20 additions and 9 deletions
--- a/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_statictensor.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_statictensor.py
@ -89,23 +89,34 @@ class CompressedTensorsW8A8StaticTensor(CompressedTensorsScheme):
                           requires_grad=False)
        layer.register_parameter("weight", weight)
-        set_weight_attrs(weight, {"input_dim": 1, "output_dim": 0})
+        set_weight_attrs(weight, {
-
+            "weight_loader": weight_loader,
-        set_weight_attrs(weight, {"weight_loader": weight_loader})
+            "input_dim": 1,
-
+            "output_dim": 0,
        })
        layer.register_parameter("input_scale", input_scale)
-        set_weight_attrs(input_scale, {"weight_loader": weight_loader})
+        set_weight_attrs(input_scale, {
            "weight_loader": weight_loader,
            "ignore_warning": True,
        })
        layer.register_parameter("input_zero_point", input_zero_point)
-        set_weight_attrs(input_zero_point, {"weight_loader": weight_loader})
+        set_weight_attrs(input_zero_point, {
            "weight_loader": weight_loader,
            "ignore_warning": True,
        })
        layer.register_parameter("weight_scale", weight_scale)
        set_weight_attrs(weight_scale, {"weight_loader": weight_loader})
        set_weight_attrs(
            weight_scale, {
                "weight_loader": weight_loader,
                "shard_splitter": self.scales_shard_splitter,
-                "logical_widths": output_partition_sizes
+                "logical_widths": output_partition_sizes,
                "ignore_warning": True,
            })
        layer.register_parameter("weight_zero_point", weight_zero_point)
-        set_weight_attrs(weight_zero_point, {"weight_loader": weight_loader})
+        set_weight_attrs(weight_zero_point, {
            "weight_loader": weight_loader,
            "ignore_warning": True
        })
    def apply_weights(self, layer: torch.nn.Module, x: torch.Tensor):
        weight = layer.weight