Add dtype=torch.float32

2025-12-08 20:34:32 +08:00 · 2025-08-25 11:47:09 -07:00 · 2025-08-25 11:47:09 -07:00 · d6d7cc9860
commit d6d7cc9860
parent f6e34dd267
1 changed files with 2 additions and 2 deletions
--- a/inference/model.py
+++ b/inference/model.py
@ -185,7 +185,7 @@ class Linear(nn.Module):
        else:
            self.register_parameter("scale", None)
        if bias:
-            self.bias = nn.Parameter(torch.empty(out_features))
+            self.bias = nn.Parameter(torch.empty(out_features, dtype=torch.float32))
        else:
            self.register_parameter("bias", None)

@ -558,7 +558,7 @@ class Gate(nn.Module):
        self.score_func = args.score_func
        self.route_scale = args.route_scale
        self.weight = nn.Parameter(torch.empty(args.n_routed_experts, args.dim))
-        self.bias = nn.Parameter(torch.empty(args.n_routed_experts)) if self.dim == 7168 else None
+        self.bias = nn.Parameter(torch.empty(args.n_routed_experts, dtype=torch.float32)) if self.dim == 7168 else None

    def forward(self, x: torch.Tensor) -> Tuple[torch.Tensor, torch.Tensor]:
        """