`reset_parameters` fixes #1199

carmocca · 2024-03-26T18:25:14Z

No description provided.

Andrei-Aksionov · 2024-03-26T18:44:16Z

litgpt/adapter.py

@@ -151,7 +151,8 @@ def scaled_dot_product_attention(
        return y + self.gating_factor * ay

    def reset_parameters(self) -> None:
-        torch.nn.init.zeros_(self.gating_factor)
+        if hasattr(self, "gating_factor"):


Good catch.
Adapter is added only at config.adapter_start_layer, so not all layers have it.

litgpt/lora.py

Andrei-Aksionov · 2024-03-26T18:50:58Z

litgpt/lora.py

-            self.lora_A = nn.Parameter(torch.zeros((r, in_features)))
-            self.lora_B = nn.Parameter(torch.zeros((out_features, r)))
+            self.lora_A = nn.Parameter(torch.empty((r, in_features)))
+            self.lora_B = nn.Parameter(torch.empty((out_features, r)))
            self.scaling = self.lora_alpha / self.r
            self.reset_parameters()


I feel like reset_parameters should be called automatically by torch during a layer creation. But I highly unconfident about that.

It's more of a silent convention. Only FSDP calls it

reset_parameters fixes

8181fd2

carmocca self-assigned this Mar 26, 2024

carmocca requested review from awaelchli and lantiga as code owners March 26, 2024 18:25

carmocca requested a review from Andrei-Aksionov March 26, 2024 18:39

Andrei-Aksionov reviewed Mar 26, 2024

View reviewed changes

litgpt/lora.py Show resolved Hide resolved

Andrei-Aksionov reviewed Mar 26, 2024

View reviewed changes

LoRAQKVLinear too

9eca5ba

Andrei-Aksionov approved these changes Mar 26, 2024

View reviewed changes

awaelchli approved these changes Mar 26, 2024

View reviewed changes

carmocca merged commit d296c98 into main Mar 26, 2024
6 of 8 checks passed

carmocca deleted the carmocca/reset-parameters-fixes branch March 26, 2024 19:33

rasbt pushed a commit that referenced this pull request Apr 3, 2024

reset_parameters fixes (#1199)

9f4ca17

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

`reset_parameters` fixes #1199

`reset_parameters` fixes #1199

carmocca commented Mar 26, 2024

Andrei-Aksionov Mar 26, 2024

Andrei-Aksionov Mar 26, 2024

carmocca Mar 26, 2024

Andrei-Aksionov Mar 26, 2024

reset_parameters fixes #1199

reset_parameters fixes #1199

Conversation

carmocca commented Mar 26, 2024

Andrei-Aksionov Mar 26, 2024

Choose a reason for hiding this comment

Andrei-Aksionov Mar 26, 2024

Choose a reason for hiding this comment

carmocca Mar 26, 2024

Choose a reason for hiding this comment

Andrei-Aksionov Mar 26, 2024

Choose a reason for hiding this comment

`reset_parameters` fixes #1199

`reset_parameters` fixes #1199