feat: forward mode autograd

* draft: jvp for fwd mode * fix: make sure layout is contiguous * test: fwd mode gradients
DiffAPF · Dec 31, 2023 · e7ceba1 · e7ceba1
1 parent 62f2243
commit e7ceba1
Show file tree

Hide file tree

Showing 2 changed files with 31 additions and 3 deletions.
diff --git a/tests/test_grad.py b/tests/test_grad.py
@@ -49,7 +49,7 @@ def test_low_order_cpu(
     x.requires_grad = x_requires_grad
     zi.requires_grad = zi_requires_grad
 
-    assert gradcheck(LPC.apply, (x, A, zi))
+    assert gradcheck(LPC.apply, (x, A, zi), check_forward_ad=True)
     assert gradgradcheck(LPC.apply, (x, A, zi))
 
 
@@ -86,7 +86,7 @@ def test_low_order_cuda(
     x.requires_grad = x_requires_grad
     zi.requires_grad = zi_requires_grad
 
-    assert gradcheck(LPC.apply, (x, A, zi))
+    assert gradcheck(LPC.apply, (x, A, zi), check_forward_ad=True)
     assert gradgradcheck(LPC.apply, (x, A, zi))
 
 

diff --git a/torchlpc/core.py b/torchlpc/core.py
@@ -96,7 +96,7 @@ def lpc_cuda(x: torch.Tensor, A: torch.Tensor, zi: torch.Tensor) -> torch.Tensor
     else:
         raise NotImplementedError
 
-    return padded_y[:, order:]
+    return padded_y[:, order:].contiguous()
 
 
 @njit(parallel=True)
@@ -132,6 +132,11 @@ def forward(
             )
             y = torch.from_numpy(y).to(x.device, x.dtype)
         ctx.save_for_backward(A, zi, y)
+
+        # for jvp
+        ctx.y = y
+        ctx.A = A
+        ctx.zi = zi
         return y
 
     @staticmethod
@@ -176,3 +181,26 @@ def backward(
             grad_A = unfolded_y * -flipped_grad_x.flip(1).unsqueeze(2)
 
         return grad_x, grad_A, grad_zi
+
+    @staticmethod
+    def jvp(
+        ctx: Any, grad_x: torch.Tensor, grad_A: torch.Tensor, grad_zi: torch.Tensor
+    ) -> torch.Tensor:
+        A, y, zi = ctx.A, ctx.y, ctx.zi
+        *_, order = A.shape
+
+        grad_y = 0
+
+        if grad_x is not None:
+            grad_y_from_x_zi = LPC.apply(grad_x, A, grad_zi)
+            grad_y = grad_y_from_x_zi
+
+        if grad_A is not None:
+            unfolded_y = (
+                torch.cat([zi.flip(1), y[:, :-1]], dim=1).unfold(1, order, 1).flip(2)
+            )
+            grad_A_input = -torch.sum(unfolded_y * grad_A, dim=2)
+            grad_y_from_A = LPC.apply(grad_A_input, A, torch.zeros_like(zi))
+            grad_y = grad_y + grad_y_from_A
+
+        return grad_y