scverse · fhausmann · May 5, 2020 · May 5, 2020 · May 6, 2020 · May 7, 2020
diff --git a/anndata/_core/aligned_mapping.py b/anndata/_core/aligned_mapping.py
@@ -3,6 +3,7 @@
 from typing import Union, Optional, Type, ClassVar, TypeVar  # Special types
 from typing import Iterator, Mapping, Sequence  # ABCs
 from typing import Tuple, List, Dict  # Generic base types
+import weakref
 
 import numpy as np
 import pandas as pd
@@ -47,8 +48,8 @@ def _ipython_key_completions_(self) -> List[str]:
     def _validate_value(self, val: V, key: str) -> V:
         """Raises an error if value is invalid"""
         for i, axis in enumerate(self.axes):
-            if self.parent.shape[axis] != val.shape[i]:
-                right_shape = tuple(self.parent.shape[a] for a in self.axes)
+            if self.parent_shape[axis] != val.shape[i]:
+                right_shape = tuple(self.parent_shape[a] for a in self.axes)
                 raise ValueError(
                     f"Value passed for key {key!r} is of incorrect shape. "
                     f"Values of {self.attrname} must match dimensions "
@@ -81,6 +82,10 @@ def is_view(self) -> bool:
     def parent(self) -> Union["anndata.AnnData", "raw.Raw"]:
         return self._parent
 
+    @property
+    def parent_shape(self) -> Tuple[int, int]:
+        return self._parent.shape
+
     def copy(self):
         d = self._actual_class(self.parent, self._axis)
         for k, v in self.items():
@@ -222,15 +227,48 @@ def __init__(
         axis: int,
         vals: Union[Mapping, AxisArraysBase, None] = None,
     ):
-        self._parent = parent
+        if isinstance(parent, anndata.AnnData):
+            self._parent_ref = weakref.ref(parent)
+            self._is_weak = True
+        else:
+            self._parent_ref = parent
+            self._is_weak = False
         if axis not in (0, 1):
             raise ValueError()
         self._axis = axis
+        self._parent_shape = parent.shape
         self.dim_names = (parent.obs_names, parent.var_names)[self._axis]
         self._data = dict()
         if vals is not None:
             self.update(vals)
 
+    @property
+    def _parent(self) -> Union["anndata.AnnData", "raw.Raw"]:
+        if self._is_weak:
+            return self._parent_ref()
+        return self._parent_ref
+
+    @property
+    def parent_shape(self) -> Tuple[int, int]:
+        if self._parent:
+            self._parent_shape = self._parent.shape
+        return self._parent_shape
+
+    @parent_shape.setter
+    def parent_shape(self, shape: Tuple[int, int]):
+        self._parent_shape = shape
+
+    def __getstate__(self):
+        state = self.__dict__.copy()
+        if self._is_weak:
+            state["_parent_ref"] = state["_parent_ref"]()
+        return state
+
+    def __setstate__(self, state):
+        self.__dict__ = state.copy()
+        if self._is_weak:
+            self.__dict__["_parent_ref"] = weakref.ref(state["_parent_ref"])
+
 
 class AxisArraysView(AlignedViewMixin, AxisArraysBase):
     def __init__(
@@ -270,11 +308,24 @@ def copy(self) -> "Layers":
 
 class Layers(AlignedActualMixin, LayersBase):
     def __init__(self, parent: "anndata.AnnData", vals: Optional[Mapping] = None):
-        self._parent = parent
+        self._parent_ref = weakref.ref(parent)
         self._data = dict()
         if vals is not None:
             self.update(vals)
 
+    @property
+    def _parent(self):
+        return self._parent_ref()
+
+    def __getstate__(self):
+        state = self.__dict__.copy()
+        state["_parent_ref"] = state["_parent_ref"]()
+        return state
+
+    def __setstate__(self, state):
+        self.__dict__ = state.copy()
+        self.__dict__["_parent_ref"] = weakref.ref(state["_parent_ref"])
+
 
 class LayersView(AlignedViewMixin, LayersBase):
     def __init__(
@@ -320,14 +371,27 @@ class PairwiseArrays(AlignedActualMixin, PairwiseArraysBase):
     def __init__(
         self, parent: "anndata.AnnData", axis: int, vals: Optional[Mapping] = None,
     ):
-        self._parent = parent
+        self._parent_ref = weakref.ref(parent)
         if axis not in (0, 1):
             raise ValueError()
         self._axis = axis
         self._data = dict()
         if vals is not None:
             self.update(vals)
 
+    @property
+    def _parent(self):
+        return self._parent_ref()
+
+    def __getstate__(self):
+        state = self.__dict__.copy()
+        state["_parent_ref"] = state["_parent_ref"]()
+        return state
+
+    def __setstate__(self, state):
+        self.__dict__ = state.copy()
+        self.__dict__["_parent_ref"] = weakref.ref(state["_parent_ref"])
+
 
 class PairwiseArraysView(AlignedViewMixin, PairwiseArraysBase):
     def __init__(

diff --git a/anndata/_core/anndata.py b/anndata/_core/anndata.py
@@ -1977,3 +1977,9 @@ def _get_and_delete_multicol_field(self, a, key_multicol):
         values = getattr(self, a)[keys].values
         getattr(self, a).drop(keys, axis=1, inplace=True)
         return values
+
+    def __del__(self):
+        if isinstance(self._obsm, AxisArrays):
+            self._obsm.parent_shape = self.shape
+        if isinstance(self._varm, AxisArrays):
+            self._varm.parent_shape = self.shape
diff --git a/anndata/_core/file_backing.py b/anndata/_core/file_backing.py
@@ -1,6 +1,7 @@
 from os import PathLike
 from pathlib import Path
 from typing import Optional, Union, Iterator
+import weakref
 
 import h5py
 
@@ -18,13 +19,26 @@ def __init__(
         filename: Optional[PathLike] = None,
         filemode: Optional[Literal["r", "r+"]] = None,
     ):
-        self._adata = adata
+        self._adata_ref = weakref.ref(adata)
         self.filename = filename
         self._filemode = filemode
         self._file = None
         if filename:
             self.open()
 
+    def __getstate__(self):
+        state = self.__dict__.copy()
+        state["_adata_ref"] = state["_adata_ref"]()
+        return state
+
+    def __setstate__(self, state):
+        self.__dict__ = state.copy()
+        self.__dict__["_adata_ref"] = weakref.ref(state["_adata_ref"])
+
+    @property
+    def _adata(self):
+        return self._adata_ref()
+
     def __repr__(self) -> str:
         if self.filename is None:
             return "Backing file manager: no file is set."

diff --git a/anndata/tests/test_base.py b/anndata/tests/test_base.py
@@ -1,4 +1,5 @@
 from itertools import product
+import tracemalloc
 
 import numpy as np
 from numpy import ma
@@ -573,3 +574,49 @@ def assert_eq_not_id(a, b):
         assert_eq_not_id(map_sprs.keys(), map_copy.keys())
         for key in map_sprs.keys():
             assert_eq_not_id(map_sprs[key], map_copy[key])
+
+
+def test_memory_usage():
+    N, M = 100, 200
+    RUNS = 10
+    obs_df = pd.DataFrame(
+        dict(
+            cat=pd.Categorical(np.arange(N, dtype=int)),
+            int=np.arange(N, dtype=int),
+            float=np.arange(N, dtype=float),
+            obj=[str(i) for i in np.arange(N, dtype=int)],
+        ),
+        index=[f"cell{i}" for i in np.arange(N, dtype=int)],
+    )
+    var_df = pd.DataFrame(
+        dict(
+            cat=pd.Categorical(np.arange(M, dtype=int)),
+            int=np.arange(M, dtype=int),
+            float=np.arange(M, dtype=float),
+            obj=[str(i) for i in np.arange(M, dtype=int)],
+        ),
+        index=[f"gene{i}" for i in np.arange(M, dtype=int)],
+    )
+
+    def get_memory(snapshot, key_type="lineno"):
+        snapshot = snapshot.filter_traces(
+            (
+                tracemalloc.Filter(False, "<frozen importlib._bootstrap>"),
+                tracemalloc.Filter(False, "<unknown>"),
+            )
+        )
+        total = sum(stat.size for stat in snapshot.statistics(key_type))
+        return total
+
+    total = np.zeros(RUNS)
+    # Intantiate the anndata object first before memory calculation to
+    # only look at memory changes due to deletion of such a object.
+    adata = AnnData(X=np.random.random((N, M)), obs=obs_df, var=var_df)
+    adata.X[0, 0] = 1.0  # Disable Codacy issue
+    tracemalloc.start()
+    for i in range(RUNS):
+        adata = AnnData(X=np.random.random((N, M)), obs=obs_df, var=var_df)
+        total[i] = get_memory(tracemalloc.take_snapshot())
+    tracemalloc.stop()
+    relative_increase = total[:-1] / total[1:]
+    np.testing.assert_allclose(relative_increase, 1.0, atol=0.2)