Help！RuntimeError: a leaf Variable that requires grad is being used in an in-place operation. #203

doqizuo · 2024-11-29T14:25:15Z

creating data loader...
creating model and diffusion...
training...
Traceback (most recent call last):
File "scripts/segmentation_train.py", line 118, in
main()
File "scripts/segmentation_train.py", line 70, in main
TrainLoop(
File "D:\MedSegDiff-master.\guided_diffusion\train_util.py", line 83, in init
self._load_and_sync_parameters()
File "D:\MedSegDiff-master.\guided_diffusion\train_util.py", line 139, in _load_and_sync_parameters
dist_util.sync_params(self.model.parameters())
File "D:\MedSegDiff-master.\guided_diffusion\dist_util.py", line 111, in sync_params
dist.broadcast(p, 0)
File "D:\Anaconda\envs\sg\lib\site-packages\torch\distributed\distributed_c10d.py", line 1195, in broadcast
work.wait()
RuntimeError: a leaf Variable that requires grad is being used in an in-place operation.

Plz！Tell me where the problem lies? and why? Hope someone nice can help me~ Thanks!!!

Eins152 · 2024-12-04T01:05:10Z

Try add p = p + 0 in the sync_params function within dist_util.py as follows:
def sync_params(params):
"""
Synchronize a sequence of tensors across ranks from rank 0.
"""
for p in params:
with th.no_grad():
p = p + 0
dist.broadcast(p, 0)

Eins152 · 2024-12-04T01:10:58Z

#84

Issues-translate-bot · 2024-12-04T01:11:09Z

Bot detected the issue body's language is not English, translate it automatically. 👯👭🏻🧑‍🤝‍🧑👫🧑🏿‍🤝‍🧑🏻👩🏾‍🤝‍👨🏿👬🏿

#84

doqizuo · 2024-12-06T13:55:42Z

Try add p = p + 0 in the sync_params function within dist_util.py as follows: def sync_params(params): """ Synchronize a sequence of tensors across ranks from rank 0. """ for p in params: with th.no_grad(): p = p + 0 dist.broadcast(p, 0)

THANKSSSSSS!!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Help！RuntimeError: a leaf Variable that requires grad is being used in an in-place operation. #203

Help！RuntimeError: a leaf Variable that requires grad is being used in an in-place operation. #203

doqizuo commented Nov 29, 2024

Eins152 commented Dec 4, 2024

Eins152 commented Dec 4, 2024

Issues-translate-bot commented Dec 4, 2024

doqizuo commented Dec 6, 2024

Help！RuntimeError: a leaf Variable that requires grad is being used in an in-place operation. #203

Help！RuntimeError: a leaf Variable that requires grad is being used in an in-place operation. #203

Comments

doqizuo commented Nov 29, 2024

Eins152 commented Dec 4, 2024

Eins152 commented Dec 4, 2024

Issues-translate-bot commented Dec 4, 2024

doqizuo commented Dec 6, 2024