使用finetune_hf.py进行65条数据的微调，报cuda out of memory，是需要添加什么配置的吗？ #1085

zhaohai7206 · 2024-04-03T08:53:33Z

zhaohai7206
Apr 3, 2024

我这是两张4080卡，都是16G的，执行环境也是在conda，按照requirement里面进行的python包安装，chatglm3-6模型，从https://hf-mirror.com/THUDM/chatglm3-6b/tree/main上面下载的，但是执行python finetune_hf.py ../../AdvertiseGen chatglm/chatglm3-6b configs/lora.yaml 进行微调的时候就会报oom

请问下，是需要配置什么的吗，代码文件没有任何修改的

zhaohai7206 · 2024-04-03T08:56:25Z

zhaohai7206
Apr 3, 2024
Author

看晚上有人使用过python finetune_hf.py AdvertiseGen chatglm/chatglm3-6b configs/lora.yaml output，后面参数多了一个output，但是我执行的会报下面的问题，并且output目录没有任何生成任何文件

1 reply

zhaohai7206 Apr 9, 2024
Author

有哪位大佬帮忙解决下的吗，求助啊

zRzRzRzRzRzRzR · 2024-04-13T16:10:52Z

zRzRzRzRzRzRzR
Apr 13, 2024
Maintainer

16G可能不够的话，你可以降低一下max token 16G太极限了

1 reply

zhaohai7206 Apr 22, 2024
Author

最上面输出提示里面显示需要17179869184.00G，这个是什么意思，目前应该不可能有这么大内存的吧，还是说需要设置什么降低这个内存使用需求的

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

使用finetune_hf.py进行65条数据的微调，报cuda out of memory，是需要添加什么配置的吗？ #1085

{{title}}

Replies: 2 comments 2 replies

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

使用finetune_hf.py进行65条数据的微调，报cuda out of memory，是需要添加什么配置的吗？ #1085

zhaohai7206 Apr 3, 2024

Replies: 2 comments · 2 replies

zhaohai7206 Apr 3, 2024 Author

zhaohai7206 Apr 9, 2024 Author

zRzRzRzRzRzRzR Apr 13, 2024 Maintainer

zhaohai7206 Apr 22, 2024 Author

zhaohai7206
Apr 3, 2024

Replies: 2 comments 2 replies

zhaohai7206
Apr 3, 2024
Author

zhaohai7206 Apr 9, 2024
Author

zRzRzRzRzRzRzR
Apr 13, 2024
Maintainer

zhaohai7206 Apr 22, 2024
Author