v100下无法使用int8训练 #406

lucasjinreal · 2023-05-25T07:10:29Z

load_in_8bit 在v100 下非常慢，但是好像用float16 会loss 起飞，用float32 会OOM，怎么弄

uuser0748 · 2023-05-26T08:30:40Z

v100就是不支持int8。
Facico/Chinese-Vicuna#39
参考这个

xianghuisun · 2023-05-26T12:29:34Z

https://github.com/LianjiaTech/BELLE/blob/main/train/docs/FAQ.md
可参考FAQ中关于V100机器上8bit量化训练失败或loss不正常

xianghuisun · 2023-05-26T12:30:35Z

load_in_8bit 在v100 下非常慢，但是好像用float16 会loss 起飞，用float32 会OOM，怎么弄

您如果是多卡V100，也可采用stage3，应该也能训起来

xianghuisun closed this as completed May 26, 2023

zhangzhenyu13 mentioned this issue May 29, 2023

为什么BELLE经过GPTQ量化（8bit/4bit）后，模型的推理速度变慢了很多呢 #144

Closed

Provide feedback