输出无限循环,死循环 #283
Replies: 10 comments 11 replies
-
测试GLM2-6B-32K-int4时我遇到过,问题中加入类似于“字数大于多少”,“尽量多”的诱导长输出的语句时出现这种现象的概率升高,但是到底是哪个语句起到触发作用暂不清楚因此难以稳定复现,之前看过一个视频,里面的必应也出现了这种问题,大概和模型神经元连接有关吧 |
Beta Was this translation helpful? Give feedback.
-
需要复现很简单,让程序跑1000篇文章,就会出现此类问题 |
Beta Was this translation helpful? Give feedback.
-
复现中,在官方demo执行多次的长文章时候,确实有概率遇到了这种问题,mark |
Beta Was this translation helpful? Give feedback.
-
稳定复现 ,使用就浮现,使用32k,其他版本没试验,没有量化使用 |
Beta Was this translation helpful? Give feedback.
-
我就用这个指令就稳定复现:写一篇赞美长城的文章,必须大于2000字; |
Beta Was this translation helpful? Give feedback.
-
该问题没有很好的解决方案
这是模型在训练阶段对这类的提示词训练不足,加入badcase |
Beta Was this translation helpful? Give feedback.
-
更新到最新代码,将 |
Beta Was this translation helpful? Give feedback.
-
不全部生成,直接下一篇
我要求中文,给我生成英文
重复语句
我给你们下我这边用的关键词以及批量生成的py文件,你们这边跑一下,就可以复现问题了
封情のあい
***@***.***
…------------------ 原始邮件 ------------------
发件人: "THUDM/ChatGLM3" ***@***.***>;
发送时间: 2023年11月19日(星期天) 上午10:51
***@***.***>;
***@***.******@***.***>;
主题: Re: [THUDM/ChatGLM3] 输出无限循环,死循环 (Discussion #283)
我们用长城的例子是没有出现这个问题了
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
Beta Was this translation helpful? Give feedback.
-
System Info / 系統信息
python3.10.10
NVIDIA-SMI 535.86.05
Driver Version: 535.86.05
CUDA Version: 12.2
model:chatglm3-6b-32k
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
Reproduction / 复现过程
使用web_demo.py或web_demo2.py都会遇到此问题;
我输入一个对话内容:
例如:写一篇赞美长城的文章,必须大于2000字;
感觉这个2000字限定是个出发条件,或者其他;
然后就死循环了无限输出不带停的,只能手动结束任务;
参考截图:
Expected behavior / 期待表现
正常输出!
Beta Was this translation helpful? Give feedback.
All reactions