-
Notifications
You must be signed in to change notification settings - Fork 36
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Pretrain performance? #5
Comments
我没记错的话mrr_5应该是0.047左右,按照论文提供的超参数应该是可以得到这个值的,建议看下是否converge |
100+个batch之后训练集和验证集的loss下降都很不明显,判断converge主要是看mrr_5这几个数值的变化情况吗? |
我记得代码会隔一段时间打印accuracy,采用accuracy判断更可靠些。请核对一下相关超参数跟论文中是否有出入,100个batch肯定不行,可以算一下总样本有多少,100个batch可能还不到总样本的十分之一,至少需要pre-train 10个小时以上 |
感谢原教授 |
demo写法主要是未来让刚学习这个算法的同学好理解,可以的,pre-train可以包含更多的用户,finetune可以仅仅其中一部分用户,建议写个词典对应准确就可以,不要错位,我代码是最简单的写法,主要是为了好读 |
demo写法主要是未来让刚学习这个算法的同学好理解,可以的,pre-train可以包含更多的用户,finetune可以仅仅其中一部分用户,建议写个词典对应准确就可以,不要错位,我代码是最简单的写法,主要是为了好读 |
hello, 这里提到的词典对应、不要错位是啥意思?我理解finetune的user ids应该是pre-train用到的user ids的子集即可? |
就是这个意思。我为了使用简单就没有加userID,别对错号
从 Windows 版邮件<https://go.microsoft.com/fwlink/?LinkId=550986>发送
发件人: ***@***.***>
发送时间: 2022年5月11日 15:45
收件人: ***@***.***>
抄送: Fajie YUAN ***@***.***>; ***@***.***>
主题: Re: [fajieyuan/SIGIR2020_peterrec] Pretrain performance? (#5)
hello, 这里提到的词典对应、不要错位是啥意思?我理解finetune的user ids应该是pre-train用到的user ids的子集即可?
―
Reply to this email directly, view it on GitHub<#5 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/ADTZGLJWMCQLEBESLJ25I43VJNQR3ANCNFSM43R5FAMA>.
You are receiving this because you commented.Message ID: ***@***.***>
|
在ColdRec2数据集上pretrain,收敛的时候正常的HR@5应该是多少?
'mrr_5:', 0.030770833333333344, 'hit_5:', 0.05375, 'ndcg_5:', 0.03643626106347057
这个数值范围是不是预训练不成功?
The text was updated successfully, but these errors were encountered: