Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于复现数据和论文数据差异大的问题 #90

Open
MiloSciA opened this issue Oct 17, 2024 · 4 comments
Open

关于复现数据和论文数据差异大的问题 #90

MiloSciA opened this issue Oct 17, 2024 · 4 comments
Labels
question Further information is requested

Comments

@MiloSciA
Copy link

大佬您好,按照您的代码我看ISCX2016VPN这个数据集中flow级别按Service和App两个级别进行分类,复现数据跟论文差异很大,只有80%,我分别使用了A100做全精度微调和4090结合Apex做混合精度微调,结果都一样,如下图,想请教一下大佬我还需要怎么调整一下参数哇
image

{4C05F528-6FDC-4EE3-9FE7-6D7B5B636432}

@CJYKeepLearning
Copy link

MiloSciA大佬您好,关于这篇文章希望与您请教交流,可否留下您的联系方式,以便联系。

@linwhitehat linwhitehat added the question Further information is requested label Nov 1, 2024
@linwhitehat
Copy link
Owner

大佬您好,按照您的代码我看ISCX2016VPN这个数据集中flow级别按Service和App两个级别进行分类,复现数据跟论文差异很大,只有80%,我分别使用了A100做全精度微调和4090结合Apex做混合精度微调,结果都一样,如下图,想请教一下大佬我还需要怎么调整一下参数哇 image

{4C05F528-6FDC-4EE3-9FE7-6D7B5B636432}

你好,感谢对我们工作的关注。你可以详细展示你的微调参数设置吗?同时使用的数据集是我们处理好的数据吗?

@MiloSciA
Copy link
Author

MiloSciA commented Nov 3, 2024

大佬您好,按照您的代码我看ISCX2016VPN这个数据集中flow级别按Service和App两个级别进行分类,复现数据跟论文差异很大,只有80%,我分别使用了A100做全精度微调和4090结合Apex做混合精度微调,结果都一样,如下图,想请教一下大佬我还需要怎么调整一下参数哇 image
{4C05F528-6FDC-4EE3-9FE7-6D7B5B636432}

你好,感谢对我们工作的关注。你可以详细展示你的微调参数设置吗?同时使用的数据集是我们处理好的数据吗?

您好,参数与您github仓库内容一致,数据是参考您github仓库里的代码流程进行的,app和service的划分是参考了您之前的几个issue里的划分

@linwhitehat
Copy link
Owner

大佬您好,按照您的代码我看ISCX2016VPN这个数据集中flow级别按Service和App两个级别进行分类,复现数据跟论文差异很大,只有80%,我分别使用了A100做全精度微调和4090结合Apex做混合精度微调,结果都一样,如下图,想请教一下大佬我还需要怎么调整一下参数哇 image
{4C05F528-6FDC-4EE3-9FE7-6D7B5B636432}

你好,感谢对我们工作的关注。你可以详细展示你的微调参数设置吗?同时使用的数据集是我们处理好的数据吗?

您好,参数与您github仓库内容一致,数据是参考您github仓库里的代码流程进行的,app和service的划分是参考了您之前的几个issue里的划分

你好,在readme中只展示了包级别的微调参数,流级别的微调建议 --seq_length 和--learning_rate 参数进行增大,可以根据自身GPU资源进行调整,我们之前的参数印象中是512和5e-5,提供给你进行测试,同时可以拉取已公开的预处理好的模型和数据进行对比,希望能帮到你。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants