本赛道以老年人在支付宝上常用的生活类场景(如交通服务、天气服务、医疗服务、红包社交等)为切入点,探索如何在安全及隐私保护的前提下,借助大模型提供的自然语言交互的方式,使得老年人无需学习繁琐的App操作方式,即可便捷地完成想要的操作。
本赛题需要通过大模型来理解用户Query,并利用外部API的结果与用户进行多轮交互,最终帮助用户完成某个具体的任务。每个API的功能和所需要的参数都预先提供,大模型需要根据当前对话状态,选择合适的API,并提取对应的参数或进行反问。
除了最终效果外,选手还需要特别关注大模型的高效微调方法,即如何使用有限的卡时训练出效果较好的大模型。在模型效果相当的情况下,卡时使用较少的会获得更高的排名。
1.本赛道数据集包含训练集和测试集。数据来自于用户和Agent之间的对话(符合数据安全规范),包含对话内容、API列表和对应输出的Action和Service Call。除此之外还会提供全场景API列表和参数的说明文档。
2.本赛道所有相关数据(包括但不限于训练数据集)不得以任何形式下载, 仅限在主办方提供的本地服务器及含GPU的公有池服务器上、以比赛为目的使用,选手操作全程审计,违者将被视作“获取未授权数据”,将依照大赛规则,作禁赛处理。同时,本赛道允许选手基于给定的数据集进行数据增强,但禁止选手使用额外数据集,违反将做成绩作废处理。