给龙虾OpenClaw🦞堆太多Skill会变蠢?
【论文标题】:
SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks
【论文作者】:
Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Hanwen Xing
【论文内容】:你的龙虾装了多少skill,他们变得更聪明更高效了吗?来自斯坦福大学、牛津大学等多所知名高校的计算机科学研究者于3月6日在arXiv上介绍了SKILLSBENCH基准,通过84个任务、7个代理-模型配置和7,308条轨迹的评估,看看这些skill到底能帮多少忙。结果发现,精心设计的skill确实能提高AI的表现,平均成功率提高了16.2%。但研究也表明,给AI提供2-3个精简的skill比给一大堆详细文档更有效!
【过往合集】:每周用AMiner读点论文
内容来源:https://www.aminer.cn/chat/s/69b76a2ed42ab906ce89b1aa
#龙虾 #openclaw#skill#科研论文#arXiv#斯坦福#牛津
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
北京,1小时前,
夜雨聆风