乐于分享
好东西不私藏

OpenClaw大模型评测榜单出炉!,

OpenClaw大模型评测榜单出炉!,

OpenClaw大模型评测榜单出炉!,

家人们谁懂啊!PinchBench最新LLM评测榜单终于来了!这次共有44款模型参与PK,竞争那叫一个激烈!

🏆 TOP 3 强者对决

1️⃣ Claude-Sonnet-4.6 - 86.9%成功率

2️⃣ GPT-5.4 - 86.4%成功率(就差一丢丢!)

3️⃣ Nemotron-3-Super - 85.6%成功率
🇨🇳 国产模型集体发力!

Kimi K2.5:84.8% 位列第5
通义千问多款模型霸榜:
Qwen3.5-122b:84.5%
Qwen3.5-397b:83.6%
Qwen3.5-27b:80.4%

智谱GLM系列表现稳定

阶跃星辰、MiniMax紧随其后

💡 有意思的发现
开源模型表现不俗,多个版本跻身中上游
各家都在卷"超大杯",但性价比版本也有市场
部分知名模型意外垫底(此处不点名🤫)
📈 评测趋势
这次榜单有个明显特征:头部模型差距极小,1-2%的差距就能差好几个名次!说明各家技术都在快速进步,竞争白热化啊!
完整榜单已附上,你pick哪个模型?评论区聊聊~
https://pinchbench.com/
#AI #大模型 #技术评测 #人工智能 #LLM

名称已清空
微信扫一扫赞赏作者
喜欢作者其它金额
作品
暂无作品
喜欢作者
其它金额
最低赞赏 ¥0
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
浙江,2小时前,