乐于分享
好东西不私藏

OpenClaw接上4个模型以后,我才发现之前被AI骗了多少次

OpenClaw接上4个模型以后,我才发现之前被AI骗了多少次

你有没有被AI坑过。

我有。

有时候写个文章找素材,我问他这个文件的最早发布时间是什么时候,它说是三个月前,结果我上网查,都快是半年前的事了。

不是大错,但这种事多来几次,你就会开始怀疑它说的每一句话,到底可不可信。

这种感觉有个正式名字,叫幻觉。

AI幻觉不是bug,是当前语言模型的结构性问题。

没有外部信息约束的时候,模型会用一本正经的语气,给你一个它自己都不确定的答案。

怎么解决,换更强的模型?没用。Claude会幻觉,GPT也会,DeepSeek也会。

真正有效的方式是,同一个问题,同时问多个模型。谁在编,一对比就知道了。

10x-chat给了我灵感

最近Twitter上有个叫10x-chat的OpenClaw Skill火了,作者是Mike Chong。

核心思路很简单:

你问OpenClaw一个问题,它自动打开浏览器,登进ChatGPT、kimi、DeepSeek等AI大模型的网页版。

把问题挨个提交,等回答,再汇总给你。

思路我非常认同。多个AI一起回答,确实会比较难出现幻觉。

但他的实现方式是浏览器自动化。

要挂浏览器进程,要维护各家网页版的登录态,session过期就挂,速度也慢。

我想要的更简单粗暴:一个API,多个模型,后台跑完直接给我结果。

然后我发现七牛云的MaaS服务干的就是这个事。

七牛云MaaS是什么

说白了就是国内版OpenRouter。

一个API入口,接了115个模型。

Claude 4.6 Opus、GPT-5.3 Codex。

DeepSeek-V3.2、Kimi-K2.5、Qwen3.5等等

海外闭源和国产主力全都有。

接口兼容OpenAI和Anthropic协议,现有代码基本不用改。

对我来说最关键的三点:

国内直连,不用翻墙 

不用去每家单独注册、单独买Key 

按Token计费,不用给每家开订阅。

还有个细节挺实在:

它有缓存机制,写代码时同样的上下文反复调用,命中缓存的部分只收1/10的钱。

海外模型看着单价高,实际用下来没那么吓人。

新用户送1000万Token,先免费体验再决定要不要继续用。

接下来我拿它做了个实验:同一个问题,丢给4个不同的模型,看看它们的回答到底差多少。

实测开始

我选了4个模型:GPT-5.3 Codex、qwen3-max、DeepSeek-V3.2、Kimi K2.5。

第一个是海外闭源顶配,后面都是国产主力。

每个问题都通过七牛云MaaS的API调用,同一个baseUrl,只是换model参数。

问题一:Rust的异步运行时tokio,1.0版本是哪一年发布的

让我们先来问问ChatGPT,再用10x-chat进行询问

可以看到,对于这种事实类的问题,每个模型都给出了一致的答案。

问题二:AI 编程助手会让初级程序员失业吗?

还是一样的逻辑:先问ChatGPT,再用10x-chat

用完之后我发现了什么

事实类问题,模型之间的答案差异最小。

但这也是幻觉最高发的地带。如果只问一个模型的话,他给了你错误答案你根本发现不了问题。

如果是问四个AI,互相纠错的情况下谁在说谎一目了然。

判断类问题,看的不是谁对谁错,而是各家的分析角度。

每个模型都有自己独特的理解,但是大致的答案方向是一致的。核心在于每个模型的重点不一样。

如果是在中文场景下使用的话,国产模型确实有优势。

尤其是涉及国内市场、国内产品、国内政策的问题。

但涉及全球技术趋势,海外模型的信息面更广。

最重要的是,多模型对质的价值不是消灭不确定性,而是定位不确定性。

以前用单一模型,它给出一个答案,我要么全信要么全不信,其实都不知道该信哪部分。

现在几个答案摆在一起,哪里是共识、哪里是分歧、哪里是集体沉默,一目了然。

看见分歧,你才知道哪里需要自己判断。

福利

通过我的专属链接注册七牛云,直接领1000万Token:https://s.qiniu.com/vyaUby

邀请活动:邀请好友体验,你拿500万Token,朋友拿1000万Token,最高可拿百亿Token奖励:https://s.qiniu.com/EvAnQz

如果你也想把OpenClaw跑在云端,七牛云LAS全栈应用服务器8.8元/月起,有OpenClaw预装镜像,开箱即用:https://s.qiniu.com/uyM3u2

另外,如果你是企业用户(2月1日后注册并完成企业认证的),还有总价值接近1000元的免费福利可以领:

500块MaaS代金券(200份),直接抵扣国内模型调用,相当于前期基本不用花钱。

200块轻量云主机券(200份),券后50块能拿一台2核4G的机子(日本/新加坡/香港节点),跑Gateway当调度中心挺合适,实例有效期长达一年。

168小时云端sandbox免费额度。
sandbox就是给你的agent开的临时工位,agent接到重活就甩给sandbox去干,干完交付结果,不占你VPS的资源。
168小时大概够跑2000次五分钟的任务。

重活外包出去,VPS只负责路由。

MaaS和主机券直接去活动页领,活动链接:https://s.qiniu.com/uyM3u2

sandbox需要填个表单,直接私信我领链接即可。数量有限,先到先得。

有问题评论区聊。