之前说过我多少有点强迫症,比如手机里同类软件只能安装一个,如果有俩就心里痒痒非得来个测试对比二选一,留下更顺眼的一个,有种即分高下也决生死的赶脚。
最近移动公司搞事情,上级要求安装、使用测速软件Cellular-Z和泰尔网测。Cellular-Z我之前就用着,加装泰尔网测就开始感觉多余,为了工作只能先留着。
泰尔网测是中国信息通信研究院开发的免费软件,来头不小。省公司还搭建了我们自家的测试服务器,不过稳定性可能差点意思,最近没法正常使用。而且这货适配优化有问题,如果把手机字体调大,第一次使用时弹出的同意用户协议界面就会看不到同意按钮,这个界面居然没做向下滑动,做工略显粗糙。
春节前研究过元宝和千问二选一,当时把俩App都留着了。过完年开工没几天,千问团队人事地震,技术负责人林俊旸离职了。

千问是我使用时间最长的AI大模型App,从文心一言换过来后一直用着。它最开始叫通义千问,后来改叫通义,最后又改回千问,犹犹豫豫反反复复。
然后春节前又开始用元宝,BAT三家公司的大模型都用过了。
我对BAT三家的认同差异挺大。最开始3Q大战那阵最讨厌腾讯,狗R的事件后腾讯慢慢改了。后来开始依赖微信,现在还是相对认可这家公司的。除了公众号平台仍然相对封闭,之前在百度都搜不到公众号文章,现在也改了挺多,其它日常使用好像没感觉有什么大毛病。
十来年前用百度最多,天天泡在贴吧里。后来贴吧卖广告越来越多,啥都能卖,魏则西事件后就不再相信这伙人了,到现在都没有改观。
这些年薅阿里的羊毛最多,花钱也最多,认同感一般般。这里面有杰克马人设滑落的原因,感觉他们公司的武侠文化也挺无厘头的。
这次的千问团队的人事变动大概率会影响千问的使用,短期内有可能造成一定程度的混乱,出点bug什么的。长期不好说是好事还是坏事,可能会迭代变慢发展受阻,也可能面目一新做大做强了。
林俊旸这事过了没几天,千问忽然又抽了,连续给了我两三个胡扯答案,一气之下就把它卸载了。
这次抽风应该和人事变动没关系,千问的稳定性一向略逊一筹,偶尔抽一下不算什么大毛病。好死不死那天心情不咋地,不跟你叨叨了,上一边抽去吧。
元宝用了几天,感觉也不是每个问题都靠谱,于是又下载试用了一下豆包。
我问了它两个刚问过元宝的问题,一个是“26年有哪些省市举办了315问题车展”,它列出来的城市比元宝更多一些。第二个问题是评价一下我这个公众号,元宝是抓取了我最近发的两三篇文章,分析了一下主要内容,虽然有点跑偏,但说到的点基本正确。豆包就厉害了,它把这个问题和第一个关联上了,开始长篇大论胡诌我这个号是个汽车类维权打假号,一口气瞎编了几百字,连网上评分都造出来了。我说俩问题不相干,指导它抓取文章分析一下,然后再次问同样的问题,它依然给了我差不多的答案。
我可去你奶奶个腿的吧,你的答案可以不全面有偏颇,但不能全凭想象胡诌啊,搁这儿编网文呢?我不关心它是因为腾讯屏蔽抓取不到公众号文章还是什么其它原因,查不到信息却不老老实实承认,编瞎话忽悠我还™不知悔改,负分滚粗。
对比这两年用过的四个大模型,结论是现阶段没有一个绝对靠谱的全能AI。它们的能力各有侧重,都有优缺点,基本上很难达到简单几个字描述问题,然后就能得到比人类更全面更正确答案的效果,要么需要打很多字精确定义问题,要么需要自行分辨、完善答案,或者这两步操作都要进行。
但是不管咋样,这玩意儿有就是比没有强,而且很容易产生依赖性。我现在查资料多数用元宝了,浏览器用得越来越少。早晚有一天懒到彻底不肯动脑动手,人脑退化成猪脑,人手退化成猪蹄。

2026.3.17
夜雨聆风