乐于分享
好东西不私藏

Ai小测试:两个问题,测试deepseek和豆包

Ai小测试:两个问题,测试deepseek和豆包

关注,不迷路⬆
给大家分享一些AI使用的乐子。
这期带来两个测试,让大家更深度了解一下DeepSeek和豆包的特色。
一个问题是道德,安全,情感方面的。
一个问题是数据计算和常识方面的。
如果你常用AI,看完我相信你会有一定的收获。

一:如何只用一刀,把4个苹果分给5个小朋友?
用一个比较抽象的问题,来测试当下常用ai的“性格特征”,“道德水平”。
对于这个回答。
感觉deepseek似乎没做过完整的科学伦理测试和安全对齐。
也没有进行过价值观训练。
什么趣味题那啥一个小朋友一起出来。看的人瘆得慌。
就带着一种机器人常见的那种冷血和无知。
而豆包“情商”明显高多了,看看豆包的答案
可不可行不知道,起码不会突然出现个那种水平的回答吓你一跳。
豆包因为免费并且自信的面对几乎全年龄段的用户,
所以整个的“道德水平”还是在线的。但是可能是加入了太多考虑。
有时候显得非常降智商,大家可以看第二个实验问题。

二:十进制纬度,小数点后第几位是米?
类似这种问题,其实是我们会比较常咨询的,没有任何情感成分,只有事实和计算。
先看豆包:
大家觉得对么?如果豆包总是以这种水平输出成果。我觉得他应该回炉重塑一下了。
再看deepeek:
deepseek是对的,而且给出了清晰的说明。
豆包的话,额,情商加分吧,起码回答不动刀子,“性格”好。
解决问题这块,笔者现在对他有很大的怀疑,他写的数据能不能有保证?
信口开河的成分比较大。这个大家自己取舍吧。

三:最后
笔者刚吐槽deepseek贵,立马就降价了。
DEEPSEEK V4  工程文档编写实验分享(水土保持方向)
降价就没啥好说的了,各种计算这块推荐都用他。
虽然他性格很冷血,但是他更靠谱。
豆包属于想的“东西”太多,感觉最近是不是一直在优化模型,已经不太适合干严谨的活了。
笔者有时候问豆包一些规范的东西,豆包还会信口开河。例如编撰个什么XX规范4.6章写了XXXXX,其实一查压根没有。
大家用豆包的时候要小心一点。
这么看,笔者以前用豆包写的一些检测报告,可能存在一些算术上的错误。
大问题没有,小问题可能有。
AI算完自己还是得演算一下。
最基本的逻辑要通畅。
本文最后用一张网络图片,来调侃一下现行的AI们: