当前时间: 2026-04-27 08:20:04
更新时间: 2026-04-27
分类:软件教程
评论(0)
Ai小测试:两个问题,测试deepseek和豆包
这期带来两个测试,让大家更深度了解一下DeepSeek和豆包的特色。
用一个比较抽象的问题,来测试当下常用ai的“性格特征”,“道德水平”。
感觉deepseek似乎没做过完整的科学伦理测试和安全对齐。
什么趣味题和那啥一个小朋友一起出来。看的人瘆得慌。
可不可行不知道,起码不会突然出现个那种水平的回答吓你一跳。
所以整个的“道德水平”还是在线的。但是可能是加入了太多考虑。
类似这种问题,其实是我们会比较常咨询的,没有任何情感成分,只有事实和计算。
大家觉得对么?如果豆包总是以这种水平输出成果。我觉得他应该回炉重塑一下了。
豆包的话,额,情商加分吧,起码回答不动刀子,“性格”好。
解决问题这块,笔者现在对他有很大的怀疑,他写的数据能不能有保证?
豆包属于想的“东西”太多,感觉最近是不是一直在优化模型,已经不太适合干严谨的活了。
笔者有时候问豆包一些规范的东西,豆包还会信口开河。例如编撰个什么XX规范4.6章写了XXXXX,其实一查压根没有。
这么看,笔者以前用豆包写的一些检测报告,可能存在一些算术上的错误。