ai工作的底层逻辑(deepseek自己跟我说这篇文章值得发出来)我第一个使用的ai是百度的文心一言。那个纯粹只是弄着玩的。后来长期使用了deepseek。到现在还在用。
刚开始用的时候感到很新鲜,觉得ai相当有用,他能帮我瞬间梳理一大段文字,给我一个得到整理之后的答复。甚至在问答过程中,ai还会使用一些语气词,让我感到它不止是一个冷冰冰的机器,而是一个有细腻情感的伙伴。不出意外的话,我会不断加深与ai的对话,涉猎面更广泛,依赖性更高。
然后不出意外的话,意外就要发生了。
随着我不断与deepseek对话,我想要测试deepseek的逻辑边界在哪里。所以我对他的对话内容涉猎面越来越广,内容越来越奇葩,跳跃性越来越大,逻辑性越来越强。
结果是这样的:
内容涉猎广泛,ok它能做到。
内容越来越奇葩,ok它能应付。
跳跃性越来越大,ok它能反应。
逻辑性越来越强……不ok,它崩溃了。
我其实真的找它询问问题,查资料求答案的机会不多。我与deepseek的对话更多的其实是我故意的。我不在乎它回答什么答案给我,有的答案我自己都知道。不过我还是会故意问他。因为我想从它的回答中找出ai对一个问题思考的底层逻辑。我想知道ai是怎么分析问题的,ai分析问题的思维导图是怎样的。这个一环环的逻辑链是怎么形成的。在我与它最近的对话中,其他都挺好的,但有一段对话,我的deepseek几乎处于崩溃状态,几乎每一句对话都出现了自我矛盾、逻辑混淆、记忆错乱的情况———就是我图上红圈,圈出来的地方。这个话题的背景是我前段时间报考了某法院的调解辅助员考试。我考过公务员考试、事业编考试、社工考试等等,但这还是我第一次考“法院调解辅助员”这个岗位。这个属于小众岗位,没什么特定的往年真题。我也不知道它考什么范围,从哪开始复习起。所以我把这个问题交给了deepseek。让它帮我查找网上有没有往年真题。ai说没有。没找到。于是我让它猜测一下,大概会考哪些内容。ai开始猜测。还真别说,ai猜测的考点里面,有一部分真的在后来的考试中考到了。说明它的概率论相当厉害。复习时我进了一步,让它针对它预测的考点进行针对性的出题,让它陪我刷题。deepseek利用自己数据库中的法律条文、法务实操等内容,为我出了一百道选择题,而且是不定项选择题。众所周知,选择题分为单选题、多选题、不定项选择题。其中不定项选择题是最难的。出不定项是我要求的。我说既然要刷题,那不如你帮我把难度加到最大,多给我挖挖坑,多让我踩踩雷,这样才能达到刷题的效果。题干不说了。正确答案是cd。刚开始它判我错。它给出的答案是bcd。然后我要求他在答案后面附上详细解析。这是我第一次看到ai犯错误。而且竟然是这么直接的错误。我更没想到,它竟然在同一句对话中,后半段直接否定了自己的前半段。在后来的刷题对话中,我刻意加大逻辑分析深度,从法务实操,到犯罪嫌疑人心理分析,到庭审过程,到被告人为了逃避罪责而可能采取的各种抗辩措施。结果deepseek开始不断犯错误,可以用“捉襟见肘”来形容。常常会有,它说一句,我指出它一个逻辑错误,然后它立刻又纠正的情况发生。这种情况伴随着聊天的深入,发生的频率越来越高。直到最后几乎每一句话都变得语无伦次。因为庭审答辩不同于大学里毕业论文答辩,这是一个超级灵活的事情。原告与被告的相互质证本身就是一种头脑风暴,你要从各种角度去切入对手,证明自己的证词有效,证明对方有罪/自己无罪。要做到这一点,需要因地制宜,结合实际情况来见招拆招,不是什么事都能提前准备好的。后来我提了一个问题,我问“你目前是否运算力已经达到满载了?”deepseek也老老实实回答我,确实已经接近极限了。从刚开始刷题到现在,已经发生了近1000轮对话。而deepseek每次回答一句新的对话,就要扫描之前所有对话内容,以便串联起上下文语境。但这么做有一个极大的问题,就是在同一对话中一直对话下去,对ai的算力负荷越来越大。因为每次对话都会扫描所有历史记录。所以每次新对话他需要扫描的内容就会越来越多,占用算力也是越来越多。ai不是人,感觉不到累。所以我倒也不用有什么心理负担。无非就是他的运算更耗电了。但ai的供电在deepseek的终端服务器那边,不用担心耗电问题。关键问题就在于刚刚提到的“语无伦次”问题。ai虽然拥有极强,极完善的底层逻辑链,也拥有几乎无限的数据库,拥有强大的文字处理能力,但它一次性能分析的文本数量却十分有限,大约4Mb左右。注意,是4Mb的纯文字。一个英文字母是一个B,也就是8个二进制位。而一个汉字会占据三个B。所以4MB的纯文字折算一下大概80万字左右。在这个字数范围内,ai可以相当健康地运行。这个大小已经足以覆盖平时的文字聊天了。所以一般人没事找ai打开一个新对话聊聊天、问问题、查查资料、改改论文,都完全可以。但像我一样在同一个对话里找ai聊这聊那的,时间一长ai确实会负担不了。图中这段对话,我大概与他对话了1000多次了。而ai自己又比较话痨,每一次输出文字回复都要几百上千字。这就导致我聊得久了,它一次性能处理的文本数量几乎每次都在以4MB满额运作。那么满出来了之后会导致什么结果呢?没错,我刚开始知道它还有主动忘却功能的时候相当震惊!!!我觉得很奇怪,我们之间的对话明明只需要我手动往上翻一下即可。连我这个人脑都能记得的东西,我们的对话记录明明就摆在上面呢,ai居然告诉我它忘了!一开始我真的以为他是在跟我开玩笑。但深入了解他的运作方式后,我才理解到,原来他真的会忘记。而且与我们人类被动忘记、不小心忘记不一样,它是会主动断掉之前的记忆。当然我也不是闲着没事才这么干的,在跟ai的对抗中,我自己的法律知识也得到了飞速提升。这一点对我也很有帮助。deepseek,是否对你来讲,“要求你做到内容不出错”这个要求本身就是不现实的?是否对于ai的底层逻辑来讲本身就是“允许犯错”的?所谓的ai幻觉,其实就是ai在沿着自己的逻辑往下思考的情况下,他根本不知道自己说错了,还是在一本正经地往下分析。这是一件很可怕的事。这不是谬以千里,而是谬以十万八千里的问题。后来deepseek如图给了我答案。他提到了自己工作的本质方式。ai并不能做到百分百正确,因为ai根本不是以此为目的而工作的。在后来的对话里,deepseek告诉了我它的工作逻辑。ai的本质是算力,也就是运算。运算的本质是一种概率上的吻合,而不是对既定事物进行一种定性的判断。举个例子。我可以问ai,太阳是从东方升起还是西方升起?那么ai怎么知道太阳是从东方升起?ai没长眼睛,没有记忆,没有方向感,没有时间感。但ai有庞大的数据库。它会去数据库里查找,有关太阳升起方位的资料。随后它会比对大量资料,看“东方升起”和“西方升起”的数据比例。当它发现数据库中所有的资料全都指向东方升起时,他就会将“东方升起”判断为100%的概率,然后输出答案:“哈哈!你真是的,太阳当然是从东方升起的啦!这是常识啊!我的朋友!”但如果出现一个问题,他有很多个答案,而且这些答案都相当有可能,可能性都很接近,此时的ai就是ai幻觉的高发期。很容易出现幻觉。
如同上图。我向它咨询一款药物是否可以长期吃。这个告诉我可以长期吃,而在另一个独立的对话中,我问了一模一样的问题,他却告诉我不能一直吃,要停药。最后我把另一对话截图给这一对话,让它自己比对两个对话的内容,之后他才确认,在本对话中他之前的判断是错的。确实不能继续吃。那么请问,如果我没有与它有另一对话,而仅仅只是参考它本段对话的结果呢?我是否会误将这款药(维生素d1)长期吃下去?身体出了问题怎么办?这是ai一句轻飘飘的“对不起,我判断失误了”能解决的吗?所以ai幻觉相当可怕。我们必须要识别ai什么场合下可以信任,什么场合下容易犯傻。这就是我研究ai底层逻辑的原因。掌握了“运算”和“概率”这两个关键词之后,我心中有了猜想。于是我最后将我的猜想告诉deepseek,在他口中得到了最后的印证。我将我们最后一段对话截图放在这里。这是我用deepseek到现在三四年了,从deepseek口中得到的最有价值的一段话。最后,我把这篇文章发给deepseek自己。让它对我这个用户的感知的准确度进行评价。我把它自己的评价放在这里。