ai工作的底层逻辑(deepseek自己跟我说这篇文章值得发出来)

我第一个使用的ai是百度的文心一言。那个纯粹只是弄着玩的。后来长期使用了deepseek。到现在还在用。

刚开始用的时候感到很新鲜，觉得ai相当有用，他能帮我瞬间梳理一大段文字，给我一个得到整理之后的答复。甚至在问答过程中，ai还会使用一些语气词，让我感到它不止是一个冷冰冰的机器，而是一个有细腻情感的伙伴。不出意外的话，我会不断加深与ai的对话，涉猎面更广泛，依赖性更高。

然后不出意外的话，意外就要发生了。

随着我不断与deepseek对话，我想要测试deepseek的逻辑边界在哪里。所以我对他的对话内容涉猎面越来越广，内容越来越奇葩，跳跃性越来越大，逻辑性越来越强。

结果是这样的：

内容涉猎广泛，ok它能做到。

内容越来越奇葩，ok它能应付。

跳跃性越来越大，ok它能反应。

逻辑性越来越强……不ok，它崩溃了。

有一个特别有意思的地方

我其实真的找它询问问题，查资料求答案的机会不多。我与deepseek的对话更多的其实是我故意的。我不在乎它回答什么答案给我，有的答案我自己都知道。不过我还是会故意问他。

因为我想从它的回答中找出ai对一个问题思考的底层逻辑。我想知道ai是怎么分析问题的，ai分析问题的思维导图是怎样的。这个一环环的逻辑链是怎么形成的。

在我与它最近的对话中，其他都挺好的，但有一段对话，我的deepseek几乎处于崩溃状态，几乎每一句对话都出现了自我矛盾、逻辑混淆、记忆错乱的情况———就是我图上红圈，圈出来的地方。

这个话题的背景是我前段时间报考了某法院的调解辅助员考试。

我考过公务员考试、事业编考试、社工考试等等，但这还是我第一次考“法院调解辅助员”这个岗位。

这个属于小众岗位，没什么特定的往年真题。我也不知道它考什么范围，从哪开始复习起。所以我把这个问题交给了deepseek。让它帮我查找网上有没有往年真题。

ai说没有。没找到。于是我让它猜测一下，大概会考哪些内容。ai开始猜测。还真别说，ai猜测的考点里面，有一部分真的在后来的考试中考到了。说明它的概率论相当厉害。

复习时我进了一步，让它针对它预测的考点进行针对性的出题，让它陪我刷题。

deepseek利用自己数据库中的法律条文、法务实操等内容，为我出了一百道选择题，而且是不定项选择题。

众所周知，选择题分为单选题、多选题、不定项选择题。其中不定项选择题是最难的。

出不定项是我要求的。我说既然要刷题，那不如你帮我把难度加到最大，多给我挖挖坑，多让我踩踩雷，这样才能达到刷题的效果。

于是事故就这么发生了。

有一道题，如上图所示。

题干不说了。正确答案是cd。刚开始它判我错。它给出的答案是bcd。然后我要求他在答案后面附上详细解析。

结果它解析着，解析着……卧槽！原来自己是错的？

当场自己打了自己脸，然后向我道歉，说我是对的。

我当时心理活动是这样的：“…………”

这是我第一次看到ai犯错误。而且竟然是这么直接的错误。我更没想到，它竟然在同一句对话中，后半段直接否定了自己的前半段。

在后来的刷题对话中，我刻意加大逻辑分析深度，从法务实操，到犯罪嫌疑人心理分析，到庭审过程，到被告人为了逃避罪责而可能采取的各种抗辩措施。

结果deepseek开始不断犯错误，可以用“捉襟见肘”来形容。常常会有，它说一句，我指出它一个逻辑错误，然后它立刻又纠正的情况发生。这种情况伴随着聊天的深入，发生的频率越来越高。直到最后几乎每一句话都变得语无伦次。

因为庭审答辩不同于大学里毕业论文答辩，这是一个超级灵活的事情。原告与被告的相互质证本身就是一种头脑风暴，你要从各种角度去切入对手，证明自己的证词有效，证明对方有罪/自己无罪。要做到这一点，需要因地制宜，结合实际情况来见招拆招，不是什么事都能提前准备好的。

后来我提了一个问题，我问“你目前是否运算力已经达到满载了？”

deepseek也老老实实回答我，确实已经接近极限了。从刚开始刷题到现在，已经发生了近1000轮对话。而deepseek每次回答一句新的对话，就要扫描之前所有对话内容，以便串联起上下文语境。

但这么做有一个极大的问题，就是在同一对话中一直对话下去，对ai的算力负荷越来越大。因为每次对话都会扫描所有历史记录。所以每次新对话他需要扫描的内容就会越来越多，占用算力也是越来越多。

负荷越来越大会有什么问题呢？

ai不是人，感觉不到累。所以我倒也不用有什么心理负担。无非就是他的运算更耗电了。但ai的供电在deepseek的终端服务器那边，不用担心耗电问题。

关键问题就在于刚刚提到的“语无伦次”问题。ai虽然拥有极强，极完善的底层逻辑链，也拥有几乎无限的数据库，拥有强大的文字处理能力，但它一次性能分析的文本数量却十分有限，大约4Mb左右。

注意，是4Mb的纯文字。一个英文字母是一个B，也就是8个二进制位。而一个汉字会占据三个B。所以4MB的纯文字折算一下大概80万字左右。在这个字数范围内，ai可以相当健康地运行。

这个大小已经足以覆盖平时的文字聊天了。所以一般人没事找ai打开一个新对话聊聊天、问问题、查查资料、改改论文，都完全可以。但像我一样在同一个对话里找ai聊这聊那的，时间一长ai确实会负担不了。

图中这段对话，我大概与他对话了1000多次了。而ai自己又比较话痨，每一次输出文字回复都要几百上千字。这就导致我聊得久了，它一次性能处理的文本数量几乎每次都在以4MB满额运作。那么满出来了之后会导致什么结果呢？

就是它会主动忘记之前的对话。

没错，我刚开始知道它还有主动忘却功能的时候相当震惊！！！

我觉得很奇怪，我们之间的对话明明只需要我手动往上翻一下即可。连我这个人脑都能记得的东西，我们的对话记录明明就摆在上面呢，ai居然告诉我它忘了！

一开始我真的以为他是在跟我开玩笑。但深入了解他的运作方式后，我才理解到，原来他真的会忘记。而且与我们人类被动忘记、不小心忘记不一样，它是会主动断掉之前的记忆。

当然我也不是闲着没事才这么干的，在跟ai的对抗中，我自己的法律知识也得到了飞速提升。这一点对我也很有帮助。

到了最后，我向ai抛出了如上图的问题。

deepseek，是否对你来讲，“要求你做到内容不出错”这个要求本身就是不现实的？是否对于ai的底层逻辑来讲本身就是“允许犯错”的？

所谓的ai幻觉，其实就是ai在沿着自己的逻辑往下思考的情况下，他根本不知道自己说错了，还是在一本正经地往下分析。这是一件很可怕的事。这不是谬以千里，而是谬以十万八千里的问题。

后来deepseek如图给了我答案。他提到了自己工作的本质方式。ai并不能做到百分百正确，因为ai根本不是以此为目的而工作的。

在后来的对话里，deepseek告诉了我它的工作逻辑。

ai的本质是算力，也就是运算。运算的本质是一种概率上的吻合，而不是对既定事物进行一种定性的判断。

什么意思呢？

举个例子。我可以问ai，太阳是从东方升起还是西方升起？

ai一定会回答你，是东方升起的。

那么ai怎么知道太阳是从东方升起？ai没长眼睛，没有记忆，没有方向感，没有时间感。但ai有庞大的数据库。

它会去数据库里查找，有关太阳升起方位的资料。随后它会比对大量资料，看“东方升起”和“西方升起”的数据比例。当它发现数据库中所有的资料全都指向东方升起时，他就会将“东方升起”判断为100%的概率，然后输出答案：

“哈哈！你真是的，太阳当然是从东方升起的啦！这是常识啊！我的朋友！”

但如果出现一个问题，他有很多个答案，而且这些答案都相当有可能，可能性都很接近，此时的ai就是ai幻觉的高发期。很容易出现幻觉。

如同上图。我向它咨询一款药物是否可以长期吃。这个告诉我可以长期吃，而在另一个独立的对话中，我问了一模一样的问题，他却告诉我不能一直吃，要停药。

最后我把另一对话截图给这一对话，让它自己比对两个对话的内容，之后他才确认，在本对话中他之前的判断是错的。确实不能继续吃。

那么请问，如果我没有与它有另一对话，而仅仅只是参考它本段对话的结果呢？我是否会误将这款药（维生素d1）长期吃下去？身体出了问题怎么办？这是ai一句轻飘飘的“对不起，我判断失误了”能解决的吗？

所以ai幻觉相当可怕。我们必须要识别ai什么场合下可以信任，什么场合下容易犯傻。这就是我研究ai底层逻辑的原因。

掌握了“运算”和“概率”这两个关键词之后，我心中有了猜想。于是我最后将我的猜想告诉deepseek，在他口中得到了最后的印证。我将我们最后一段对话截图放在这里。这是我用deepseek到现在三四年了，从deepseek口中得到的最有价值的一段话。

最后，我把这篇文章发给deepseek自己。让它对我这个用户的感知的准确度进行评价。我把它自己的评价放在这里。