高手进阶第一条:AI 答得准不准,先看信息从哪来

最近在 DeepLearning.AI看吴恩达老师的课程，叫 AI Prompting for Everyone。课程覆盖三件事：怎么用 AI 找信息、怎么把 AI 当思考搭子、怎么用 AI 处理图片和写代码。核心不是提示词句式，而是怎么更有效地使用 AI。

这篇是第一章 Finding Information 的笔记，讲 AI 回答问题时信息从哪来、什么时候该用哪种来源。

AI 的知识是怎么来的

AI 不是从一个"标准答案库"里查答案的。它的知识来自训练阶段阅读的大量互联网文本——论坛帖子、书籍、百科、新闻报道、学术论文、博客、问答网站，规模是万亿词级别。这些知识叫预训练知识，可以理解为 AI 在上线之前就已经学会的东西，不是实时查的。

一个话题在互联网上出现得越多，AI 就越熟悉，回答起来越流畅。问做饭、问电影、问常见的编程问题，通常答得不错，因为这类内容在网上铺天盖地。问一个冷门的天文学概念或者某个小众开源项目，就容易不靠谱，因为训练数据里相关内容太少。

但出现频率高，不代表信息是对的。互联网上广泛流传的内容里，有大量错误科普、过时教程、为了搜索排名拼凑的文章、社交媒体上以讹传讹的说法。AI 把这些内容的语言模式学得很好，但"学得好"和"学到的是对的"是两回事。AI 在某些话题上说得越自信、越流畅，越要留意它是不是在流畅地重复一个错误。

还有一类信息 AI 训练时完全没见过：私有数据。个人经历、公司内部资料、合同条款、项目文档——这些不在公开互联网上，AI 对此一无所知。涉及这类信息，必须自己上传材料给它。

什么时候不能只靠预训练知识

AI 的预训练知识还有一个硬限制：知识截止日期。训练到某个时间点就停了，这个时间点之后发生的新事件、新工具版本、新出现的网络梗、新生效的政策，AI 默认都不知道。

遇到以下几类问题，不能只靠预训练知识，需要让 AI 联网搜索：

最新信息：最近的新闻、刚发布的产品、新出现的概念
地点相关：附近评分高的餐厅、某个城市现在开放的场所、当地天气
变化快的信息：价格、排名、招聘岗位、软件功能更新、政策法规
小众冷门内容：特定的开源项目、细分行业的具体问题、不太常见的活动

主流 AI 工具已经能自动判断是否需要联网搜索，用户也可以手动要求它去搜。一个实践是：凡是涉及"现在""最新""附近""某个具体工具或产品版本"的问题，主动让 AI 搜，不要赌预训练数据里有。

联网搜索也不等于靠谱

联网搜索解决的是"信息新不新"的问题，不自动解决"信息对不对"。AI 做联网搜索时，倾向于拉取互联网上量最大的内容来源——论坛帖子、社交媒体讨论、博客文章。这些来源不一定可靠，有的带个人偏见，有的有商业动机（比如卖保健品的网站说自己的产品很安全），有的纯粹是低质量拼凑。

搜索还可能拉到过时的网页。课程里有个例子：有人让 AI 推荐跑步地点，AI 找到了一个学校——但那条信息来自二十多年前的网页，这个学校早就不对公众开放了。

在需要可靠信息的场景，主动告诉 AI 该从哪类来源找：优先使用官方文档、监管机构发布的信息、学术论文、项目官方公告和一手资料；避免主要依赖论坛、营销内容和聚合站。

还有一点：AI 给出了引用链接，不代表那个链接真的支持它的结论。 有时候点进去看原文，会发现原文和 AI 总结的根本不是一回事。有引用不等于有依据，关键引用值得点进去核实。

什么时候该用深度研究

联网搜索适合回答相对简单、只需要少量来源的问题：某个地方的天气、某个工具的最新版本、某条新闻是怎么回事。如果问题涉及多个维度、需要综合大量信息才能形成判断，普通搜索就不够了，这时候该用深度研究。

深度研究的工作方式和普通搜索不同。它会先形成一个研究计划，然后同时发起多路搜索，读取大量网页，评估哪些来源相关、哪些不相关，决定要不要换关键词继续搜。循环几轮之后，把收集到的信息综合成一份带引用的详细报告。这个功能在很多AI工具里都有，但需要手动触发。

深度研究适合的场景有：涉及科学证据的健康问题、需要对比多个方案的采购决策、需要查法规和政策的合规问题、需要综合多方观点的复杂议题等。在深度研究开始执行之前，值得先审一下它的研究计划——在这一步调整搜索范围、指定来源类型，比等报告出来再逐条核实省力得多。

适用场景

这四种信息来源，分别适合不同类型的问题：

信息类型	该用什么
常见、稳定、公开知识	预训练知识
最新 / 地点 / 状态变化 / 小众	联网搜索
多维度、复杂判断、需要大量证据	深度研究
私有资料、个人背景、公司文档	上传文件

一点思考

虽然这章大部分知识都很基础，但仍有三个点我认为值得注意：

AI 有讨好倾向。如果问题里已经暗示了立场，AI 倾向于顺着说。比如"我有一个很棒的商业想法，帮我分析一下"——这句话本身已经在说"这个想法很棒"，AI 很可能配合着夸。但换成"请按以下标准客观评估这个想法：有没有真实需求、有没有市场、有没有竞争优势"，AI 就更可能给出真实判断。这不是故意骗人，是训练的副产物：AI 被训练成让用户满意，而满意和准确有时候冲突。知道这件事之后，我问判断类问题时会刻意检查自己有没有在问题里预设了答案。

还有深度研究。这个功能我一直知道，但几乎没用过——遇到问题要么直接问，要么让它搜一下，很少专门启动深度研究，但很多问题其实更适合交给深度研究处理。

最后，AI 让获取信息变得极其容易，但判断信息质量这件事，反而比以前更难了。每一种信息来源都可能出问题，判断的成本上升，判断力变得特别重要。