最近在 DeepLearning.AI看吴恩达老师的课程,叫 AI Prompting for Everyone。课程覆盖三件事:怎么用 AI 找信息、怎么把 AI 当思考搭子、怎么用 AI 处理图片和写代码。核心不是提示词句式,而是怎么更有效地使用 AI。
这篇是第一章 Finding Information 的笔记,讲 AI 回答问题时信息从哪来、什么时候该用哪种来源。

AI 的知识是怎么来的
AI 不是从一个"标准答案库"里查答案的。它的知识来自训练阶段阅读的大量互联网文本——论坛帖子、书籍、百科、新闻报道、学术论文、博客、问答网站,规模是万亿词级别。这些知识叫预训练知识,可以理解为 AI 在上线之前就已经学会的东西,不是实时查的。
一个话题在互联网上出现得越多,AI 就越熟悉,回答起来越流畅。问做饭、问电影、问常见的编程问题,通常答得不错,因为这类内容在网上铺天盖地。问一个冷门的天文学概念或者某个小众开源项目,就容易不靠谱,因为训练数据里相关内容太少。
但出现频率高,不代表信息是对的。互联网上广泛流传的内容里,有大量错误科普、过时教程、为了搜索排名拼凑的文章、社交媒体上以讹传讹的说法。AI 把这些内容的语言模式学得很好,但"学得好"和"学到的是对的"是两回事。AI 在某些话题上说得越自信、越流畅,越要留意它是不是在流畅地重复一个错误。
还有一类信息 AI 训练时完全没见过:私有数据。个人经历、公司内部资料、合同条款、项目文档——这些不在公开互联网上,AI 对此一无所知。涉及这类信息,必须自己上传材料给它。

什么时候不能只靠预训练知识
AI 的预训练知识还有一个硬限制:知识截止日期。训练到某个时间点就停了,这个时间点之后发生的新事件、新工具版本、新出现的网络梗、新生效的政策,AI 默认都不知道。
遇到以下几类问题,不能只靠预训练知识,需要让 AI 联网搜索:
最新信息:最近的新闻、刚发布的产品、新出现的概念 地点相关:附近评分高的餐厅、某个城市现在开放的场所、当地天气 变化快的信息:价格、排名、招聘岗位、软件功能更新、政策法规 小众冷门内容:特定的开源项目、细分行业的具体问题、不太常见的活动
主流 AI 工具已经能自动判断是否需要联网搜索,用户也可以手动要求它去搜。一个实践是:凡是涉及"现在""最新""附近""某个具体工具或产品版本"的问题,主动让 AI 搜,不要赌预训练数据里有。
联网搜索也不等于靠谱
联网搜索解决的是"信息新不新"的问题,不自动解决"信息对不对"。AI 做联网搜索时,倾向于拉取互联网上量最大的内容来源——论坛帖子、社交媒体讨论、博客文章。这些来源不一定可靠,有的带个人偏见,有的有商业动机(比如卖保健品的网站说自己的产品很安全),有的纯粹是低质量拼凑。
搜索还可能拉到过时的网页。课程里有个例子:有人让 AI 推荐跑步地点,AI 找到了一个学校——但那条信息来自二十多年前的网页,这个学校早就不对公众开放了。
在需要可靠信息的场景,主动告诉 AI 该从哪类来源找:优先使用官方文档、监管机构发布的信息、学术论文、项目官方公告和一手资料;避免主要依赖论坛、营销内容和聚合站。
还有一点:AI 给出了引用链接,不代表那个链接真的支持它的结论。 有时候点进去看原文,会发现原文和 AI 总结的根本不是一回事。有引用不等于有依据,关键引用值得点进去核实。

什么时候该用深度研究
联网搜索适合回答相对简单、只需要少量来源的问题:某个地方的天气、某个工具的最新版本、某条新闻是怎么回事。如果问题涉及多个维度、需要综合大量信息才能形成判断,普通搜索就不够了,这时候该用深度研究。
深度研究的工作方式和普通搜索不同。它会先形成一个研究计划,然后同时发起多路搜索,读取大量网页,评估哪些来源相关、哪些不相关,决定要不要换关键词继续搜。循环几轮之后,把收集到的信息综合成一份带引用的详细报告。这个功能在很多AI工具里都有,但需要手动触发。
深度研究适合的场景有:涉及科学证据的健康问题、需要对比多个方案的采购决策、需要查法规和政策的合规问题、需要综合多方观点的复杂议题等。在深度研究开始执行之前,值得先审一下它的研究计划——在这一步调整搜索范围、指定来源类型,比等报告出来再逐条核实省力得多。
适用场景
这四种信息来源,分别适合不同类型的问题:

一点思考
虽然这章大部分知识都很基础,但仍有三个点我认为值得注意:
AI 有讨好倾向。如果问题里已经暗示了立场,AI 倾向于顺着说。比如"我有一个很棒的商业想法,帮我分析一下"——这句话本身已经在说"这个想法很棒",AI 很可能配合着夸。但换成"请按以下标准客观评估这个想法:有没有真实需求、有没有市场、有没有竞争优势",AI 就更可能给出真实判断。这不是故意骗人,是训练的副产物:AI 被训练成让用户满意,而满意和准确有时候冲突。知道这件事之后,我问判断类问题时会刻意检查自己有没有在问题里预设了答案。
还有深度研究。这个功能我一直知道,但几乎没用过——遇到问题要么直接问,要么让它搜一下,很少专门启动深度研究,但很多问题其实更适合交给深度研究处理。
最后,AI 让获取信息变得极其容易,但判断信息质量这件事,反而比以前更难了。每一种信息来源都可能出问题,判断的成本上升,判断力变得特别重要。
夜雨聆风