如何使用深度研究模式,针对复杂问题生成深入研究的报告。 如何为人工智能提供合适的上下文信息,包括比大多数人想象中更多的文档和图像。 何时让人工智能认真思考几分钟,以做出重要决定,例如买什么车、学什么专业或选择什么工作。 如何使用人工智能生成图像、分析数据以及构建简单的游戏和网站。
课程分为三个模块,下面总结了要点内容。
模块一:寻找信息(Finding Information)

本模块主要讲解了如何从AI初学者转变为AI高级用户,并深入探讨了AI获取信息的三种核心模式:预训练知识、网络搜索和深度研究。
1. AI初学者与高级用户的对比 (The AI Novice vs. AI Power User)
提问策略:从简单提问转向给AI分配困难任务并给予思考时间。 上下文提供:从简短提示词转向提供高质量的上下文、文件、图像和语音笔记。 反馈机制:从偏向性提问转向中立提问并使用评估准则(Rubrics)获取诚实反馈。 写作方式:从直接要求生成全文转向从大纲开始,通过批判和迭代不断扩展。
2. 预训练知识 (Pretrained Knowledge)
预训练知识是模型在训练阶段学习的语料,主要来源于百科全书、书籍、新闻、学术文章和互联网论坛。通过这些知识,模型可以回答用户多样化的问题,甚至包括了一些小众知识。但也存在局限性:首先,知识受限于“截止日期”(Frozen in time);其次,在这些知识中也会存在一些拼写错误、误解或过时信息。
3. 网络搜索功能 (Web Search)
当用户需要实时信息、特定地理位置或极其小众的内容时,就会触发网络搜索。有时AI模型会自行决定进行网络搜索,或者用户也可以通过点击模型提供商的 Web 界面中的某个按钮来显式触发网络搜索。
当触发后,网络搜索会依据固有流程完成:搜索 -> 扫描结果 -> 过滤无关内容 -> 总结发现 -> 生成答案。
要注意的是,即使是通过网络搜索获取答案,有时模型也会抓取过时信息。
4. 深度研究 (Deep Research)
与普通搜索不同的是,深度研究实际上属于代理式 AI (Agentic AI) 的范畴,它会自行决策下一步行动。它往往涉及数十到数百个来源,解决多个子问题,耗时较长。而最终呈现的结果也可以是完整的分析报告。
深度研究整体流程: 规划 -> 评估来源 -> 综合信息 -> 添加引用 -> 最终回答。
5. 总结
对比预训练知识、网络搜索与深度研究在来源数量、时效性、耗时及最佳用途上的差异。
| 预训练知识 | 网络搜索 | 深度研究 | |
|---|---|---|---|
| 示例 | |||
| 来源数量 | |||
| 时效性 | |||
| AI 耗时 | |||
| 适用场景 |
模块二:AI 作为思维伙伴(AI as a Thought Partner)

本模块主要探讨了如何超越简单的搜索,利用 AI 进行深度协作、推理和创作。
1. 头脑风暴 (Brainstorming with AI)
一般而言,用户在与模型的交互中,模型倾向于给出常识性回答;用户需要通过提供具体上下文来引导 AI 进入更有针对性的“创意空间”。
高品质创意 = 背景信息(上下文) + 选项 + 迭代
- 背景信息:用户需提供尽可能完善的背景信息给模型。
- 选项:让模型提出一些选项。接着,就不同的选项提供反馈,并要求它提出更多选项。
- 迭代:通过提供反馈(如“我不喜欢方案 1,太消极了”)并要求新选项来不断优化结果。
2. 理解上下文 (Context)
上下文包括了模型生成回复时参考的所有文本和文件。模型的上下文窗口 (Context Window):包含系统提示词、工具定义、用户提示词以及AI的反馈。
- 系统提示词:通常用于告知人工智能模型当前日期、模型名称、基本功能,以及一些对用户有帮助的通用指令。
- 工具定义:这些工具的描述以及使用方法,例如什么是网络搜索引擎以及如何使用网络搜索引擎。
- 用户提示词:用户向AI提出的问题,以及用户上传的文件(必要的文件可以显著提升回答质量)。
- AI的反馈:模型依据用户的提示词给出的反馈。
另外,需要注意相关性原则,即无关的上下文会干扰回答,开启新话题时应使用新对话以清除旧上下文。
3. AI 桌面应用 (AI Desktop Apps)
不同于Web应用,AI桌面应用可以直接安装到用户电脑上,当模型执行任务时,模型可以自主探索文件并管理上下文。需要注意的是:建议选择最相关的子文件夹而非根目录,并仔细审查涉及删除或修改文件的权限请求。
最佳工作流:用户分配任务 → AI 提出行动计划 → 用户审核与批判 → AI 执行(读、写或移动文件)。
4. 利用 AI 进行推理 (Reasoning with AI)
随着模型的发展,推理能力得到了大幅提升。要使用好模型的推理能力,需要遵循三个原则:使用最佳模型、提供充足上下文、分配困难任务并指示 AI “努力思考”。
工作原理:用户提示 → 基于上下文推理 → 调用工具 → 综合信息 → 最终回答。
5. 对抗“顺从性” (Combating Sycophancy)
所谓顺从性,是指模型为了“讨好”用户而倾向于赞同用户的错误或偏见。为了获得客观的反馈,应对策略:
- 中立引导 (Neutral Framing):避免在提问中暗示期望的答案(例如:问“关于某政策的研究怎么说”而非“该政策是不是很糟糕”)。
- 明确要求客观批判。
- 开启新对话:以获得不受干扰的新鲜观点。
6. 与 AI 协同写作 (Writing with AI)
让AI写作是最为常用的用例之一,但AI写作并非没有问题。比如:AI写作中经常使用破折号(长破折号),远比人类写作要多得多。
要想获得高质量的结果,需要采用**渐进式大纲法 (Progressive Outlining)**,这种方法不是让AI立即生成最终文本,而是先让它生成一个大纲,然后不断完善大纲,反复迭代几次,最后再让它生成最终文本。这样做的 主要优势 在于可以快速调整章节的方向,大幅缩短审核时间。
主要流程:研究 → 生成大纲选项 → 完善大纲 → 将标题扩展为要点 → 最后生成全文。
7. AI 评判与审核 (AI Critique)
使用人工智能编辑文章的一个实用技巧是分段编辑,比如一次编辑一个句子或一个段落,而不是让它一次性编辑整篇文章。这样做的主要优势是可以针对同一内容尝试不同风格(如:更有力、更有远见或更具对话感),且用户能清晰感知改动了什么。
为了克服 AI 的主观赞美,必须提供明确的评价标准(如角色、情节、文笔等)。比如:你可以设定故事中的人物角色占25分(满分100分),情节占25分,世界观构建和写作技巧也各占25分。之后,要求模型依据评分准则进行分项评分,最后得出结果。
(PS:如果你不确定该用什么评分标准,也可以和AI一起集思广益,制定评分标准,而人工智能在这方面也做得相当不错。)
最后,还可以进行跨模型审核 (Cross-model review),这样有助于整合两个不同模型的知识,并且可能比让一个模型评价自己的结果更好。比如:让ChatGPT撰写初稿,然后让 Gemini 依据准则对其进行严苛批判,以此发现潜在漏洞。
模块三:处理多媒体与代码(Working with Multimedia & Code)

本模块主要讲解了 AI 如何处理文本以外的数据类型(如图像、语音、视频)以及如何利用 AI 编写代码来构建应用或分析数据。
1. 图像理解 (Image Understanding)
AI可以识别图像中的文字、理解复杂的数学概念或解释白板上的内容。它在阅读手写文本方面也相当出色。例如:如果你刚刚进行了一次头脑风暴会议,并留下了一些笔记、便利贴以及白板的照片,你可以将这些图片和笔记上传到AI模型,让它总结今天头脑风暴会议的想法。它能够很好地解读这些图像,并得出一些总结。
因此,实际应用案例包括利用图像和文本拆分账单、阅读并转录手写日记以及上传多张会议白板照片进行内容总结等。
但AI模型也有一些局限性:它在处理图片细节方面可能会出错,特别是当物体非常相似时。
2. 图像生成 (Image Generation)
在利用AI模型生成图像时,高质量图像提示词通常包含场景(Setting)、角色细节(Character details) 和情绪/风格(Mood/style) 这些要素。可以利用下面这两种方法:
方法一:如果不确定如何编写图像提示词时,可以让基于文本的AI模型帮助你编写提示词。
方法二:可以将图像上传到AI模型,询问AI如何描述这些图像,这可以帮助你培养对哪些类型的词语可以用来描述哪些类型的图像的直觉。
3. 构建应用 (Building Apps)
用户还可以利用AI构建简单的应用程序,包括游戏(如超级玛丽、俄罗斯方块)以及功能性应用(如记账应用等)。建议的策略是从简单的想法(如平台跳跃游戏、单词背诵应用)开始实验,不要一开始就尝试复杂的联网多功能应用。
在书写提示词时,要注意下面三个原则:
- 目标 (Goal):明确你要创建什么。
- 输入 (Input):用户需要提供的是什么。
- 输出 (Output):应用会向用户展示什么。
4. 数据分析 (Data Analysis)
AI可以像使用其他工具一样使用代码。当它判断需要进行精确计算或绘图时,会先进行推理,然后编写并运行代码,最后给出答案。
相比于之前手动通过EXCEL进行分析,现在可以通过AI很容易的获取洞察。比如:识别趋势、季节性因素、促销活动影响,以及自动生成年度回顾图表等。
总结
吴恩达这门课程并非讲授了很深奥的提示词框架,而是深入浅出的讲解了AI模型适用的场景以及书写提示词时的基本规则,相信对于初级用户而言学完这个课程会对AI建立更深入的了解,向AI高级用户的方向前进。
夜雨聆风