AI 与社会(上)
「吴恩达AI课 · AI for Everyone」第 7/8 篇
课程:AI for Everyone · 讲师:Andrew Ng(吴恩达)
平台:DeepLearning.AI · 整理日期:2026-06-15
本课位置
前三周讲的是 AI 技术、项目和组织转型。最后一周不再谈"能不能做",而是谈 "应不应该做"——当技术落到真实社会里,它会带来偏见、被恶意利用、加剧不平等。这一篇聚焦:AI 的真实局限、偏见从何而来、以及怎么防御攻击。
第 36 课:第 4 周导论
原课链接: Week 4 Introduction[1]
时长: 2m

课程截图:第 4 周导论
核心要点
AI 不仅在改变企业和产业,也在深刻改变社会。这一周的目的是让你对 AI 的社会影响有一个理性、平衡的认知——既不过度恐惧,也不盲目乐观。
第 37 课:对 AI 的现实看法
原课链接: A Realistic View of AI[2]
时长: 7m

课程截图:对 AI 的现实看法
这一课解决什么问题
公众对 AI 的认知在两个极端之间摇摆:要么把 AI 当万能魔法,要么把它当终结者。这一课帮你建立介于崇拜和恐惧之间的理性地带。
核心要点
AI 有明确的局限性:
实用原则:不要因为 AI 不完美就拒绝使用,也不要因为它效果好就无条件信任。
正确的态度是:理解 AI 在哪些具体任务上表现好、在哪些方面不可靠,然后为每个项目设置合理的预期和防护机制。
第 38 课:歧视与偏见
原课链接: Discrimination / Bias[3]
时长: 9m

课程截图:歧视与偏见
这一课解决什么问题
"AI 是客观的、不带偏见的"——这个观念是错的。AI 不仅会继承人类历史数据中的偏见,还可能放大它。
核心要点
偏见从哪来?
怎么减少偏见:
- 改进数据:确保训练数据充分代表所有目标用户群体
- 技术审核:在模型上线前,对不同子群体的表现做差异分析
- 定义公平指标:不只追求"整体准确率最高",也要看"各群体之间的准确率差异最小"
- 建立多元化的团队:当设计团队包括不同背景的人时,更容易发现模型中的偏见盲区
关键认知:零偏见是不现实的,但可以减少偏见带来的伤害。 发现问题远比假装没有偏见要好。
第 39 课:针对 AI 的对抗攻击
原课链接: Adversarial Attacks on AI[4]
时长: 7m

课程截图:针对 AI 的对抗攻击
这一课解决什么问题
AI 系统看起来很强大,但实际上可能被对人来说完全看不出来的微小扰动骗到。这些攻击不是理论上的——它们已经在真实场景中发生。
核心要点
两种对抗攻击类型:
数字对抗攻击:
- 对一张图片的像素做人类眼睛无法察觉的微小改动
- 修改后的图片对 AI 来说可能完全变成另一个东西
- 例:一张熊猫图片加上微小噪声 → 人看起来还是熊猫 → AI 以 99% 的置信度判断为长臂猿
物理对抗攻击:
- 在真实物体上做改动来欺骗 AI
- 例:在停车标志上贴几个小贴纸 → 人仍然认得是停车标志 → 自动驾驶 AI 判断为"限速 80"
- 例:戴一幅特定图案的眼镜,就能骗过人脸识别系统
防御策略:
- 在训练数据中加入对抗样本
- 多重验证:不只依赖一个模型做关键决策
- 永远假设 AI 系统会遇到恶意输入,在安全相关的应用中尤其如此
下一篇:AI 与社会(下)(AI 的有害用途、发展中经济体、就业影响 + 课程总结)
END
点赞在看
参考链接
[1] Week 4 Introduction: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/m6mae/week-4-introduction
[2] A Realistic View of AI: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/ziua7/a-realistic-view-of-ai
[3] Discrimination / Bias: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/zzs1g/discrimination-bias
[4] Adversarial Attacks on AI: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/otcg4/adversarial-attacks-on-ai
夜雨聆风