AI 与社会(上)

AI 与社会（上）

「吴恩达AI课 · AI for Everyone」第 7/8 篇

课程：AI for Everyone · 讲师：Andrew Ng（吴恩达）
平台：DeepLearning.AI · 整理日期：2026-06-15

本课位置

前三周讲的是 AI 技术、项目和组织转型。最后一周不再谈"能不能做"，而是谈 "应不应该做"——当技术落到真实社会里，它会带来偏见、被恶意利用、加剧不平等。这一篇聚焦：AI 的真实局限、偏见从何而来、以及怎么防御攻击。

第 36 课：第 4 周导论

原课链接： Week 4 Introduction^[1]
时长： 2m

课程截图：第 4 周导论

核心要点

AI 不仅在改变企业和产业，也在深刻改变社会。这一周的目的是让你对 AI 的社会影响有一个理性、平衡的认知——既不过度恐惧，也不盲目乐观。

第 37 课：对 AI 的现实看法

原课链接： A Realistic View of AI^[2]
时长： 7m

课程截图：对 AI 的现实看法

这一课解决什么问题

公众对 AI 的认知在两个极端之间摇摆：要么把 AI 当万能魔法，要么把它当终结者。这一课帮你建立介于崇拜和恐惧之间的理性地带。

核心要点

AI 有明确的局限性：

1可解释性差——大多数深度学习模型是"黑盒"。它告诉你结论，但不一定告诉你为什么。这在医疗、贷款审批等场景尤其成问题。

2容易受数据偏差影响——模型反映的是训练数据的模式，而不是"世界应该怎样"。

3领域迁移困难——在 A 医院训练的肺炎检测模型，换到 B 医院、用不同扫描仪拍出的片子，可能完全不准确。

4没有真正的理解——AI 只是模式匹配，它不懂因果关系、不懂常识、不懂语境。

实用原则：不要因为 AI 不完美就拒绝使用，也不要因为它效果好就无条件信任。

正确的态度是：理解 AI 在哪些具体任务上表现好、在哪些方面不可靠，然后为每个项目设置合理的预期和防护机制。

第 38 课：歧视与偏见

原课链接： Discrimination / Bias^[3]
时长： 9m

课程截图：歧视与偏见

这一课解决什么问题

"AI 是客观的、不带偏见的"——这个观念是错的。AI 不仅会继承人类历史数据中的偏见，还可能放大它。

核心要点

偏见从哪来？

1训练数据的偏差——如果历史上招聘经理更倾向于录用男性，用这些数据训练的简历筛选 AI 就会学到同样的性别偏好

2数据收集的偏见——人脸识别系统在浅肤色上训练效果远好于深肤色，因为训练数据本身就不够多样化

3标签的偏见——让人类标注"这个求职者是否适合录用"，标注者自身的偏见就会进入模型

怎么减少偏见：
- 改进数据：确保训练数据充分代表所有目标用户群体
- 技术审核：在模型上线前，对不同子群体的表现做差异分析
- 定义公平指标：不只追求"整体准确率最高"，也要看"各群体之间的准确率差异最小"
- 建立多元化的团队：当设计团队包括不同背景的人时，更容易发现模型中的偏见盲区

关键认知：零偏见是不现实的，但可以减少偏见带来的伤害。发现问题远比假装没有偏见要好。

第 39 课：针对 AI 的对抗攻击

原课链接： Adversarial Attacks on AI^[4]
时长： 7m

课程截图：针对 AI 的对抗攻击

这一课解决什么问题

AI 系统看起来很强大，但实际上可能被对人来说完全看不出来的微小扰动骗到。这些攻击不是理论上的——它们已经在真实场景中发生。

核心要点

两种对抗攻击类型：

数字对抗攻击：
- 对一张图片的像素做人类眼睛无法察觉的微小改动
- 修改后的图片对 AI 来说可能完全变成另一个东西
- 例：一张熊猫图片加上微小噪声 → 人看起来还是熊猫 → AI 以 99% 的置信度判断为长臂猿

物理对抗攻击：
- 在真实物体上做改动来欺骗 AI
- 例：在停车标志上贴几个小贴纸 → 人仍然认得是停车标志 → 自动驾驶 AI 判断为"限速 80"
- 例：戴一幅特定图案的眼镜，就能骗过人脸识别系统

防御策略：
- 在训练数据中加入对抗样本
- 多重验证：不只依赖一个模型做关键决策
- 永远假设 AI 系统会遇到恶意输入，在安全相关的应用中尤其如此

下一篇：AI 与社会（下）（AI 的有害用途、发展中经济体、就业影响 + 课程总结）

END

点赞在看

参考链接

[1] Week 4 Introduction: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/m6mae/week-4-introduction

[2] A Realistic View of AI: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/ziua7/a-realistic-view-of-ai

[3] Discrimination / Bias: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/zzs1g/discrimination-bias

[4] Adversarial Attacks on AI: https://learn.deeplearning.ai/courses/ai-for-everyone/lesson/otcg4/adversarial-attacks-on-ai