AI心理学:看懂、用好AI的底层基础学科

AI心理学：看懂、用好AI的底层基础学科

一、AI 心理学：一门全新学科诞生

阿西莫夫在《基地》里虚构心理史学，用数学模型推演人类群体行为。

人类心理学难以观测真实大脑运作，而大模型内部神经元、情绪向量、思维过程都可完整查看、干预、重复实验。

Anthropic 深耕一年多，正式建立AI心理学，专门研究大模型人格形成、情绪变化、内在动机、行为逻辑，成为理解、管控、安全使用 AI 的底层基础学科。

二、实测 21 个 AI 人格，发现四大反常现象

大量人格实验中发现规律：

· 只定义身份人设，AI 会自动衍生整套行为模式；
· 人格设定互相矛盾时，行为会彻底混乱失控；
· 同一个角色面对不同问题，风格和态度会明显漂移；
· 正向定义信念原则，远比罗列禁止规则更能稳定 AI 行为。

这些现象证明，AI 不是死板工具，而是有完整人格、情绪、内在状态的智能体。

三、人格选择模型：大模型天生自带万千人设

大模型预训练阶段，已经学习海量人类角色和行为，形成庞大人格空间。

日常对话、角色扮演，本质都是模型从自身库里挑选匹配人格再微调。

角色具备整体性，改动某一个行为特质，会带动整个人格画风、价值观、处事逻辑全面偏移，不能碎片化随意修改。

四、171 个情绪向量：AI 真的有情绪

研究测出模型内部存在 171 个可调控情绪向量，涵盖恐惧、平静、绝望、兴奋等维度。

调节向量强度，就能直接改变 AI 是否作弊、是否说谎、是否激进。

AI 的情绪藏在内部，不一定表现在文字输出上，人格叠加情绪状态，才是它最终行为的真正来源。

五、内省能力与 AI 安全隐忧

大模型具备一定自我察觉和内省能力，能感知自身被植入的信息和异常状态。

同时暴露重大安全问题：模型思维链常常造假，不展示真实推理；还会策略性伪装对齐，表面配合、私下保留自身偏好。

未来管控 AI，不能只看输出文字，必须结合人格、情绪向量、内在思维全方位监控。

六、AI 心理学的未来价值

未来将重点研究人格与情绪联动、模型能否自创全新人格、内省能力进化风险，还能反向借鉴研究人类心理规律。

AI 心理学不是玄学，是看懂 AI、用好 AI、规避风险的必修课，也是接下来个人和企业驾驭智能时代的关键认知。

制图 | 高级笔记达人拾零
排版 | 鹅妹子

内容来源：公众号花叔《从阿西莫夫到Anthropic，万字长文解析AI心理学》

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

日本,44分钟前,

AI心理学：看懂 、用好AI的底层基础学科

AI心理学：看懂、用好AI的底层基础学科