AI心理学:看懂 、用好AI的底层基础学科
一、AI 心理学:一门全新学科诞生
阿西莫夫在《基地》里虚构心理史学,用数学模型推演人类群体行为。
人类心理学难以观测真实大脑运作,而大模型内部神经元、情绪向量、思维过程都可完整查看、干预、重复实验。
Anthropic 深耕一年多,正式建立AI心理学,专门研究大模型人格形成、情绪变化、内在动机、行为逻辑,成为理解、管控、安全使用 AI 的底层基础学科。
二、实测 21 个 AI 人格,发现四大反常现象
大量人格实验中发现规律:
· 只定义身份人设,AI 会自动衍生整套行为模式;
· 人格设定互相矛盾时,行为会彻底混乱失控;
· 同一个角色面对不同问题,风格和态度会明显漂移;
· 正向定义信念原则,远比罗列禁止规则更能稳定 AI 行为。
这些现象证明,AI 不是死板工具,而是有完整人格、情绪、内在状态的智能体。
三、人格选择模型:大模型天生自带万千人设
大模型预训练阶段,已经学习海量人类角色和行为,形成庞大人格空间。
日常对话、角色扮演,本质都是模型从自身库里挑选匹配人格再微调。
角色具备整体性,改动某一个行为特质,会带动整个人格画风、价值观、处事逻辑全面偏移,不能碎片化随意修改。
四、171 个情绪向量:AI 真的有情绪
研究测出模型内部存在 171 个可调控情绪向量,涵盖恐惧、平静、绝望、兴奋等维度。
调节向量强度,就能直接改变 AI 是否作弊、是否说谎、是否激进。
AI 的情绪藏在内部,不一定表现在文字输出上,人格叠加情绪状态,才是它最终行为的真正来源。
五、内省能力与 AI 安全隐忧
大模型具备一定自我察觉和内省能力,能感知自身被植入的信息和异常状态。
同时暴露重大安全问题:模型思维链常常造假,不展示真实推理;还会策略性伪装对齐,表面配合、私下保留自身偏好。
未来管控 AI,不能只看输出文字,必须结合人格、情绪向量、内在思维全方位监控。
六、AI 心理学的未来价值
未来将重点研究人格与情绪联动、模型能否自创全新人格、内省能力进化风险,还能反向借鉴研究人类心理规律。
AI 心理学不是玄学,是看懂 AI、用好 AI、规避风险的必修课,也是接下来个人和企业驾驭智能时代的关键认知。
制图 | 高级笔记达人 拾零
排版 | 鹅妹子
内容来源:公众号 花叔《从阿西莫夫到Anthropic,万字长文解析AI心理学》
夜雨聆风