TSAI (task-specific AI, 任务特异AI) ≈ 灵长类动物
AGI (Artificial general intelligence, 通用人工智能) ≈ 智人

一、TSAI 与 AGI的区别
智能面对的四要素: 封闭环境:面对的环境、场景、状态不会变化,不需要适应; 开放环境:环境多变,领域广泛,没有边界,需要个体去适应; 静态策略:遵循预先设定的规则,执行时依据既定规则进行决策,没有调整空间 动态策略:需要根据不同情况变化,进行策略调整,再进行决策
封闭环境+静态策略
案例
高铁机场的人脸识别系统、单位门禁、手机的面部解锁FaceID等身份验证和安防场景 基于固定行为模式的推荐系统:APP根据用户既往使用习惯,推荐用户可能喜好和感兴趣的内容(只是依据旧数据,并不会随着用户当下喜好心情而变化) 特点 变量可控、策略明确、可靠性高、可信度高
开放环境+静态策略
案例 Cyc项目:由斯坦福大学Douglas Lenat于1984年创建,旨在构建一个全面的常识知识库和推理系统,涉及包括物理常识、社会规则、经济文化等多个领域和复杂环境,但是决策依据依赖纯手工输入,Cyc只能依据输入的形式化命题逻辑系统进行推演和决策,无法超越既定的预设规则。 早期医学专家系统:按照症状匹配疾病进行诊断 特点 逻辑严谨、规则明确,适用于标准化和稳定的知识领域(如标准化诊断某疾病),不会受到情感倾向、道德标准、个人经验的影响 无法根据环境变化进行决策策略调整(如多种疾病相互作用下的病情) 知识的更新换代非常迅速,何况涉及了多个领域、交叉学科,每一次更新都需要输入新的规则 Note 既然环境发生变化,决策策略怎么能不进行灵活调整,开放环境+静态策略在当今社会注定是失败的。
封闭环境+动态策略
案例 AlphGo围棋模型:固定的环境(围棋棋盘、黑子白子)和胜负评判标准,对弈棋盘信息公开,需要实时根据棋局,计算出胜算最高的走法,随时调整落子策略。不同于静态策略的AI围棋程序,AlphGo的决策并非一次性生成的。 特斯拉全自动驾驶:固定的环境(在道路上行走)和评判标准(安全行驶且不违反交通规则),需要根据道路交通情况和驾驶场景,动态调整驾驶决策 AlphaFold2蛋白质结构预测模型:固定的环境(分子生物学、氨基酸-多肽-蛋白质三维结构)和评判标准(能够结合),根据动态变化的“靶点”,按照既定的规则生成可能结合的蛋白质分子 特点 任务问题定义清晰、边界明确,目标清晰、评判标准明确 具有自我强化学习和自适应优化的能力,寻找极限最优解,在封闭环境中甚至能超过人类专家的水平
开放环境+动态策略:通向AGI
案例 当今的高等智能生物——人类,每天都在应对不同的、多变的生活场景和挑战,充当不同的社会角色。人与人也有区别,越高级的人能够应对的场景越多,决策也更加优秀。 GPT-4o 未来的AGI 特点 多环境、多领域、多模态、多学科等等:Variable 使用同一个神经网络处理所有任务,就像人只用一个脑子做所有的事情 暂时无法拥有类似人类一样的“直觉”
二、硅基智能如何模拟碳基智能
模拟行为
方法: 把智能体 (Agent) 当成“巴甫洛夫的狗”进行条件反射训练 Reinforcement learning (强化学习) : Agent通过与环境交互,学习最优的行为策略:做对/做错→奖励/惩罚→反馈 让智能体模拟人类进化 Reword function (奖励函数):所有复杂行为和学习系统的核心都是通过奖励信号指导和驱动,没有动机、没有目标、没有情感,奖励就是一切·!所有智能行为都可以通过奖励函数建模。 特点 适用于特定任务场景,任务定义清晰、目的规则明确、评判标准和反馈明确 强化学习的时间尺度太长,从生命诞生至今,碳基智能进化了38亿年 强化学习需要的复杂环境和环境反馈非常巨大,变量和参数非常多,远超当前技术所承载的极限,而且真实环境的复杂度远非模拟环境可比 强化学习无法模拟碳基智能进化的基因积累和遗传、跨世代生物学机制优化、种群选择等层面 强化学习无法处理反馈延迟的问题。比如处理夫妻婚姻问题,即时反馈是爱情的快感,长期反馈是生活的幸福,如果人类只依赖即时反馈,那么将不可能有长期经营的婚姻。
模拟神经
方法:Brain simulation 脑模拟 计算机软硬件层面复制人脑的运行机制,构建与生物神经网络相似的计算机结构 区别:脑模拟 V.S 神经形态计算(工程研究,计算和优化类脑芯片,模拟生物神经系统的特征,不追求物理层面的高度精细建模。) 打造硅基系统的神经元连接、突触形态:

霍普菲尔德神经网络(Hopfield neural network),1982 属于递归神经网络(Recurrent NN),最早的“脑模拟”雏形 神经元自反馈和相互连接,形成网络循环 通过能量函数最小化错误,稳定地恢复存储的模式 特点 擅长模式识别和联想记忆,适用于低延迟、轻量级、因果性强的任务:语音唤醒、实时手写识别、可穿戴健康监测等。 缺陷:人脑神经元数量巨大,形态复杂度极高,却在脑模拟研究中单纯简化为“点模型”(Point neuron model,McCulloch-Pitts模型),只保留了输入和输出,忽略了突触的形态、分布、数量、结构,这些都与信号传递的优先级有关。 仿真的有效性?飞机成功不依赖于对鸟的羽毛翅膀的仿真模拟,而是依靠对空气动力学的理解和运用。 问题的真实性?研究计算机工作原理时发现,风扇转速快慢与机器运行速度有关,提出风扇是计算机智能的核心。 生物科学尚且未完全解开神经元结构以及如何实现复杂功能的谜底,研究者并不清除哪些神经元和脑区对智能起到决定性作用,哪些只是“辅助散热”作用。 智能的关键不在于精准复制每一个细节,而在于理解核心计算法则。
模拟认知
智能即思想,思想即认知。 通过具象的媒介,以捕捉和表达思想,让思想变得可操作和计算 这个媒介就是:语言。语言不仅承载思想,也塑造思想。 倘若某个概念或事物无法用语言描述或表达,我们就无法理解和讨论它,这便是超出了认知的边界。 [[AGI, Artificial General Intelligence#NLP 自然语言处理|自然语言处理]]可能是通向AGI最有希望的一条路 2022年11月30日ChatGPT诞生 Quote 语言的边界就是世界的边界。—— 路德维希·维特根斯坦 Ludwig Wittgenstein:《逻辑哲学论》
世界的边界是由我们所能表达的语言范围决定。
参考资料:《通用人工智能——认知、教育与生存方式的重构》刘嘉
夜雨聆风