AI世界的秘密词汇与金钱游戏:为什么你必须读懂它们今天主要的新闻如下:TechCrunch发布AI术语表,详解AGI、LLM、幻觉、权重等核心概念。英伟达今年已承诺400亿美元AI股权投资,涉及OpenAI、康宁等,被指循环交易。你被AI术语绕晕了吗AGI、LLM、RAG、RLHF。 这些缩写像密码。 让聪明人也头疼。 但它们不是密码。 是入口。人工智能正在重塑世界。 同时也催生了一整套新语言。 不懂这语言,就像在异国他乡没有翻译。 你会被忽悠。 你会错过机会。 你会看不清脚下的路。TechCrunch刚刚更新了一份AI术语表。 像一本活字典。 随着技术进化,它会不断生长。 我从中挑出最关键的几个词。 用短句讲清楚。 再结合另一条新闻—— 英伟达今年已砸下400亿美元。 你就会明白: 术语的背后,是生态。 生态的中心,是钱。首先,到底什么是AGIAGI,通用人工智能。 一个模糊但诱人的词。 OpenAI的Sam Altman说: “相当于一个中等水平的人类,你可以雇为同事。” OpenAI章程则定义得更功利: “在大多数有价值的经济工作中表现优于人类的自主系统。” Google DeepMind说:“在大多数认知任务上至少与人类能力相当。” 你看,连定义都在打架。 AI女神祖母也坦言: 不知道AGI到底是什么。 可这并不妨碍人们疯狂追逐它。AGI像挂在驴子眼前的胡萝卜。 让无数公司日夜狂奔。 这个词,是方向,也是焦虑。AI代理:你的数字员工AI agent,即AI代理。 比聊天机器人更进一步。 它能替你报销费用、订机票、写代码。 想象一下: 一个永不睡觉的实习生。 但要明白,基础设施仍在建设中。 它对不同人意味不同功能。 核心概念是自主性—— 利用多个AI系统,完成多步骤任务。还有一个更具体的词: 编码代理。 专门写代码的代理。 能自主编写、测试、调试。 能在整个代码库中运行。 发现错误,推送修复。 但仍然需要人类审查。 就像一个速度超快、从不分心的实习生。 你得盯着点儿。大语言模型:你每天在聊的东西LLM,大型语言模型。 当你在用ChatGPT、Claude、Gemini、AI Llama、Copilot或Le Chat时, 你就在跟LLM对话。 这些模型有数十亿参数。 这些参数像编织词语关系的地图。 从数十亿书籍和文本中学到模式。 你提问,它匹配模式。LLM的底层是神经网络。 一种多层结构,灵感来自人脑。 而深度学习,是让这种结构自我改进的方法。 模型从错误中学习,调整自身。 但需要海量数据。 也需要巨大算力。 这算力就叫compute。 通常指GPU、TPU等硬件。幻觉:AI也会瞎编幻觉,是AI行业最尴尬的词。 指模型凭空捏造信息。 比如给出有害医疗建议。 问题源于训练数据有空白。 这正推动垂直化AI的趋势。 专精一个领域,减少空白。 减少胡说八道。为了减少幻觉,还有微调。 用专门数据继续训练模型。 让它在特定任务上更准。 还有迁移学习。 把旧模型的知识用到新任务上。 节省时间。怎么训练AI:从数据到智慧训练,是把数据喂给模型。 让它学会预测。 这个过程很贵。 因为需要海量输入。 训练时,模型调整自己的权重。 权重决定每个特征的重要性。 比如预测房价, 卧室数量的权重大,还是车位的权重大? 模型自己找答案。训练中还有个重要指标: 验证损失。 数值越低越好。 它防止模型死记硬背, 而不是真正理解。 研究者像盯股票一样盯着这个数字。强化学习是另一种方式。 就像用零食训宠物。 AI尝试动作,获得奖励。 它自己探索环境。 在游戏和机器人上效果拔群。 基于人类反馈的强化学习(RLHF), 让模型更安全、更有用。推理与记忆:让AI更快、更省推理是运行模型的过程。 让它实际回答你的问题。 推理离不开训练。 推理也依赖于内存缓存。 一种优化技术,保存部分计算。 避免重复工作。 让响应更快。Token是人与AI沟通的桥梁。 文本被切分成小片段。 每个token算一次账。 企业按token付费。 用得多,花得多。 Token吞吐量衡量同时处理能力。 越高,服务的人越多,速度越快。 研究人员为吞吐量痴迷。 AI研究员Andrej Karpathy说: 看到AI订阅闲置他心焦。 就像研究生时看着昂贵硬件空转。并行化,就是同时干多件事。 现代GPU之所以强, 正因为它能并行执行上千次计算。 是AI行业硬件的支柱。RAMageddon:内存短缺的末日这个词有点戏谑。 但背后是真实的危机。 RAM芯片全球短缺。 因为AI公司抢购大量内存。 留给其他人的越来越贵。 游戏机涨价。 智能手机出货量可能大跌。 企业自己数据中心的内存也难保证。 这是AI繁荣带来的连锁反应。 价格飙升,看不到尽头。英伟达的400亿美元赌局说回钱。 英伟达不仅是卖芯片的。 它也是AI领域最大的投资者。 今年它已承诺投出超过400亿美元。其中最多的一笔, 是给OpenAI的300亿。 它还投了康宁,32亿美元。 投了数据中心运营商IREN,21亿美元。 还有二十多家初创公司。 这些公司,很多也是英伟达的客户。 这引发了循环交易的批评。 钱在同一批公司间转圈。 分析家说,这可能是在建“竞争护城河”。术语是表象。 资本才是暗流。 英伟达用投资绑定客户。 同时推动算力需求。 你用的AI背后, 是权重、是训练、是推理、是并行化。 而这一切,都需要英伟达的GPU。你必须学会这语言当你读懂这些术语, 你就看清了AI世界的底层逻辑。 AGI是梦想。 LLM是引擎。 幻觉是风险。 权重是知识。 训练是成长。 推理是表达。 Token是货币。 RAMageddon是溢出效应。 英伟达是庄家。未来已来,只不过分布不均。 但这些词,会像水和电一样渗透生活。 趁现在,看懂它们。 你就不会被时代抛下。本文整合自TechCrunch报道,术语表将定期更新。