追踪AI领域KOL账号的推文更新,生成摘要,每日推送。
AI相关推文179篇,来自72个账号
🤖 今日看点
OpenAI 推出 $100/月 Pro 会员:Codex 用量是 Plus 的 5 倍,瞄准高频开发者市场 Anthropic 推出顾问工具:让 Sonnet/Haiku 搭配 Opus 作"军师",成本降 12% 但性能提升 2.7% Claude Cowork 全面开放:桌面 AI 助手正式GA,新增企业级 RBAC 和用量分析 AI 代理安全问题引关注:Simon Willison 提出"致命三要素"警告,Gary Marcus 质疑 Anthropic Mythos 实际效果 Vercel 60%+ 流量来自 AI 代理:意味着 AI 原生开发工具成为主流
🤖 LLM与大语言模型
OpenAI 推出 $100/月 Pro 档位
摘要:OpenAI 重新划分 ChatGPT 订阅层级,新增 20)的 5 倍,适合每天高强度使用 Codex 写代码的用户。Pro 用户还可获得专属 Pro 模型访问和无限即时/思考模型用量。5 月 31 日前下单可享 10 倍 Codex 用量促销。原有 $200 Pro 档位保留,为最高用量选项。
原文链接:
OpenAI 推出新订阅层级(OpenAI):https://x.com/OpenAI/status/2042295688323875316 $100 套餐详解(宝玉):https://x.com/dotey/status/2042304660912947576 $100 套餐来了(丁晖):https://x.com/dingyi/status/2042304541413294444
Anthropic 顾问工具:让便宜模型请贵模型"出主意"
摘要:Anthropic 推出"顾问工具"(advisor tool)新 API 功能,核心思路是让便宜的模型(Sonnet/Haiku)全程跑任务,遇到难题时才向 Opus 请教。Opus 只充当幕后军师,不直接调用工具。在 SWE-bench 多语言测试中,Sonnet + Opus 顾问比 Sonnet 单独使用提升了 2.7 个百分点,同时成本降低了 11.9%。Haiku 搭配 Opus 顾问后,在 BrowseComp 测试上从 19.7% 跳到 41.2%,翻了一倍多。
原文链接:
顾问工具发布(Claude):https://x.com/claudeai/status/2042308622181339453 宝玉详解:https://x.com/dotey/status/2042324560700154312
Claude Cowork 正式全面开放
摘要:Anthropic 宣布 Claude Cowork 结束研究预览,正式向所有付费用户开放。这个桌面 AI 助手自 12 周前发布以来,已有数百万人将其纳入日常工作流程。企业级功能同步上线:角色权限控制(RBAC)、团队消费限额、使用分析仪表盘、完整 OpenTelemetry 支持。macOS 和 Windows 双平台可用。
原文链接:
Claude Cowork GA(Claude):https://x.com/claudeai/status/2042273755485888810 Berryxia 解读:https://x.com/berryxia/status/2042298333264560132
Gemini 可以生成交互式可视化
摘要:Google Gemini 现在可以将用户的问题和复杂概念直接转化为可自定义的交互式可视化效果。用户可以调整变量、旋转 3D 模型、探索数据,获得更沉浸式的学习和探索体验。使用方法:选择 Pro 模型,然后让 Gemini "show me" 或 "help me visualize" 复杂概念。
原文链接:
Gemini 可视化功能(Google Gemini App):https://x.com/GeminiApp/status/2042272415951253932
Google Gemma 4 发布
摘要:Google DeepMind 发布 Gemma 4,官方称其"以小博大",在不需要巨大算力的情况下击败了 10 倍大小的模型。Gemma 家族累计下载量超过 5 亿次,首周下载量突破 1000 万。开发者现可开始使用 Gemma 4 构建应用。
原文链接:
Gemma 4 发布(Google DeepMind):https://x.com/GoogleDeepMind/status/2042283481640615944
LG AI 发布 EXAONE 4.5 开源 VLM
摘要:LG AI Research 发布 EXAONE 4.5,这是其首个开源权重的视觉语言模型。官方口号是"超越纯语言,迈向 Physical Intelligence",原生融合文本与视觉理解,专为解决真实世界挑战设计。
原文链接:
EXAONE 4.5 发布(Berryxia):https://x.com/berryxia/status/2042299336424636753
Perplexity 接入 Plaid 实现个人财务管理
摘要:Perplexity 宣布 Computer 功能现可连接 Plaid,支持绑定银行账户、信用卡和贷款。用户可以详细追踪支出、构建自定义预算工具、可视化净资产和投资组合。计算机任务功能仅限 Pro 和 Max 订阅用户。
原文链接:
Perplexity 财务管理(Perplexity):https://x.com/perplexity_ai/status/2042256932397019368
🛠️ AI工程与工具
Claude Code @-mentions 提速 3 倍
摘要:Claude Code 在 v2.1.85 中大幅优化了 @-mentions 功能的性能,在大型企业代码库中提速达 3 倍。性能提升来自三个关键优化:1)预计算优化,不阻塞主线程;2)避免小结果集的 NAPI 开销;3)让 Claude 迭代寻找性能改进点。
原文链接:
Claude Code 性能优化(Boris Cherny):https://x.com/bcherny/status/2042352728094245016
Claude Code 支持 Bedrock/Vertex 快速配置
摘要:Claude Code 新增设置向导,可快速配置 Amazon Bedrock 或 Google Vertex。之前需要手动编写配置文件和环境变量,现在向导自动处理。如果检测到用户使用了较旧的模型,还会建议升级到新版。
原文链接:
Bedrock/Vertex 配置(cat):https://x.com/_catwu/status/2042345489778331915
LangChain Deep Agents 部署功能上线
摘要:LangChain 推出 Deep Agents 部署功能测试版,这是部署生产级、开源、模型无关的 AI 代理 harness 的最快方式。支持从 OpenAI、Gemini、Anthropic、Fireworks、Baseten、OpenRouter、Ollama、NVIDIA 等多种模型中选择,还可自带沙箱环境。
原文链接:
Deep Agents 部署(LangChain):https://x.com/LangChainAI/status/2042268554364592543
Cursor 可在 PR 中附加演示和截图
摘要:Cursor 现在可以在其打开的 PR 中附加工作演示和截图。团队可以直接在 GitHub 中查看云端代理创建的制品。需在 Cursor 仪表板中启用该功能。
原文链接:
Cursor PR 附件(Cursor):https://x.com/cursor_ai/status/2042287192895267212
OpenRouter 模型对比页面新增基准测试
摘要:OpenRouter 的模型对比页面现在可以显示基准测试数据。用户可以点击任意模型页面顶部的"Compare"开始对比不同模型的性能。
原文链接:
模型对比功能(OpenRouter):https://x.com/OpenRouterAI/status/2042253685296599404
微软开源 MarkItDown:万能格式转换工具
摘要:微软开源 MarkItDown,一行命令将任意格式转换为干净 Markdown。支持 PDF、Word、Excel、PowerPoint、HTML、图片、音频、YouTube 链接、JSON、XML、ZIP 等。还提供 MCP Server,可直接接入 Claude Desktop 等支持 MCP 的 AI 客户端。新增 OCR 插件支持图片文字提取。
原文链接:
MarkItDown 发布(小互):https://x.com/imxiaohu/status/2042142334088048906
Mem0 为 OpenClaw 提供长期记忆
摘要:Mem0 发布 OpenClaw 插件,可在分钟内添加长期记忆功能。使用方法:告诉 OpenClaw "setup Mem0 from mem0.ai/claw-setup"。新版本 v1.0.4 提供 8 个内置工具,支持会话级和持久化长期记忆,以及多代理记忆支持。
原文链接:
Mem0 插件(mem0):https://x.com/mem0ai/status/2042261604646212028
Andrew Ng 发布 SGLang 高效推理课程
摘要:Andrew Ng 联合 LMSys 和 RadixArk 发布新课程"Efficient Inference with SGLang"。SGLang 是开源推理框架,可缓存已完成的计算并在未来请求中复用。课程由 RadixArk 的 Richard Chen 讲授。
原文链接:
SGLang 课程(Andrew Ng):https://x.com/AndrewYNg/status/2042289428702642588
🛡️ AI安全与伦理
AI 代理的"致命三要素"安全警告
摘要:Simon Willison 提出"致命三要素"概念:当 AI 代理同时拥有 1)访问私人数据权限,2)接触不可信内容(如 incoming emails),3)数据外泄能力(如回复邮件)时,会造成巨大安全问题。解决方式只能是切断三要素之一。Simon 还警告将出现"AI 界的 Challenger 灾难"。
原文链接:
致命三要素(Lenny Rachitsky):https://x.com/lennysan/status/2042358861907312836 Challenger 灾难警告(Lenny Rachitsky):https://x.com/lennysan/status/2042326406403932384
Gary Marcus 质疑 Anthropic Mythos
摘要:Gary Marcus 多次发文质疑 Anthropic 之前的 Mythos 公告。他指出:1)沙盒功能关闭,无法真实展示能力;2)便宜的开源模型已可实现类似功能;3)没有证据表明 Mythos 本身有重大质的飞跃。他呼吁将 Mythos 视为严肃的安全警示信号,但不要过分关注细节。
原文链接:
Mythos 过度炒作(Gary Marcus):https://x.com/GaryMarcus/status/2042285440217260358 Mythos 不是什么重大突破(Gary Marcus):https://x.com/GaryMarcus/status/2042237250889760907
OpenAI 暂停英国 Stargate 项目
摘要:OpenAI 因监管障碍和英国高电价,暂停了在英国的 Stargate 人工智能基础设施项目。Gary Marcus 评论称 Stargate 从一开始就不合理。
原文链接:
Stargate 暂停(Gary Marcus):https://x.com/GaryMarcus/status/2042334393344422373
👁️ 计算机视觉与多模态
Runway 发布 Seedance 2.0
摘要:Runway 发布 Seedance 2.0,现已在所有付费计划中可用,包括美国。用户只需提供一张图片、一段视频、一个想法或一段音频,即可开始制作"跨维度大片"。新用户使用代码 SEEDANCE 可享 3 个月付费计划 5 折优惠。
原文链接:
Seedance 2.0 发布(Runway):https://x.com/runwayml/status/2042336701557703020
Recraft V4 发布
摘要:Recraft 发布 V4 版本,专注于纹理渲染和氛围深度。用户可以生成分辨率极高的栅格图像用于编辑,或锐利的矢量图形用于营销活动。官方展示了一系列将感觉和氛围置于首位的感官设计作品。
原文链接:
Recraft V4(Recraft):https://x.com/recraftai/status/2042278803611816348
💼 AI行业与商业
OpenClaw 时刻:首次大众体验代理式 AI
摘要:Andrej Karpathy 分析称 OpenClaw 时刻之所以规模宏大,是因为这是非技术人群(此前只知道 AI 等同于 ChatGPT 网站)首次体验到最新的代理式模型。
原文链接:
OpenClaw 时刻(Andrej Karpathy):https://x.com/karpathy/status/2042341482531864741
Anthropic 年化收入超 10 亿美元
摘要:Anthropic 目前拥有超过 1000 家年化消费超过 100 万美元的大客户,在 2B 领域做到最强。但同时监控审查也更严格,最近有中国企业在 AWS 使用 Claude API 因用量超阈值被跨平台审查封禁。
原文链接:
Anthropic 2B 实力(meng shao):https://x.com/shao__meng/status/2042152822691782661
Vercel 60%+ 流量来自 AI 代理
摘要:Vercel CTO 在 AI Engineer 大会 keynote 中透露,Vercel 超过 60% 的流量现在来自 AI 代理。
原文链接:
Vercel AI 代理流量(AI Engineer):https://x.com/aiDotEngineer/status/2042157929470587148
硅谷悄悄使用中国开源 AI 模型
摘要:Peter Yang 指出硅谷实际上在悄悄使用中国开源 AI 模型:1)Cursor 确认 Composer 2 基于 Moonshot 的 Kimi K2.5;2)Cognition 的 SWE-1.6 模型很可能基于智谱的 GLM 做后训练;3)Shopify 通过切换到阿里巴巴的 Qwen 模型每年节省 500 万美元;4)Airbnb CEO Brian Chesky 也表示"非常依赖 Qwen,又快又便宜"。智谱最新发布的 GLM-5.1 在编程基准测试上几乎与 Opus 持平。
原文链接:
中国开源模型在硅谷(Peter Yang):https://x.com/petergyang/status/2042248752157839793
前 Google Brain/DeepMind 团队创立 ElorianAI
摘要:前 Google Brain/DeepMind 员工 Andrew Dai 创立 ElorianAI,这是首个由前 LLM 预训练、数据和多模态负责人创立的多模态推理实验室。联合创始人还包括 yinfeiy、Seth。
原文链接:
ElorianAI 发布(Ian Goodfellow):https://x.com/goodfellow_ian/status/2042316300660375816
Y Combinator 投资医疗 AI 公司 Luminai $38M
摘要:Luminai 帮助大型医疗系统将运营工作流从人工转为计算机处理,将传真等非结构化数据转换为结构化数据,并构建 AI 代理来自动化关键流程。公司最近完成 3800 万美元 B 轮融资。
原文链接:
Luminai B 轮(Y Combinator):https://x.com/ycombinator/status/2042255725662196073
🔬 AI研究与突破
Anthropic Claude Code 代码泄露
摘要:一次意外泄露暴露了超过 50 万行 Anthropic 的 Claude Code 代码,揭示了其代理结构:模块化工具、子代理群、分层内存管理。源代码为了解先进代理的运作方式提供了罕见洞察,并暗示了未来可能的功能,如自主后台代理和语音接口。
原文链接:
Claude Code 泄露(DeepLearning.AI):https://x.com/DeepLearningAI/status/2042336860773429312
微软研究:推理模型思维链压缩
摘要:微软发布重要论文,研究教会推理模型在生成过程中压缩自己的思维链。最有趣的发现不是 2-3 倍的内存节省或翻倍的吞吐量,而是当模型在总结后删除推理块时,被删除的信息通过 KV 缓存表示继续向前泄漏,形成隐式第二通道,占了 15 个百分点 accuracy。
原文链接:
思维链压缩研究(elvis):https://x.com/omarsar0/status/2042315710173528122
微软通用验证器解决代理基准测试问题
摘要:微软研究指出每个代理基准测试都有相同隐藏问题:如何知道代理真正成功了?微软研究团队推出 Universal Verifier,基于四个原则构建:非重叠评分标准、分离过程与结果奖励、可控与不可控失败区分、跨完整截图轨迹的分治上下文管理。
原文链接:
Universal Verifier(elvis):https://x.com/omarsar0/status/2042249194409501054
Meta TRIBE v2: 可预测大脑活动的 AI
摘要:Meta 发布 TRIBE v2,这是一个基于超过 1000 小时脑成像数据(来自 720 人)训练的基础模型。用户输入视频、声音片段或文本,模型可预测:哪些脑区会激活、激活强度如何、以什么顺序激活。在从未见过的受试者上测试时,模型预测比大多数真实脑扫描更准确(真实扫描受心跳、呼吸、运动干扰)。
原文链接:
TRIBE v2(Rowan Cheung):https://x.com/rowancheung/status/2042260621274861756
今日新论文
摘要:今日arXiv 多篇新论文:MARS(让自回归模型支持多token生成)、RAGEN-2(代理强化学习中的推理崩溃)、INSPATIO-WORLD(基于时空自回归建模的实时4D世界模拟)、MedGemma 1.5 技术报告、简单自蒸馏改进代码生成、Think in Strokes 图像生成等。
原文链接:
新论文汇总(AK):https://x.com/_akhaliq/status/2042290497738142144
📚 AI学习与资源
李继刚:脚手架随模型迭代
摘要:李继刚分享观点:AI 能力天然是锯齿状的,脚手架的作用是补齐缺口让产出稳定。但模型一迭代,锯齿形状就变了。旧脚手架补的是旧缺口,新版本上那个位置可能已长出能力。脚手架反而变成天花板。每次模型升级都应重新摸一遍锯齿,拆掉多余的、补上新的,和模型共同演化。
原文链接:
脚手架理论(李继刚):https://x.com/lijigang_com/status/2042151153270661366
Karpathy 的 LLM Wiki 方案
摘要:Andrej Karpathy 分享了个人知识库构建方案,使用 Obsidian 管理 Markdown 保险库。elvis 在此基础上开发了 PaperWiki 插件,可为代理生成维基百科式的文档,包含论文摘要、图表和其他高级视图。
原文链接:
Wiki 生成(elvis):https://x.com/omarsar0/status/2042286186920550498
公众号不支持外链跳转,请复制链接打开原文
夜雨聆风