AI日报 | Anthropic联手华尔街组15亿美元合资公司,哈佛研究证实急诊诊断超越人类医生
Anthropic与华尔街巨头的15亿美元合资计划、哈佛证实AI诊断超越急诊医生、Google全面押注Agent时代——今天的AI世界,每一条都在重塑行业格局。
据《华尔街日报》报道,Anthropic正在与Blackstone(黑石集团)和Goldman Sachs(高盛)等华尔街巨头敲定一项规模达15亿美元的合资企业计划。
这家合资公司的目标非常明确:向私募股权支持的企业销售AI工具。这意味着Anthropic不再满足于作为API提供商等着开发者来调用Claude,而是主动深入金融与企业服务腹地,把AI能力打包成解决方案直接卖给传统行业。
开发者视角: 这个动作释放了一个重要信号——AI公司的商业化正在从”卖模型”转向”卖解决方案”。对开发者来说,这意味着未来围绕Claude构建的企业级工具链和生态会更加完善,但同时也意味着Anthropic可能会把更多资源倾斜到B2B场景而非纯开发者工具。
哈佛研究登Science:AI急诊诊断准确率67%,超越人类医生
哈佛医学院和Beth Israel Deaconess医学中心的研究团队在《Science》上发表了一项重磅研究,系统性地测试了大语言模型在真实急诊场景下的诊断能力。
研究团队选取了76名Beth Israel急诊室患者的真实病例,让OpenAI的o1和4o模型与两位内科主治医生进行盲评对照。结果令人震撼:o1模型在初始急诊分诊环节的准确诊断率达到67%,而两位经验丰富的医生分别只有55%和50%。
值得注意的是,研究团队强调他们”没有对数据做任何预处理”——AI模型看到的信息和医生在电子病历中能看到的完全一致。研究负责人Arjun Manrai表示:”我们几乎在所有基准上测试了AI模型,它都超越了之前的模型和我们的医生基线。”
开发者视角: 这不只是一篇论文的事。它发表在《Science》上,代表着学术界对LLM临床能力的正式认可。不过研究者也明确指出,当前AI应作为”第二意见”而非替代医生。对医疗AI开发者来说,重点在于:数据不预处理、使用真实EMR记录、盲评设计——这套方法论本身就是未来医疗AI产品落地的标准参考。
Sam Altman让GPT-5.5自己策划发布派对:请求”美丽而奇怪”
Sam Altman透露了一个有趣的细节:他问了GPT-5.5想要一个什么样的发布派对,AI的回答让他觉得”美丽但奇怪”(beautiful but strange)。尽管如此,他表示会照做。
这个花絮看似轻松,但背后透露的信息值得关注——GPT-5.5已经具备了足够的个性化表达能力,能给出超出预期的、带有”审美偏好”的回答。当一个AI模型能策划自己的派对时,我们或许该重新审视”AI有没有偏好”这个问题了。
开发者视角: GPT-5.5即将正式发布,从Altman的态度看,这个版本在创意和个性化表达方面可能有显著提升。对于做内容生成、对话系统的开发者,值得密切关注其API开放后的能力表现。
Google Gemini App全面改版:UI大手术
Google对Gemini App进行了一次彻底的界面重新设计,几乎触及了每一个UI元素。
主要变化包括:首页改用药丸形状的提示框,语音输入和Gemini Live入口移至右侧;新增”+”按钮可快速访问照片、相机和文件;工具列表重新整理,包含图片、视频、音乐、Canvas、Deep Research和Guided Learning等功能描述。此外,还有全新的彩色脉动渐变背景效果,以及模型选择器回归左上角下拉菜单。
在iOS端,这次改版深度融合了Apple的Liquid Glass设计语言。目前仍为有限范围灰度发布。
开发者视角: Gemini正在从”聊天机器人”进化成”AI工作站”。工具列表里同时出现图片、视频、音乐、Canvas和Deep Research,说明Google正在构建一个统一的多模态AI入口。对开发者来说,如果你在做类似的AI产品,这次改版的信息架构值得深入研究。
Google押注Agent取代App:Gemini Enterprise Agent Platform发布
Google在企业AI领域下了一步大棋——发布Gemini Enterprise Agent Platform,目标是用AI Agent替代传统应用程序。这个平台取代了原来的Vertex AI品牌,提供构建、扩展、治理和优化AI Agent的全链路能力。
这不只是改个名字。Google的判断是:未来企业IT架构的基本单元不再是App,而是Agent。每个业务流程都可以被一个或一组Agent接管,而不是通过传统的SaaS应用来完成。
开发者视角: 如果Google说得对,那我们正站在一个架构范式转移的起点上。对于企业级AI开发者来说,需要重新思考:你构建的到底是一个”应用”还是一个”Agent”?两者的设计哲学、交互模式和治理需求完全不同。值得关注的是平台提供的治理(Governance)能力——这可能是Agent大规模落地最关键的瓶颈。
Gemini for Home扩展至欧洲和亚太:智能家居AI化加速
Google Home负责人Anish Kattukaran确认,Gemini for Home功能正在欧洲和亚太地区加速扩展。支持的国家包括奥地利、比利时、丹麦、芬兰、法国、爱尔兰、意大利、荷兰、挪威、西班牙、瑞典、瑞士、英国、澳大利亚、日本和新西兰。
Google表示正在”每天清理”早期访问队列,用户只需在Home应用中申请即可被优先处理。
开发者视角: 智能家居是AI落地最直观的场景之一。Gemini替代Google Assistant进入家庭场景,意味着家庭环境中的多轮对话、上下文理解和设备控制能力会大幅提升。对IoT和智能家居开发者来说,该开始研究Gemini Home的API和集成方式了。
AI可能消灭入门级岗位:Forbes发出商业警报
Forbes发表深度评论文章,警告AI可能会大规模消灭入门级工作岗位,并认为”这应该让商业领袖感到恐惧”。
文章的核心论点是:AI最先自动化的恰恰是初级员工的常规任务——数据录入、基础分析、客服对话、文档处理等。这些岗位的消失不只是就业问题,更是人才培养管道的断裂。没有入门级岗位,企业未来从哪里培养中高级人才?
DataRobot也在近日提出了”Agent Supervisor”这一新角色概念——随着AI Agent承担越来越多的执行任务,人类的角色将转向”编排AI协作者”。
开发者视角: 这个趋势对技术人员同样适用。当AI能写代码、做测试、写文档时,”初级开发者”的定义正在被重写。但反过来看,能够”监督和编排AI”的人才缺口正在急剧扩大——这可能是下一波AI原生工具的最大市场。
以上就是今天的AI日报。从Anthropic深入华尔街到Google全面押注Agent,从AI诊断超越医生到入门级岗位面临重塑——2026年的AI行业,正在从”技术突破”阶段快速进入”产业重构”阶段。 作为开发者,我们既是这场变革的推动者,也是亲历者。保持关注,保持学习,保持构建。
夜雨聆风