Anthropic凭借11插件引发全球股市震荡 AI日报 20260206-夜雨聆风

Anthropic凭借11插件引发全球股市震荡 AI日报 20260206

开源音乐生成模型ACE-Step 1.5 ：商业级音质，支持ComfyUI，消费级硬件生成完整歌曲仅需不到10秒

ACE-Step 1.5 采用创新混合架构，从根本上改变了AI生成音乐的方式。其核心是一个全能语言模型，可将简单的用户指令转化为完整的歌曲蓝图，支持从短片段循环到10分钟长曲的各类创作需求。

商业级音质表现：在标准评估指标中，ACE-Step 1.5 的音质超越多数商业音乐模型，音乐连贯性评分达4.72。
极速生成效率：在RTX 5090显卡上，生成一首4分钟完整歌曲仅需约1秒；即使是RTX 3090，也能控制在10秒以内。
适配消费级硬件：仅需不到4GB显存即可运行。
支持50+种语言：严格遵循50多种语言的指令，其中英语、中文、日语、韩语、西班牙语、德语、法语、葡萄牙语、意大利语及俄语的支持效果尤为出色。
思维链规划：模型通过思维链推理整合元数据、歌词与描述信息，引导扩散生成过程，最终产出连贯性更强的长篇音乐作品。

ACE-Step 1.5 现已在 ComfyUI 中获得首日支持

PaperBanana：多智能体协作，谷歌x北大联手打造学术版Nano Banana

Nano Banana之后，谷歌又发布了PaperBanana，旨在把科研人员从耗时的论文插图绘制工作中解放出来。

学术插图是信息承载的核心，也是传播过程的关键瓶颈：既要准确呈现方法细节，又要符合版式、标注与可编辑规范。因此，高质量学术插图的产出长期被视为研究中的劳动密集环节。Nano Banana虽提升了图像质量与指令遵从，但单一生成模型仍难满足学术出版要求。

模拟研究人员制造论文图表从找顶会过往参考图，规划自己如何作图，到画图并根据参考图进行精调的过程，PaperBanana背后就是规划了5个分工明确的智能体协同工作：

Retriever Agent（检索智能体）：从顶会论文库中，找到与你要画的图领域、结构最相似的参考案例。
Planner Agent（规划智能体）：把论文文字描述，转化为包含所有模块、逻辑的详细绘图说明书。
Stylist Agent（风格智能体）：总结学术审美规范，给说明书加上配色、排版等“美颜”标准。
Visualizer Agent（可视化智能体）：根据说明书，直接画图或写代码出图，产出初稿。
Critic Agent（批判智能体）：检查图的对错与美观度，提出修改意见，循环迭代3轮优化。

采用了“VLM-as-a-Judge”（大模型当裁判）的评估范式——让强大的视觉语言模型如Gemini-3-Pro作评判，将PaperBanana生成的图与测试集标准答案进行逐项对比。主要从：忠实性、简洁性、可读性、美观性，四个维度进行对比，其结果为：

在匿名的人类盲测中，研究员有72.7%的情况认为PaperBanana生成的图比基线模型更好。
在需要高精度的统计图表任务中，PaperBanana的“代码生成模式”在数值忠实性上与人类水平相当，而简洁性和美观性甚至略胜一筹。

谷歌北大联手学术版Banana爆火，论文图表100%精确生成

a16z掌门人谈AI投资：我们正迎来史无前例的多重赢家时代

本文编译自a16z2026年1月13日的访谈，由Jen Kha对话Ben Horowitz，探讨了顶级风投机构的管理哲学与AI时代投资趋势：

科技企业很少能一开始就掌握所有信息。
如今我们正身处人工智能浪潮的初期阶段，但平庸公司与卓越公司的关键差异，往往在于是否允许员工进行创造性冒险，同时又是否过度追究责任。
我们最大的误区在于，总把目光聚焦在企业的某些短板上，而非关注其核心竞争力和卓越表现。要知道，虽然人人都能自诩擅长某项领域，但真正需要验证的是：他们是否真正在该领域独步天下？这才是值得投资的核心价值所在，而非盲目追捧那些“多面手”。
我们始终关注关键节点：他们如何展现能力？把握机会的敏锐度如何？赢得机会的效率怎样？整体表现如何？我们如何评估当前质量？毕竟有些项目能成功，有些则失败，但并非所有事情都完美无缺。
说到底，决策能力是关键在于什么让你擅长这个。这其实是智慧与判断力的结合，而判断力本身又是智慧和知识的融合。所以问题在于：你掌握了多少知识？又有多聪明？如何将这些知识转化为正确的判断？在组织中，知识往往与实际干活的人紧密相连。
人们通常并不是在找你，他们真正需要的是清晰。就像很多组织需要的，往往不是正确性，而是清晰度。有了清晰，你就能行动。
如果回溯到三四年前，当时人们普遍认为，大型基础模型就像超级智能大脑，能比任何其他技术都更胜一筹。但现实发展却并非如此。如今的实际情况是，这些大型模型确实提供了至关重要的基础设施，所有企业都在不同程度上依赖其发展。但值得注意的是，对于任何特定应用场景而言，不仅需要模拟人类行为的长尾效应，更需要深入理解这种行为模式的复杂性。

喝点VC｜a16z掌门人谈AI投资：我们正迎来史无前例的多重赢家时代

Anthropic凭借11插件引发全球股市震荡

本周Anthropic Claude Cowork上线11款覆盖了销售、财务、法律、数据、市场营销等多个领域的插件。

在官网介绍中，Anthropic是这么描述其能力的：你可以将各种Skills、connector、斜杠命令和子智能体（sub-agents）整合在一起，让Claude变身为精通岗位、团队和公司业务的「特种兵」。

通过Cowork+插件组合，AI能力不用再嵌套在现有软件中运行，而是Cowork直接接管整条业务工作流，把「应用层」直接端掉，将对应业务系统软件取而代之。

这种模式的出现，释放了一个强烈的信号，大模型正在杀入所谓的「应用层」。模型能力供给的策略和商业模式已发生转变：单纯提供API（工具）→「即插即用」工作流。

摩根大通发文称：Anthropic正在让Saas商业模式崩塌！

一位大佬锐评，市场终于从冰冷数学逻辑中惊醒：如果模型能直接交付成果，传统的软件将毫无价值。

全球股市给出最强烈反馈，软件、金融服务及资产管理板块遭遇2850亿美元市值蒸发

高盛美国软件股指数暴跌6%（创4月以来最大单日跌幅），金融服务业指数跌近7%，纳斯达克100指数盘中跌2.4%，创关税风波以来最大单日跌幅。印度IT行业龙头塔塔咨询服务公司（Tata Consultancy Services Ltd.）盘中暴跌6%，印孚瑟斯（Infosys Ltd.）跌幅达7.1%。澳交所上市的云端会计软件商Xero有限公司（Xero Ltd.）单日跌幅扩大至16%，创2013年以来最大跌幅。

GenAI作为行塑社会生产力的底层能力，正处在颠覆行业既有格局、价值网络的临界点。

以法律及咨询行业作为参考，Anthropic作为AI初创企业正在重塑法律行业版图。早在其插件发布前，Legora和Harvey AI等初创企业已用AI工具冲击法律行业基础工作。投资者对法律AI的追捧持续超两年，Harvey AI去年6月估值达50亿美元，Legora同年10月完成18亿美元估值融资。

此次发布的「法律插件」可实现合同端到端审查与法律文书自动化撰写（会特别提示”所有输出内容需经执业律师审核”）。

摩根士丹利分析师托尼·卡普兰（Toni Kaplan）团队在研报中指出：”Anthropic将’Cowork’功能拓展至法律领域，加剧了行业竞争，这对汤森路透构成潜在威胁。”

同时Anthropic作为模型供应商，不仅可自主开发定制行业模型，同时借助Claude code，Cowork以及MCP、Skills等打造的模型形成生产力的生态，使得Anthropic们可以自底层向应用全价值链供给AI自动化解决方案。

和此次市场具有相同意义的事件是：上周谷歌母公司Alphabet Inc.推出Project Genie（可根据文字或图像提示生成沉浸式世界），导致游戏股跟随下跌。

万亿市值一夜蒸发！Claude Cowork血洗全球软件业，老黄急了

Anthropic凭借11插件引发全球股市震荡 AI日报 20260206

wang

猜你喜欢

评论抢沙发

wang

猜你喜欢

评论 抢沙发

评论抢沙发