乐于分享
好东西不私藏

Anthropic凭借11插件引发全球股市震荡 AI日报 20260206

Anthropic凭借11插件引发全球股市震荡 AI日报 20260206

开源音乐生成模型ACE-Step 1.5 :商业级音质,支持ComfyUI,消费级硬件生成完整歌曲仅需不到10秒

ACE-Step 1.5 采用创新混合架构,从根本上改变了AI生成音乐的方式。其核心是一个全能语言模型,可将简单的用户指令转化为完整的歌曲蓝图,支持从短片段循环到10分钟长曲的各类创作需求。

  • 商业级音质表现:在标准评估指标中,ACE-Step 1.5 的音质超越多数商业音乐模型,音乐连贯性评分达4.72。

  • 极速生成效率:在RTX 5090显卡上,生成一首4分钟完整歌曲仅需约1秒;即使是RTX 3090,也能控制在10秒以内。

  • 适配消费级硬件:仅需不到4GB显存即可运行。

  • 支持50+种语言:严格遵循50多种语言的指令,其中英语、中文、日语、韩语、西班牙语、德语、法语、葡萄牙语、意大利语及俄语的支持效果尤为出色。

  • 思维链规划:模型通过思维链推理整合元数据、歌词与描述信息,引导扩散生成过程,最终产出连贯性更强的长篇音乐作品。

ACE-Step 1.5 现已在 ComfyUI 中获得首日支持

PaperBanana:多智能体协作,谷歌x北大联手打造学术版Nano Banana

Nano Banana之后,谷歌又发布了PaperBanana,旨在把科研人员从耗时的论文插图绘制工作中解放出来。

学术插图是信息承载的核心,也是传播过程的关键瓶颈:既要准确呈现方法细节,又要符合版式、标注与可编辑规范。因此,高质量学术插图的产出长期被视为研究中的劳动密集环节。Nano Banana虽提升了图像质量与指令遵从,但单一生成模型仍难满足学术出版要求。

模拟研究人员制造论文图表从找顶会过往参考图,规划自己如何作图,到画图并根据参考图进行精调的过程,PaperBanana背后就是规划了5个分工明确的智能体协同工作:

  • Retriever Agent(检索智能体):从顶会论文库中,找到与你要画的图领域、结构最相似的参考案例。

  • Planner Agent(规划智能体):把论文文字描述,转化为包含所有模块、逻辑的详细绘图说明书。

  • Stylist Agent(风格智能体):总结学术审美规范,给说明书加上配色、排版等“美颜”标准。

  • Visualizer Agent(可视化智能体):根据说明书,直接画图或写代码出图,产出初稿。

  • Critic Agent(批判智能体):检查图的对错与美观度,提出修改意见,循环迭代3轮优化。

采用了“VLM-as-a-Judge”(大模型当裁判)的评估范式——让强大的视觉语言模型如Gemini-3-Pro作评判,将PaperBanana生成的图与测试集标准答案进行逐项对比。主要从:忠实性、简洁性、可读性、美观性,四个维度进行对比,其结果为:

  • 在匿名的人类盲测中,研究员有72.7%的情况认为PaperBanana生成的图比基线模型更好。

  • 在需要高精度的统计图表任务中,PaperBanana的“代码生成模式”在数值忠实性上与人类水平相当,而简洁性和美观性甚至略胜一筹。

谷歌北大联手学术版Banana爆火,论文图表100%精确生成

a16z掌门人谈AI投资:我们正迎来史无前例的多重赢家时代

本文编译自a16z2026年1月13日的访谈,由Jen Kha对话Ben Horowitz,探讨了顶级风投机构的管理哲学与AI时代投资趋势:

  • 科技企业很少能一开始就掌握所有信息。

  • 如今我们正身处人工智能浪潮的初期阶段,但平庸公司与卓越公司的关键差异,往往在于是否允许员工进行创造性冒险,同时又是否过度追究责任。

  • 我们最大的误区在于,总把目光聚焦在企业的某些短板上,而非关注其核心竞争力和卓越表现。要知道,虽然人人都能自诩擅长某项领域,但真正需要验证的是:他们是否真正在该领域独步天下?这才是值得投资的核心价值所在,而非盲目追捧那些“多面手”。

  • 我们始终关注关键节点:他们如何展现能力?把握机会的敏锐度如何?赢得机会的效率怎样?整体表现如何?我们如何评估当前质量?毕竟有些项目能成功,有些则失败,但并非所有事情都完美无缺。

  • 说到底,决策能力是关键在于什么让你擅长这个。这其实是智慧与判断力的结合,而判断力本身又是智慧和知识的融合。所以问题在于:你掌握了多少知识?又有多聪明?如何将这些知识转化为正确的判断?在组织中,知识往往与实际干活的人紧密相连。

  • 人们通常并不是在找你,他们真正需要的是清晰。就像很多组织需要的,往往不是正确性,而是清晰度。有了清晰,你就能行动。

  • 如果回溯到三四年前,当时人们普遍认为,大型基础模型就像超级智能大脑,能比任何其他技术都更胜一筹。但现实发展却并非如此。如今的实际情况是,这些大型模型确实提供了至关重要的基础设施,所有企业都在不同程度上依赖其发展。但值得注意的是,对于任何特定应用场景而言,不仅需要模拟人类行为的长尾效应,更需要深入理解这种行为模式的复杂性。

喝点VC|a16z掌门人谈AI投资:我们正迎来史无前例的多重赢家时代

Anthropic凭借11插件引发全球股市震荡
本周Anthropic Claude Cowork上线11款覆盖了销售、财务、法律、数据、市场营销等多个领域的插件。
在官网介绍中,Anthropic是这么描述其能力的:你可以将各种Skills、connector、斜杠命令和子智能体(sub-agents)整合在一起,让Claude变身为精通岗位、团队和公司业务的「特种兵」。
通过Cowork+插件组合,AI能力不用再嵌套在现有软件中运行,而是Cowork直接接管整条业务工作流,把「应用层」直接端掉,将对应业务系统软件取而代之。
这种模式的出现,释放了一个强烈的信号,大模型正在杀入所谓的「应用层」。模型能力供给的策略和商业模式已发生转变:单纯提供API(工具)→「即插即用」工作流。
摩根大通发文称:Anthropic正在让Saas商业模式崩塌!
一位大佬锐评,市场终于从冰冷数学逻辑中惊醒:如果模型能直接交付成果,传统的软件将毫无价值。
全球股市给出最强烈反馈,软件、金融服务及资产管理板块遭遇2850亿美元市值蒸发
高盛美国软件股指数暴跌6%(创4月以来最大单日跌幅),金融服务业指数跌近7%,纳斯达克100指数盘中跌2.4%,创关税风波以来最大单日跌幅。印度IT行业龙头塔塔咨询服务公司(Tata Consultancy Services Ltd.)盘中暴跌6%,印孚瑟斯(Infosys Ltd.)跌幅达7.1%。澳交所上市的云端会计软件商Xero有限公司(Xero Ltd.)单日跌幅扩大至16%,创2013年以来最大跌幅。
GenAI作为行塑社会生产力的底层能力,正处在颠覆行业既有格局、价值网络的临界点。
以法律及咨询行业作为参考,Anthropic作为AI初创企业正在重塑法律行业版图。早在其插件发布前,Legora和Harvey AI等初创企业已用AI工具冲击法律行业基础工作。投资者对法律AI的追捧持续超两年,Harvey AI去年6月估值达50亿美元,Legora同年10月完成18亿美元估值融资。
此次发布的「法律插件」可实现合同端到端审查与法律文书自动化撰写(会特别提示”所有输出内容需经执业律师审核”)。
摩根士丹利分析师托尼·卡普兰(Toni Kaplan)团队在研报中指出:”Anthropic将’Cowork’功能拓展至法律领域,加剧了行业竞争,这对汤森路透构成潜在威胁。”
同时Anthropic作为模型供应商,不仅可自主开发定制行业模型,同时借助Claude code,Cowork以及MCP、Skills等打造的模型形成生产力的生态,使得Anthropic们可以自底层向应用全价值链供给AI自动化解决方案。
和此次市场具有相同意义的事件是:上周谷歌母公司Alphabet Inc.推出Project Genie(可根据文字或图像提示生成沉浸式世界),导致游戏股跟随下跌。
万亿市值一夜蒸发!Claude Cowork血洗全球软件业,老黄急了
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Anthropic凭借11插件引发全球股市震荡 AI日报 20260206

评论 抢沙发

9 + 8 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮