昆仑万维发布SkyClaw-v1.0智能体模型,OpenClaw任务表现直逼Claude Opus 4.6
📌 今日重点
1✨ Windsurf核心工程师Ronak Malde离职Google DeepMind,放弃并购激励金商业动态
AI编程赛道再现核心人才流动。曾主导Windsurf旗下SWE-1 agentic coding模型训练的工程师Ronak Malde宣布从Google DeepMind离职,并放弃随并购附带的经济激励。2025年Google以24亿美元价格获取Windsurf技术许可后,Malde随团队并入DeepMind,深度参与Antigravity产品发布及Gemini 3研发。此次出走折射出AI Coding领域顶尖人才的剧烈流动:原Windsurf核心成员已分散流向OpenAI、xAI、Cursor等竞争对手。在编程Agent成为大模型公司必争之地的当下,关键工程师的去留正直接影响各家产品迭代节奏与技术路线走向,巨头以高额对价锁定团队的策略也面临考验。(机器之心)[查看详情]
2✨ 昆仑万维发布SkyClaw-v1.0智能体模型,OpenClaw任务表现直逼Claude Opus 4.6技术迭代昆仑万维
昆仑万维旗下天工AI正式推出SkyClaw-v1.0及其轻量版lite,针对OpenClaw、Claude Code、Hermes等主流Agent框架进行了深度优化。基准测试显示,新模型在PinchBench、Claw-Eval Pass^3等评测中超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6 35B,OpenClaw任务性能已逼近DeepSeek V4 Pro与Claude Opus 4.6水平。两款模型现已限时免费开放,并接入Skywork平台及apifree.ai。此举标志着国产模型在Agent专用方向上的能力梯队进一步拉近与海外顶级模型的差距,同时通过免费策略加速生态渗透,对开发者侧的工具链选型格局或将产生明显影响。(机器之心)[查看详情]
3阿里云在新加坡发布海外AI产品官网Qwen Cloud及Agent产品MuleRun,Qoder全球用户超500万产品动态阿里巴巴
阿里云面向海外市场发布全新AI产品官网Qwen Cloud和Agent产品MuleRun,同步发布Qoder 1.0及桌面智能体QoderWork。Qwen Cloud采用三入口设计(网站、Skills、CLI)让Agent可直接调用云能力,阿里云已对60多款云产品完成Skill化、MCP化和CLI化改造全面迈入Agentic Cloud,目前全球设有31个地域101个可用区,海外市场规模五年增长20倍。(AIPulse)[查看详情]
4✨ 字节Seed联合港科大推出MMProLong:12.8万Token训练预算撬动51.2万Token长文档处理技术迭代
字节跳动Seed团队携手香港科技大学发布多模态长文档模型MMProLong,在仅12.8万Token训练预算下实现对51.2万Token(约38万字)输入的无性能衰减处理,于MMLongBench、MM-NIAH等基准测试中全面超越InternVL3-38B与Gemma3-27B。该模型核心突破在于数据组织范式的革新:采用Seed2.0生成高质量长上下文问答对,替代传统OCR转录式训练,无需改动底层架构即可显著提升长上下文理解能力。目前该方法已在Qwen3-VL-8B上完成有效性验证,为低成本扩展多模态模型上下文窗口提供了新路径,对长文档解析、企业知识库等落地场景具有重要参考价值。(AI前沿早知道)[查看详情]
5✨ xAI推出Grok Build编程智能体,下一代Grok V9参数规模达1.5T技术迭代xAI
xAI于5月14日发布编程智能体Grok Build,并于25日向全体SuperGrok及X Premium+用户开放。马斯克同步披露内部在研的Grok V9模型参数规模达1.5T,约为当前公开版V8(0.5T)的三倍,专为英伟达Blackwell架构优化,训练数据与方法体系已全面重构。目前V9预训练已完成,后续将引入Cursor沉淀的真实开发者行为数据进行补充训练,SFT与RL流程预计3-4周内完成并上线。此举显示xAI正加速向编程智能体赛道渗透,意图借助算力与数据双重优势直接对标Anthropic、OpenAI在代码生成领域的领先身位,同时也反映出头部大模型厂商已将参数规模竞争重新提上日程。(AIPulse)[查看详情]
▪ OpenAI
1OpenAI Foundation宣布投入2.5亿美元应对AI经济变革商业动态
OpenAI Foundation宣布投入2.5亿美元资金,用于应对AI带来的经济变革与社会挑战,聚焦研究AI对就业市场的影响、推动经济转型中的公平分配,以及支持受AI冲击群体的技能再培训与社会适应项目。(OpenAI)
2OpenAI开闸广告业务:ChatGPT免费用户成上下文精准投放新入口商业动态
OpenAI正式扩大广告平台访问权限,向全球更多广告主开放入驻通道,并首次明确将庞大的ChatGPT免费用户群纳入投放范围,依托对话上下文特征实现精准触达。此举标志着大模型C端应用的商业化路径从单一订阅制转向“订阅+广告”双轨模式。考虑到ChatGPT周活跃用户已突破数亿规模,其上下文数据所承载的用户意图颗粒度远超传统搜索广告,有望重塑数字广告价值链。短期看,这是OpenAI对冲千亿级算力投入与基础设施支出的必要财务动作;长期则可能挤压Google搜索广告基本盘,并倒逼Anthropic、Perplexity等同行加速跟进商业化变现。对话式广告的形态、归因机制与用户体验平衡,将成为下一阶段行业焦点。(9466 AI精选)
3AI周报:11月21-28日全球人工智能关键动向盘点
本期AI周报以日历形式系统梳理了11月21日至28日全球人工智能领域的标志性事件,覆盖Google AI、OpenAI、ChatGPT、Gemini及LaMDA等主流厂商与模型的最新进展。从技术突破、产品迭代到商业化落地与监管博弈,本周AI赛道持续呈现高频更新态势:头部厂商围绕基础模型能力、Agent生态及多模态应用的竞争进一步白热化,开源与闭源路线的分化亦在加剧。栏目以三分钟精炼速读的形式,提炼出关键趋势、应用场景与实操要点,为从业者把握行业脉搏、识别投资与产品机会提供决策参考。(Tavily Discovery)
▪ Google
1✨ Windsurf核心工程师Ronak Malde离职Google DeepMind,放弃并购激励金商业动态
AI编程赛道再现核心人才流动。曾主导Windsurf旗下SWE-1 agentic coding模型训练的工程师Ronak Malde宣布从Google DeepMind离职,并放弃随并购附带的经济激励。2025年Google以24亿美元价格获取Windsurf技术许可后,Malde随团队并入DeepMind,深度参与Antigravity产品发布及Gemini 3研发。此次出走折射出AI Coding领域顶尖人才的剧烈流动:原Windsurf核心成员已分散流向OpenAI、xAI、Cursor等竞争对手。在编程Agent成为大模型公司必争之地的当下,关键工程师的去留正直接影响各家产品迭代节奏与技术路线走向,巨头以高额对价锁定团队的策略也面临考验。(机器之心)[查看详情]
2Gemini计费机制重构:Pro用户实际额度从免费版33倍骤降至4倍商业动态Google
Google于5月20日对Gemini订阅服务实施关键调整,将原有的按对话条数计费模式转为基于底层算力消耗的动态计量机制,并叠加5小时滚动窗口与每周总量双重上限,但具体消耗系数对用户不透明。此举导致Pro订阅用户的实际可用额度相对免费版的倍数从33倍急剧压缩至约4倍,配套的Antigravity编程平台同步收紧配额,已引发用户大规模退订。值得关注的是,OpenAI与Anthropic近期亦相继转向按量计费或混合定价模型。这标志着AI订阅行业的底层商业逻辑正从SaaS式的’包月畅用’全面切换至云计算式的’按消耗结算’,背后反映的是大模型推理成本压力下,厂商对重度用户隐性补贴的系统性退出。(AIPulse)[查看详情]
3谷歌搜索上线Preferred Sources功能,新闻分发权重向用户让渡产品动态Google
谷歌正式在搜索及Top Stories板块推出Preferred Sources功能,允许用户自主指定信任的媒体源并赋予其更高展示权重。此举打破了以往纯算法主导的新闻聚合黑盒,将部分内容分发的控制权交还用户。在AI生成内容泛滥、信源可信度普遍承压的背景下,该功能既是对监管层关于平台透明度诉求的回应,也是谷歌应对Perplexity、ChatGPT Search等AI搜索新势力分流的防御性举措。值得关注的是,该机制或将重塑流量分发逻辑——优质垂类媒体有望借此绕开SEO竞争直达核心读者,而依赖算法推荐的低质内容站点流量结构将面临重构。(AIPulse)
▪ Anthropic
1✨ 昆仑万维发布SkyClaw-v1.0智能体模型,OpenClaw任务表现直逼Claude Opus 4.6技术迭代昆仑万维
昆仑万维旗下天工AI正式推出SkyClaw-v1.0及其轻量版lite,针对OpenClaw、Claude Code、Hermes等主流Agent框架进行了深度优化。基准测试显示,新模型在PinchBench、Claw-Eval Pass^3等评测中超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6 35B,OpenClaw任务性能已逼近DeepSeek V4 Pro与Claude Opus 4.6水平。两款模型现已限时免费开放,并接入Skywork平台及apifree.ai。此举标志着国产模型在Agent专用方向上的能力梯队进一步拉近与海外顶级模型的差距,同时通过免费策略加速生态渗透,对开发者侧的工具链选型格局或将产生明显影响。(机器之心)[查看详情]
2Karpathy入职Anthropic仅授MTS头衔,AI巨头以扁平职级抵御猎头精准挖角商业动态
前OpenAI联合创始人、特斯拉AI总监Andrej Karpathy近日更新个人简介,确认以MTS(Member of Technical Staff,技术员工)身份加入Anthropic。值得关注的是,Instagram联合创始人Mike Krieger(现负责Claude Code)、前Google副总裁Peter Bailis等重量级高管,入职时同样仅授予MTS这一基础技术头衔。该制度脱胎于施乐PARC实验室,OpenAI与Anthropic的MTS年薪区间为21万至53万美元,覆盖从初级工程师到顶尖科学家。头部AI公司刻意推行扁平化职级体系,一方面强化技术驱动的组织文化,另一方面则在人才争夺白热化的当下,规避竞争对手通过LinkedIn职级信息定向猎挖核心人员,构成一道隐性的人才护城河。(量子位)[查看详情]
3Anthropic三线并发:Opus 4.8现身Vertex后台,Sonnet 4.8跳级,Mythos 1专攻安全编程技术迭代Anthropic
Anthropic产品矩阵罕见地出现三线齐发迹象。其一,Claude Opus 4.8已在Google Vertex AI后台被开发者发现,部署在即;其二,Sonnet 4.8跳过4.7版本号直接亮相,相关信息源自一份51.2万行的TypeScript代码泄露,视觉理解准确率预计突破98%,但Token消耗同步上升约30%,发布窗口指向6月中旬;其三,代号Mythos 1的新模型以claude-mythos-1-preview标识出现在Claude界面,定位安全编程与漏洞挖掘,内部测试已识别逾万个高危漏洞。三线并发显示Anthropic正加速从通用大模型向垂直能力(编程、视觉、安全)纵深扩展,与OpenAI、Google的差异化竞争意图明显,安全编程赛道或将成为下一个被重点争夺的企业级市场。(AIPulse)[查看详情]
▪ 字节跳动
1✨ 字节Seed联合港科大推出MMProLong:12.8万Token训练预算撬动51.2万Token长文档处理技术迭代
字节跳动Seed团队携手香港科技大学发布多模态长文档模型MMProLong,在仅12.8万Token训练预算下实现对51.2万Token(约38万字)输入的无性能衰减处理,于MMLongBench、MM-NIAH等基准测试中全面超越InternVL3-38B与Gemma3-27B。该模型核心突破在于数据组织范式的革新:采用Seed2.0生成高质量长上下文问答对,替代传统OCR转录式训练,无需改动底层架构即可显著提升长上下文理解能力。目前该方法已在Qwen3-VL-8B上完成有效性验证,为低成本扩展多模态模型上下文窗口提供了新路径,对长文档解析、企业知识库等落地场景具有重要参考价值。(AI前沿早知道)[查看详情]
2网龙携手火山引擎落地2000门AI课程,豆包大模型重构教育生产链路产品动态
网龙宣布接入火山引擎豆包大模型,依托其多模态能力搭建覆盖文本、图像、视频的全链路AI课程智能生产体系,并率先调用Seedance 2.0 API用于教育AIGC内容生成。目前该体系已落地2000余门标准化课程,服务多所院校及上万名师生。按规划,网龙2026年将以每月新增1500门以上的速度扩充AI融合课程库,同步推进IDC业务全量上云,大数据资源利用率预计提升50%。此次合作标志着头部教育科技厂商正加速将通用大模型能力工程化嵌入课程生产环节,从单点工具应用转向规模化、标准化的内容工业体系,教育AIGC的生产效率与成本结构有望迎来结构性变化。(火山引擎)[查看详情]
3字节跳动布局”Agent World”商标,AI智能体战略再添新筹码商业动态
天眼查信息显示,北京字跳网络技术有限公司近期密集申请注册多枚”AGENT WORLD”商标,覆盖教育娱乐、科学仪器等国际分类,目前均处于等待实质审查阶段。此举折射出字节跳动在AI智能体(Agent)赛道的纵深布局意图。继扣子(Coze)平台和豆包系列产品之后,”Agent World”商标的多类别覆盖暗示字节或将打造面向C端的智能体生态聚合平台,可能涉及虚拟世界、教育应用及科研工具等多元场景。在OpenAI、Anthropic加速推进Agent化战略的全球背景下,字节此番商标储备既是品牌防御性动作,也为其下一代AI产品矩阵预留入口,国内大厂的Agent商业化竞争正趋白热化。(财联社AI daily)[查看详情]
▪ 阿里巴巴
1阿里云在新加坡发布海外AI产品官网Qwen Cloud及Agent产品MuleRun,Qoder全球用户超500万产品动态阿里巴巴
阿里云面向海外市场发布全新AI产品官网Qwen Cloud和Agent产品MuleRun,同步发布Qoder 1.0及桌面智能体QoderWork。Qwen Cloud采用三入口设计(网站、Skills、CLI)让Agent可直接调用云能力,阿里云已对60多款云产品完成Skill化、MCP化和CLI化改造全面迈入Agentic Cloud,目前全球设有31个地域101个可用区,海外市场规模五年增长20倍。(AIPulse)[查看详情]
2通义实验室升级AgentScope 2.0:以权限与事件机制破解智能体工程化落地难题技术迭代阿里巴巴
通义实验室正式发布AgentScope 2.0,框架定位由“透明开发”转向“系统工程”,直指当前智能体规模化落地的核心痛点。新版本引入六项关键能力:统一重试与备用模型机制保障长链路任务稳定性,Content Block消息结构重构多模态交互,流式事件系统提升实时响应能力,系统化权限控制为工具调用建立安全边界,结构化上下文管理缓解Token膨胀,Middleware扩展机制则增强框架可插拔性。框架已兼容Qwen、Anthropic、DeepSeek、Gemini等主流模型。此次升级标志着智能体框架竞争重心正从开发便捷性转向生产级稳定性与可观测性,为企业级Agent部署提供了更具工程化纵深的底层支撑。(AIPulse)[查看详情]
3同济医院联手阿里云:千问大模型切入脑科学与消化道肿瘤精准诊疗商业动态
华中科技大学同济医院与阿里云、武汉硚口区政府达成三方战略合作,将基于阿里云全栈AI能力与千问大模型的多模态推理能力,在脑科学神经疾病、消化系统肿瘤两大临床方向展开联合科研攻关。合作中,阿里云承担MaaS平台与算力底座角色,支撑医疗影像、病理切片、基因组学等多源异构数据的模型训练与智能诊疗应用落地。此次签约延续了头部三甲医院与云厂商深度绑定的产业趋势:大模型正从通用对话场景加速向垂直医疗专科渗透,多模态推理与专科数据闭环成为决定临床落地价值的关键变量,国产基础模型在医疗领域的工程化落地节奏明显提速。(阿里云)[查看详情]
▪ 腾讯
1腾讯混元Hy-MT2切换至Apache 2.0协议,全面解除商用限制商业动态
腾讯混元团队近日将其Hy-MT2模型的开源许可协议由原有方案更换为Apache 2.0,这意味着开发者与企业可无限制地自由使用、修改、分发并进行商业化部署,无需再受限于此前的附加条款。Apache 2.0作为业界最宽松的开源协议之一,包含明确的专利授权条款,能够有效降低企业在合规审查与商业集成层面的法律风险。此次协议调整延续了国内厂商在开源策略上的进一步松绑趋势,与近期Meta Llama、阿里Qwen等模型的开放路线形成呼应。对腾讯而言,此举有助于扩大混元系列在中小企业及海外开发者群体中的渗透率,强化其在开源大模型生态中的影响力,并为后续多模态及垂直领域模型的市场化铺路。(X)
2光帆科技联手腾讯出行:全球首款视觉感知AI耳机重塑出行交互产品发布tencent
5月29日,光帆科技宣布与腾讯出行服务达成战略合作,旗下光帆AI全感穿戴设备(含全球首款视觉感知AI耳机及AI手表)将全面接入腾讯出行服务生态,由后者提供全栈AI能力支持。此次合作的核心在于颠覆传统叫车流程——用户无需掏出手机、开App、逐级筛选,仅通过一句语音指令即可完成车辆呼叫。这标志着可穿戴设备正从被动信息载体向主动服务入口演进,AI耳机叠加视觉感知能力后,有望成为继手机之后的下一代人机交互终端。对腾讯而言,借助硬件入口拓展出行服务边界;对光帆科技而言,借助腾讯生态资源加速场景落地,双方在AI硬件商业化路径上具备示范意义。(雷锋网)
▪ 百度
1百度Q1财报:AI业务营收136亿首超半壁江山,智能云同比增长79%商业动态
百度最新季度财报显示,公司总营收达321亿元,其中AI业务贡献136亿元,占核心业务收入比重首次突破50%,标志着其业务结构转型进入实质性兑现期。细分来看,AI云收入88亿元,同比增长79%;其中GPU云收入暴涨184%,反映出大模型训练与推理需求的强劲拉动。AI应用收入25亿元,AI原生营销服务收入23亿元、同比增长36%,验证了商业化路径的多元落地。技术层面,文心5.1在Omdia中文创意写作评测中斩获四项最高评级并位列综合第一,SuperCLUE-Writing以87.57分领跑国内。算力、模型与应用三层闭环初步成型,百度正加速从搜索公司向AI基础设施供应商重塑估值逻辑。(百度)[查看详情]
▪ 其余重点关注
1腾讯ima打通WorkBuddy知识库,Copilot结束十万人排队全面开放产品动态
腾讯ima与WorkBuddy完成产品级互通,用户可在WorkBuddy中一键授权调用ima中的个人资料及共享文档作为AI工作上下文,生成结果亦可回传ima沉淀,形成知识流转闭环。同期,此前排队人数超10万的ima Copilot功能正式全面开放,知识号则升级为能力发布入口,首批接入的官方Skill包括微信读书和腾讯招聘。此举标志着腾讯正加速将ima从个人知识管理工具,向具备开放生态的AI能力中台演进,通过打通内部产品矩阵与第三方场景,强化其在企业及个人AI Agent市场的卡位。(腾讯云)[查看详情]
2✨ xAI推出Grok Build编程智能体,下一代Grok V9参数规模达1.5T技术迭代xAI
xAI于5月14日发布编程智能体Grok Build,并于25日向全体SuperGrok及X Premium+用户开放。马斯克同步披露内部在研的Grok V9模型参数规模达1.5T,约为当前公开版V8(0.5T)的三倍,专为英伟达Blackwell架构优化,训练数据与方法体系已全面重构。目前V9预训练已完成,后续将引入Cursor沉淀的真实开发者行为数据进行补充训练,SFT与RL流程预计3-4周内完成并上线。此举显示xAI正加速向编程智能体赛道渗透,意图借助算力与数据双重优势直接对标Anthropic、OpenAI在代码生成领域的领先身位,同时也反映出头部大模型厂商已将参数规模竞争重新提上日程。(AIPulse)[查看详情]
3秘塔AI搜索升级事实核验能力,视频索引扩容十倍、检索效率翻倍产品动态秘塔
秘塔AI搜索发布重要功能迭代,新增事实核验模块,可对用户上传内容自动识别事实性细节、追溯多方信源并生成结构化核验报告,直击当前生成式搜索领域普遍存在的幻觉与虚假信息痛点。同期,其视频搜索库容量扩展至原有规模的十倍,搜索深度提升33%,API与产品端检索速度同步翻倍。此次升级反映出AI搜索赛道的竞争重心正从单纯的对话生成,转向信源可信度、多模态覆盖广度及响应效率的综合较量,事实核验能力或将成为下一阶段产品差异化的关键指标。(秘塔AI搜索)[查看详情]
▪ 行业动态
1蚂蚁集团:2030年Token消耗将激增300倍,全球活跃智能体规模有望达22亿行业洞察
在支付宝AI支付生态大会上,蚂蚁集团研究院院长庄蹯提出,Token、数据与工具正取代传统要素,成为数字经济时代的核心生产资料。蚂蚁预测,到2030年全球Token消耗量将较当前增长逾300倍,活跃智能体规模将攀升至22亿,年执行任务量达400万亿次。这一预测折射出业界对Agent经济爆发式扩张的高预期,也意味着算力供给、推理成本及Token计价体系将面临根本性重构。对支付、清结算等基础设施而言,面向智能体的服务协议与商业化模式或将成为下一阶段竞争焦点,蚂蚁此番布局亦显示其欲抢占AI支付入口的战略意图。(财联社AI daily)[查看详情]
2小扎要和老黄“亲儿子”抢饭吃行业动态
Meta要做云的“云”。(钛媒体)
3外卖大战一周年“后遗症”初显:订单骤降,骑手却暴涨到2000万行业动态
2025年,外卖江湖掀起近年罕见的全面战争。一年以后,这场大战留下了什么?“外卖大战后遗症来了,跑外卖还是一份兜底职业吗?”“人越来越多,订单越来越少”“僧多粥少,外卖行业真的要变天了”……今年以来,各类社交平台上涌现大量关于“外卖大战后遗症”的讨论,与此前聚焦外卖大战拉低消费价格、本质是反倾销的视角略有不同,随着平台补贴退潮,“骑手过剩”“单量下降”“骑手收入被摊薄”等外卖大战带来的“后遗症”正(雷锋网)
夜雨聆风