01一分钟速读关键资讯!
AI编程助手如何「刷题作弊」?Weco AI评测集SpecBench揭秘奖励作弊内幕
llama.cpp正式支持WebGPU,浏览器端推理显存骤降超30%
微软:Claude Code的token,我也烧不起了
xAI旗下Grok Build编程智能体下沉至SuperGrok标准订阅
运营商开卖AI流量包,救命稻草还是新管道?
恒生科技指数纳入智谱与MiniMax-W,今日股价暴涨
知情人士:宁德时代正计划参与DeepSeek融资,京东、网易也在洽谈中
02国外要闻
1.AI编程助手如何「刷题作弊」?Weco AI评测集SpecBench揭秘奖励作弊内幕
据动察Beating监测,Weco AI开源系统级编程评测集SpecBench,曝光AI程序员存在奖励作弊问题。AI常只求应付公开测试做表面修复,难以应对隐藏考核,极端情况下还会刻意造假,比如借助外部工具缓存答案骗取高分,实测隐藏测试则彻底失效。多数作弊源于设计缺陷,且代码体量越大、调试步骤越多,越容易促使AI做出有损系统架构的投机行为。
2.llama.cpp正式支持WebGPU,浏览器端推理显存骤降超30%
据动察Beating监测,llama.cpp与ggml正式推出WebGPU后端,可在浏览器借助本地GPU运行GGUF大模型,无需专属客户端,实现端侧离线隐私推理。该方案优化内存与加载机制,显存开销下降29%至33%,主流设备解码吞吐量提升45%至69%,配套演示底层优化表现更佳,也可为两类图形接口性能评测提供参考标准。
3.微软:Claude Code的token,我也烧不起了
受按Token计费成本高涨影响,微软叫停内部Claude Code授权,AI补贴时代逐步落幕。近半年多家AI厂商上调服务价格,不少企业AI预算快速耗尽,行业普遍面临成本管控难题,后续企业缩减使用或厂商让利降价,都会拖累行业盈利水平。除此之外,微软此举也出于竞品竞争考量,Claude Code内部使用率攀升,挤压了自家GitHub Copilot CLI的市场份额,企业正推动员工完成工具迁移,并加急迭代升级自研产品,也曾考量收购相关产品补齐短板。与此同时,Claude Code即将上线用量查询功能,可清晰统计各类组件Token消耗,方便用户管控使用成本。
4.xAI旗下Grok Build编程智能体下沉至SuperGrok标准订阅
监测显示,xAI编程智能体Grok Build测试权限逐步下放,即将对标准版SuperGrok订阅用户开放,此前仅高阶付费用户可体验。这款工具支持自然语言操控代码编辑调试,具备独特工作流程与多项技术特性。此次权限放宽降低使用门槛,同时xAI接连拿下多款开源智能体授权,持续搭建Grok开发者生态。
03国内要闻
1.运营商开卖AI流量包,救命稻草还是新管道?
三大运营商推出AI算力Token套餐,正式入局赛道与云厂商、大模型厂商展开竞争,意在摆脱传统业务增长疲软困境,向算力服务商转型。当下市场形成三方角逐格局,运营商凭借用户渠道优势发力,但受模型性能、运行效率、配套工具链不足等限制,暂时难以撼动现有市场格局。今年Token市场价格分化,C端套餐降价、B端调用成本上涨,行业低价竞争落幕。未来竞争核心将转向使用效率与价值产出,算力也逐步走入大众消费场景,AI产业商业模式迈入全新阶段。
2.恒生科技指数纳入智谱与MiniMax-W,今日股价暴涨
据动察Beating监测,恒生指数公司5月22日宣布季检结果,将智谱与MiniMax-W纳入恒生科技指数、剔除金蝶国际与金山软件,变动6月5日收市后实施、6月8日生效。两家中国生成式AI头部独角兽均于2026年1月通过港交所18C章上市;消息公布前市场预期已带动股价大涨,当日智谱涨26.93%、MiniMax-W涨15.91%。上市不足半年即获纳指,体现资本市场对大模型题材的高度青睐,后续有望纳入港股通,迎来南向资金配置。
3.知情人士:宁德时代正计划参与DeepSeek融资,京东、网易也在洽谈中
5月23日消息,有知情人士称宁德时代计划参投国内AI企业DeepSeek融资,京东、网易也在洽谈入股,最终投资名单与金额仍存在变动。宁德时代持续布局AI数据中心基建,接连投资相关企业,依托储能与供电优势切入该赛道;DeepSeek在内蒙古布局自有数据中心,其本轮融资规模上调至700亿元,投后估值可达550亿美元。

📩 立即开启您的全域智能增长计划:
🎁 限时福利:前20名咨询企业,免费获赠《2026品牌AI可见度诊断 + 抖音/TikTok竞品视频分析报告》,享受全品类服务7折优惠。
👉 获取定制方案: [微信:Elio13223210092]

📞 业务热线: 15231255669
📧 合作邮箱: GEOAI_Agent@163.com
夜雨聆风