乐于分享
好东西不私藏

AI 资讯日报 2026-05-01 OpenRouter 上线 stealth 模型 Owl Alpha ,百万上下文

AI 资讯日报 2026-05-01 OpenRouter 上线 stealth 模型 Owl Alpha ,百万上下文

   

     

2026年5月1日 星期五 · 共 51 条 AI 资讯

   

   

     

今日摘要

     

1. OpenRouter上线Owl Alpha模型,支持百万级上下文

     

2. Anthropic推出Claude Security测试版,基于Opus 4.7扫描漏洞

     

3. Gemini CLI更新至v0.40.0,支持本地模型与分层记忆

     

4. 阿里Qoder推出远程控制功能及数字员工QoderWake

     

5. Cloudflare与Stripe合作,支持AI Agent自动完成部署

     

6. OpenClaw发布安全复盘及版本更新,集成DeepInfra与NVIDIA

     

7. Hermes Agent 发布 v0.12.0,新增技能自动清理功能

     

8. OpenAI 为 ChatGPT 账户推出高级安全设置

     

9. 谷歌相册将推出 AI 数字衣橱功能,夏季上线安卓端

     

10. 快手上线桌面 AI 智能体 KroWork,支持固化工作流

     

11. Stripe在Sessions 2026大会发布288项金融基建功能升级

     

12. ChatGPT图像生成2.0版本提升复杂图表绘制能力

     

13. GPT 5.5 Pro模型新增思考模式切换功能

     

14. xAI 推出 Grok 4.3 Beta 模型,降价六成并支持访问计算机

     

15. OpenAI引入WebSocket协议,接口响应速度提升40%

     

16. 快手推出办公助手KroWork,支持口令生成本地化工具

     

17. Google DeepMind 启动 AI co-clinician 研究计划

     

18. 华为与中科大联合发布智能科研云平台“灵境造物”

     

19. DeepSeek发布多模态技术报告,详解视觉原语与定位技术

     

20. 智谱AI修复GLM-5推理竞态Bug,并提交代码至SGLang

   

   

     

产品与功能更新

     

       

1 Gemini CLI更新至v0.40.0,支持本地模型与分层记忆

       

工具 / 效率Gemini CLIGemma分层记忆智能路由Auto Memory

       

Google Gemini CLI发布了v0.40.0版本,包含超过150项改进。新版本加入了对本地Gemma模型的实验性支持,并引入了全新的分层记忆系统,可在项目、子目录、私有和全局四个层级持久化上下文。此外,还新增了基于历史会话自动提取技能的Auto Memory功能(实验性),以及用于任务跟踪的Task Tracker(实验性)。其他更新包括MCP资源支持最终化、壳命令验证、核心工具白名单、桌面通知、新的/memory inbox和/new命令,以及多项性能优化。

       

       

         

📌 解读

         

Google正通过Gemini CLI构建一个以开发者为中心的、开放且安全的本地AI开发生态。支持本地Gemma模型和分层记忆系统,战略意图是降低对云端API的依赖,保护隐私和数据主权,同时通过智能路由优化成本与性能。一个重要的细节是新增了“壳命令验证和核心工具白名单”,这直接回应了AI Agent执行外部命令时的核心安全风险,表明Google在推动Agent自动化的同时,将安全性置于基础设施层面进行设计。

       

       

         

💡 启示

         

谁应该关注:技术部门、研发部门,本地化、高安全要求的AI Agent开发与部署
格局变化:AI开发工具链竞争焦点转向本地化、安全与上下文管理能力。
机会窗口:利用分层记忆和本地模型,开发数据敏感场景下的私有化Agent。
行动建议:试用v0.40.0,测试其本地模型路由与记忆系统在具体项目中的效果。

       

       
     

     

       

2 xAI 推出 Grok 4.3 Beta 模型,降价六成并支持访问计算机

       

大模型xAIGrok 4.3模型降价计算机访问API开放

       

xAI 宣布推出 Grok 4.3 Beta 模型,这是一款新的预训练模型。官方称其在规模上与 Grok 4.20 相当,但架构有所改进,知识截止日期为2025年12月。该模型首次支持访问计算机环境,目前已面向 SuperGrok 和 Premium+ 订阅用户开放,API 也已上线。据 Artificial Analysis 测评,Grok 4.3 在 Artificial Analysis Intelligence Index 上得分为53,表现略优于 Muse Spark 和 Claude Sonnet 4.6。

       

       

         

📌 解读

         

xAI采取激进的‘性能相当、大幅降价并开放环境访问’策略,旨在以价格和功能差异化快速抢占市场,特别是开发者与预算敏感的企业用户。首次支持访问计算机环境是重大突破,使Grok能执行代码、操作软件,向‘AI智能体’迈出关键一步。容易被忽略的是其知识截止日期(2025年12月),这大幅领先多数竞品,在时效性上建立了短期优势。

       

       

         

💡 启示

         

谁应该关注:技术、采购、战略,需要高性价比且具备最新知识的AI API服务
格局变化:大模型市场进入价格战与功能战并行的白热化阶段
机会窗口:以更低成本获得接近顶尖水平的模型能力
行动建议:将Grok 4.3纳入API选型测试,评估其性价比

       

       
     

     

       

3 Stripe在Sessions 2026大会发布288项金融基建功能升级

       

技术Stripe金融基建实时结算支付安全智能体商务

       

在Stripe Sessions 2026大会上,Stripe发布了针对金融基础设施的288项功能升级。本次更新包括智能体商务套件新增双向支付支持、实时结算系统以加速资金流转,以及新的拦截系统以防范盗刷行为。

       

         

📌 解读

         

Stripe此举旨在将自身从支付网关升级为全栈金融基础设施平台,通过提供大量模块化功能,降低企业构建复杂金融服务的门槛。这不仅会加剧与Adyen、Square等支付巨头的竞争,更可能侵蚀传统银行和金融科技公司的核心业务。一个关键细节是‘智能体商务套件支持双向支付’,这直接服务于AI智能体经济,为自动化商业交易铺平了道路。

       

       

         

💡 启示

         

谁应该关注:产品、战略、技术,构建或集成支付与金融服务的业务
格局变化:金融基建服务走向高度模块化、API化与智能化
机会窗口:利用现成高级金融API快速构建创新产品
行动建议:评估将Stripe新功能集成到自身产品路线图的可行性

       

       
     

     

       

4 阿里Qoder推出远程控制功能及数字员工QoderWake

       

应用Qoder数字员工远程控制阿里QoderWake

       

阿里旗下Qoder近日推出远程控制功能及移动端应用,并发布了数字员工产品QoderWake。移动端支持用户通过手机远程控制桌面端Qoder完成任务,首发接入了Qoder CLI全部能力。QoderWake被官方称为业界首个安全可控、持续进化的生产级数字员工产品,采用Harness-First架构,能将执行经验沉淀到记忆、技能等五个维度。该产品已开启邀测,用户可申请雇佣或定制专属数字员工。

       

       

         

📌 解读

         

阿里正从单点AI编码工具向“数字员工”平台演进。QoderWake的发布,核心商业逻辑是将AI Agent产品化、角色化、服务化,直接售卖生产力而非工具。其“Harness-First”架构和五维经验沉淀机制,旨在解决Agent的持续学习与可控性难题,这是实现“生产级”应用的关键。容易被忽略的细节是“移动端远程控制”,这并非简单功能延伸,而是将AI Agent从固定工作场景解放为随时可调度的“员工”,极大扩展了应用场景和用户粘性。

       

       

         

💡 启示

         

谁应该关注:战略部门、业务部门,企业业务流程自动化与数字化劳动力引入
格局变化:AI竞争进入“数字员工”产品化阶段,平台化生态初现。
机会窗口:探索雇佣或定制专属数字员工,以替代或增强特定业务岗位。
行动建议:关注邀测进展,评估数字程序员在内部开发流程中的潜在ROI。

       

       
     

     

       

5 快手上线桌面 AI 智能体 KroWork,支持固化工作流

       

应用快手KroWorkAI智能体桌面应用工作流自动化

       

快手近日正式上线了桌面端通用 AI 智能体 KroWork,该产品定位为非程序员的知识工作者。用户可通过自然语言指令让 AI 自主规划并执行任务,并能将重复性工作流固化为本地桌面应用,实现一键运行且无需额外消耗 Token 或积分。KroWork 以安全沙箱机制执行操作,触碰外部内容前需用户授权。其国内版集成了 Qwen、Kimi、Deepseek 等主流模型,国际版则支持 OpenAI 和 Anthropic 的最新旗舰模型。该产品即日起开放注册,首次注册赠送免费积分。

       

       

         

📌 解读

         

快手的KroWork将AI智能体定位为‘非程序员的知识工作者桌面助手’,其核心战略是降低AI使用门槛,实现任务自动化的平民化。商业逻辑在于通过‘工作流固化成本地应用且免Token消耗’的模式,解决用户对使用成本和数据安全的担忧,从而快速获取大量非技术用户。一个重要细节是其‘安全沙箱机制和分步授权’,这在赋予AI自主性的同时严格把控风险,是赢得用户信任的关键设计。

       

       

         

💡 启示

         

谁应该关注:生产力工具与市场部门,为知识工作者设计和推广低代码/无代码AI自动化工具
格局变化:AI智能体竞争从云端和开发者,向本地化、大众化桌面应用延伸。
机会窗口:开发针对特定办公场景(如数据分析、报告生成)的预制AI工作流或模板。
行动建议:调研将复杂AI能力封装为简单、安全、一次配置多次使用的本地化工具的可能性。

       

       
     

     

       

6 OpenRouter上线Owl Alpha模型,支持百万级上下文

       

大模型Owl AlphaOpenRouter长上下文Agent代码生成

       

OpenRouter平台上线了一款名为Owl Alpha的stealth模型。该模型专为Agent工作负载设计,原生支持工具使用和长上下文任务,在代码生成、自动化工作流和复杂指令执行方面表现突出。它兼容Claude Code、OpenClaw等主流生产力工具,并在Kilo等平台提供限时免费使用。

       

       

         

📌 解读

         

此举旨在抢占AI Agent基础设施的制高点。OpenRouter通过引入专为Agent优化的长上下文模型,直接切入当前AI应用最核心的工程化痛点,试图成为下一代AI应用(尤其是自动化工作流)的底层模型平台。一个关键细节是,该模型在Kilo等平台提供“免费使用”,这暗示了其战略重点并非直接模型收费,而是通过吸引开发者生态和抢占入口来建立护城河,可能对现有通用模型API服务商构成侧面竞争。

       

       

         

💡 启示

         

谁应该关注:AI部门、产品部门,开发基于长上下文的AI Agent应用
格局变化:Agent专用模型成为新赛道,挑战通用大模型的主导地位。
机会窗口:利用低成本或免费的百万上下文能力,快速构建复杂自动化产品。
行动建议:评估Owl Alpha在复杂工作流任务中的性能与成本效益。

       

       
     

     

       

7 谷歌相册将推出 AI 数字衣橱功能,夏季上线安卓端

       

应用谷歌相册数字衣橱AI图像识别虚拟试衣安卓

       

Google Photos 计划在今年夏季推出一项由 AI 驱动的新功能,可自动识别并整理用户照片库中的衣物,生成专属数字衣橱。用户可依据类别筛选、自由组合搭配、保存为不同场合的灵感板,并借助 Try it on 功能虚拟预览整体效果。该功能将率先面向 Android 用户推送,随后登陆 iOS 平台。

       

       

         

📌 解读

         

谷歌相册推出AI数字衣橱,是将生成式AI从内容创作(如图像生成)转向对现有个人数据的深度理解与重组,开辟了‘AI+生活服务’的新场景。其商业逻辑是通过提升相册产品的实用性和粘性,巩固其在个人云存储市场的地位,并可能为未来的电商导流或个性化广告铺垫。容易被忽略的是其‘灵感板’功能,这超越了简单整理,向生活方式规划和社交分享延伸,想象空间更大。

       

       

         

💡 启示

         

谁应该关注:消费产品与AI应用部门,开发面向消费者的AI增强型生活服务应用
格局变化:AI应用正从通用工具向垂直、个性化的生活场景深度渗透。
机会窗口:在时尚、家居、购物等领域开发基于视觉识别的AI搭配与推荐功能。
行动建议:探索如何利用AI对用户现有非结构化数据(如图片)进行增值服务创新。

       

       
     

     

       

8 Anthropic推出Claude Security测试版,基于Opus 4.7扫描漏洞

       

应用Claude SecurityAnthropic代码安全漏洞扫描Claude Opus

       

Anthropic面向Claude Enterprise客户推出了Claude Security公开测试版。该工具基于Claude Opus 4.7,能够扫描代码库以发现漏洞、进行对抗性验证,并生成可供人工审阅的修补建议。用户可通过Claude.ai侧边栏、专用页面或Claude Code on the Web使用,支持按仓库、目录或分支设定扫描范围及定时扫描。扫描结果可导出为CSV或Markdown格式,或通过webhook推送至Slack、Jira等工具。Claude Team和Max用户的访问权限即将开放。

       

         

📌 解读

         

Anthropic正将大模型能力深度垂直化,从通用助手转向高价值的专业工具。Claude Security的推出,标志着AI正从“代码生成”向“代码安全治理”这一更专业、付费意愿更强的企业市场渗透。其商业逻辑是提升Claude Enterprise套件的粘性与客单价。容易被忽略的细节是“补丁需人工审批后应用”,这体现了Anthropic在追求自动化的同时,对安全性与责任边界的谨慎态度,这也是其切入企业级市场的关键信任基石。

       

       

         

💡 启示

         

谁应该关注:安全部门、研发部门,企业代码安全审计与漏洞管理
格局变化:大模型厂商开始提供垂直领域的深度解决方案,竞争加剧。
机会窗口:将AI安全扫描整合进DevSecOps流程,提升代码质量与安全基线。
行动建议:申请测试权限,评估其对现有代码库的漏洞发现能力与误报率。

       

       
     

     

       

9 快手推出办公助手KroWork,支持口令生成本地化工具

       

应用快手KroWork办公自动化本地处理隐私安全

       

快手发布了一款面向普通用户的办公助手KroWork。用户可通过简单口令生成专属工具,在本地自动运行各类繁琐流程。该产品采用安全沙箱机制保护用户隐私,并旨在提升如报销等日常办公事务的处理效率。

     

     

       

10 ChatGPT图像生成2.0版本提升复杂图表绘制能力

       

大模型ChatGPT图像生成架构图多模态AIOpenAI

       

ChatGPT的图像生成能力迎来升级,新版本能够精准生成复杂的架构图、流程图和时序图等逻辑图表。此次进化旨在解决研发人员在绘图方面的痛点,提升了模型在逻辑表达与可视化方面的实用性。

       

       

         

📌 解读

         

OpenAI此举意在将ChatGPT从通用文本/图像生成工具,深化为专业生产力工具,直接切入企业级图表绘制市场(如Miro、Lucidchart)。这通过解决‘逻辑绘图’这一细分痛点,提升了AI在知识工作流中的不可替代性。容易被忽略的是,精准架构图生成依赖于强大的空间与逻辑关系理解,这标志着其多模态能力已从‘感知’迈向‘结构化创造’。

       

       

         

💡 启示

         

谁应该关注:研发、产品设计、运营,需要快速生成技术文档、系统架构图的团队
格局变化:AI开始替代专业工具的部分核心功能,门槛降低
机会窗口:将AI绘图能力嵌入内部工作流以提升效率
行动建议:组织测试,将ChatGPT图像2.0用于实际技术绘图任务

       

       
     

     

       

11 GPT 5.5 Pro模型新增思考模式切换功能

       

大模型GPT-5.5 Pro思维模式逻辑推理模型发布

       

GPT 5.5 Pro模型引入了两种可切换的思维模式,允许用户在常规推理与扩展逻辑之间自由选择。这一升级显著增强了模型的深度推理能力,标志着其在逻辑处理与复杂问题分析方面取得了重要进展。

       

         

📌 解读

         

OpenAI通过引入可切换的‘思考模式’,实质上是将模型的推理过程参数化和显性化,允许用户在速度与深度之间进行权衡。这既是对用户对模型‘黑箱’抱怨的回应,也是一种商业化策略,将深度推理能力包装为高阶功能。重要细节是‘扩展逻辑’模式,这可能意味着模型被引导进行更长的思维链推理,为复杂问题解决提供了新范式。

       

       

         

💡 启示

         

谁应该关注:AI研究、产品、战略,需要AI进行复杂分析、规划与决策支持的场景
格局变化:AI模型从单一输出走向可配置、过程可控的协作
机会窗口:开发基于深度推理模式的专业分析与顾问应用
行动建议:研究不同思维模式在自身业务问题上的效果差异

       

       
     

     

       

12 Google DeepMind 启动 AI co-clinician 研究计划

       

应用Google DeepMindAI co-clinician医疗AI多模态Agent哈佛医学院

       

Google DeepMind 近日宣布了一项名为 AI co-clinician 的新研究计划,旨在探索多模态 Agent 如何作为临床团队中的协作成员,在专家监督下辅助医疗工作。该计划基于 Gemini 与 Project Astra 的实时音视频能力。在与哈佛医学院和斯坦福医学院合作的模拟研究中,AI co-clinician 在140项咨询技能评估中有68项达到或超过了初级保健医生的水平。系统采用双 Agent 架构以维持安全边界,并已在药物知识开放式问答中超越其他前沿模型。目前该研究正与多国学术机构合作分阶段推进。

       

     

     

       

13 OpenAI 为 ChatGPT 账户推出高级安全设置

       

网安 / 安全OpenAIChatGPT账户安全通行密钥防钓鱼

       

OpenAI 正式为 ChatGPT 账户推出了一项名为 Advanced Account Security 的可选安全设置。该功能旨在为面临较高数字攻击风险或追求最高级别账户保护的用户提供更强的安全保障,集成了防钓鱼登录、更安全的账户恢复、缩短登录会话时长、自动排除训练数据等多项措施。用户现可在 Web 端的安全设置中自行开启,该保护也适用于 Codex 账户。OpenAI 还宣布,自2026年6月1日起,其 Trusted Access for Cyber 项目的个人成员必须启用此功能。

       

       

         

📌 解读

         

OpenAI推出高级账户安全功能,战略意图是巩固其作为AI基础设施提供商的信任基石,尤其针对企业和高风险用户。强制其网络安全项目成员启用,是将安全从可选功能提升为合规与合作伙伴标准,这能构筑强大的竞争护城河。一个关键细节是‘自动排除训练数据’,这直接回应了数据隐私的核心关切,旨在打消企业用户的最大顾虑。

       

       

         

💡 启示

         

谁应该关注:安全合规与产品部门,企业采购或员工使用生成式AI服务的风险管理
格局变化:主流AI服务商将企业级安全功能设为标配和准入门槛。
机会窗口:开发面向企业的AI使用安全审计、监控或身份验证解决方案。
行动建议:立即评估并跟进主流AI服务的安全标准,更新内部使用政策。

       

       
     

     

       

14 OpenAI引入WebSocket协议,接口响应速度提升40%

       

技术OpenAIAPI优化WebSocket延迟降低性能提升

       

OpenAI通过官方博客宣布,通过引入WebSocket传输协议及优化缓存机制,成功解决了智能体交互的瓶颈问题,使API接口响应速度提升了40%。此项优化也显著降低了开发者常用编辑器集成后的延迟。

       

       

         

📌 解读

         

OpenAI此举直指AI应用落地的核心瓶颈——交互延迟,通过底层协议(WebSocket)和缓存优化,显著提升用户体验和系统吞吐量。这不仅是技术升级,更是巩固其开发者生态和平台粘性的战略举措。关键细节是‘编辑器集成后延迟骤降’,表明优化特别针对高频、交互式的开发场景,旨在牢牢抓住核心开发者群体,构建竞争护城河。

       

       

         

💡 启示

         

谁应该关注:技术、产品、开发者关系,开发基于AI API的实时交互应用或智能体
格局变化:AI服务的性能与实时性成为关键竞争维度
机会窗口:开发此前因延迟过高而不可行的实时AI应用
行动建议:基于新接口性能,重新评估和设计产品的交互流程

       

       
     

     

       

15 Hermes Agent 发布 v0.12.0,新增技能自动清理功能

       

工具 / 效率Hermes AgentNous Research技能管理自我改进ComfyUI

       

Nous Research 发布了 Hermes Agent v0.12.0 版本。本次更新的核心是引入了 Hermes Curator 系统,该后台 Agent 能以7天为周期自动评估和清理技能库中的冗余技能。自我改进循环升级为基于评分模式,并默认内置了 ComfyUI v5 与 TouchDesigner-MCP。在推理提供商方面,LM Studio 升级为一级提供商,并新增了四个云服务商。消息平台新增了对 Microsoft Teams 插件及腾讯元宝的原生支持,集成了 Spotify 与 Google Meet。此外,TUI 冷启动性能提升了约57%。此次更新已在 GitHub 开放下载,包含了来自213位贡献者的360多个修复 PR。

       

       

         

📌 解读

         

Hermes Agent的更新核心在于通过‘自我改进循环’和自动化技能管理(Curator)实现系统的自我优化与精简,这标志着AI智能体正从静态工具向动态、自进化的系统演进。集成更多云服务商和消息平台旨在扩大生态和适用性。容易被忽略的是其TUI(终端用户界面)性能大幅提升57%,这显示了对开发者体验和效率的重视,是吸引开发者的关键。

       

       

         

💡 启示

         

谁应该关注:AI研发与生态部门,构建或集成复杂、可扩展的AI智能体系统
格局变化:AI Agent平台竞争进入生态整合与自动化运维阶段。
机会窗口:为多智能体系统提供技能评估、优化工具或垂直领域技能包。
行动建议:研究自动化技能管理与评估机制,应用于自身AI产品的生命周期管理。

       

       
     

     

       

16 OpenClaw发布安全复盘及版本更新,集成DeepInfra与NVIDIA

       

网安 / 安全OpenClaw安全复盘版本更新DeepInfraNVIDIA

       

OpenClaw近日通过官方博客回顾了项目在安全方面的挑战与改进,并同时发布了两个版本更新。在安全方面,项目通过定义信任模型、将功能推给插件、强化发布流程等方式进行了修复。版本方面,OpenClaw 2026.4.29改进了群聊体验、支持后续承诺、增强了执行安全与控制,并集成了NVIDIA provider及模型目录。此前发布的2026.4.27版本则将DeepInfra作为内置provider,并改进了文件附件处理、代理路由等功能,提升了系统可靠性。

       

       

       

         

📌 解读

         

OpenClaw的更新体现了AI Agent平台从功能扩张向安全与可靠性深度构建的战略转型。通过将核心功能插件化并引入NVIDIA等巨头的工程支持,意在建立企业级信任,这将对标同类开源项目形成差异化壁垒。一个关键细节是它通过‘可观测性’增强来应对安全挑战,这反映了AI系统从黑箱走向透明和可控的行业深层需求。

       

       

         

💡 启示

         

谁应该关注:安全与架构部门,企业级AI Agent的部署与运维
格局变化:开源AI Agent竞争焦点从能力转向安全与可靠性,门槛提高。
机会窗口:为企业提供AI系统安全审计、可观测性工具或插件开发服务。
行动建议:评估自身AI产品在安全模型和发布流程上是否需引入类似最佳实践。

       

       
     

     

       

17 Cloudflare与Stripe合作,支持AI Agent自动完成部署

       

应用CloudflareStripeAI Agent自动化部署Stripe Projects

       

Cloudflare宣布与Stripe合作推出了一项新协议。现在,AI Agent在获得用户授权后,能够自动完成创建Cloudflare账户、开通付费订阅、注册域名并获取API token等全套上线操作,全程无需用户手动登录或输入支付信息。该功能作为Stripe Projects(公开测试阶段)的一部分推出。

       

       

         

📌 解读

         

Cloudflare与Stripe的合作,本质是打通了AI Agent从“想”到“做”的最后一公里——支付与资源开通。其战略意图是成为AI驱动的自动部署和运维的基础设施层,降低AI应用落地的操作门槛。商业逻辑在于,通过简化流程吸引更多AI应用在其平台上生成和消耗云资源。一个关键但易被忽略的细节是“通过与Stripe共同设计的新协议实现”,这并非简单的API对接,而是为AI Agent作为新型“用户”或“执行者”创建了全新的信任与授权范式,可能重塑云服务的人机交互流程。

       

       

         

💡 启示

         

谁应该关注:运维部门、产品部门,AI应用的一键自动化部署与运维
格局变化:云服务与支付基础设施开始原生适配AI Agent作为新型主体。
机会窗口:构建能够自主完成从开发到上线全流程的端到端AI应用。
行动建议:研究Stripe Projects协议,规划AI Agent自动化部署自身或客户应用的流程。

       

       
     

     

       

18 华为与中科大联合发布智能科研云平台“灵境造物”

       

工具 / 效率华为中科大灵境造物智能科研云开源九问社区

       

华为与中国科学技术大学联合发布了名为“灵境造物”的智能科研云平台。该平台依托协同工程实现多智能体体系协作,并借助开源九问社区促进科研经验复用,旨在显著缩短科研周期,助力国产软硬件生态建设。

       

     

   

   

     

前沿研究

     

       

1 格拉斯哥大学发布DIGER推荐架构,实现语义ID可微分联合优化

       

技术DIGER生成式推荐语义ID格拉斯哥大学开源

       

格拉斯哥大学研究团队发布了一种名为DIGER的全新推荐系统架构。该技术首次实现了语义ID的可微分联合优化,并通过创新的噪声处理机制提升了模型训练的稳定性。在亚马逊数据集上的测试表明,该模型性能获得显著提升。目前,该项目的配套源代码已同步开源。

       

     

     

       

2 熵质心算法利用内部奖励优化模型推理侧扩展

       

技术熵质心算法推理侧扩展Scaling Law开源项目

       

研究团队提出熵质心算法,旨在提升模型推理能力。该方案利用模型内部的奖励信号实现生成内容的自主筛选,其高熵相位能有效捕捉生成过程中的波动。团队已开源配套项目代码,该研究为推理侧的Scaling Law优化提供了新思路。

     

     

       

3 DSIPA框架通过情感分布分析精准检测AI生成文本

       

网安 / 安全AI检测DSIPA虚假信息治理

       

科学家发布了一种新的AI生成文本检测工具DSIPA。该算法通过分析文本中情感分布的差异来识别机器生成内容,其检测准确率较旧方案提升了50%。在针对GPT-5.2等先进模型的测试中表现优异,有望成为治理虚假信息的有效工具。

     

     

       

4 智谱AI修复GLM-5推理竞态Bug,并提交代码至SGLang

       

技术智谱AIGLM-5KV CacheSGLangCoding Agent

       

智谱AI发表技术博客,分享了其在超大规模Coding Agent推理实践中解决的系统级问题。GLM-5系列模型在高并发、长上下文场景下出现乱码、复读等异常,经排查定位为两个底层竞态Bug所致:一是PD分离架构下KV Cache复用竞态;二是HiCache多级KV Cache流水线中的read-before-ready访问。团队通过引入跨节点同步机制和显式同步约束修复了问题,使异常发生率由约万分之十几降至万分之三以下。此外,团队设计了KV Cache分层存储方案LayerSplit,在Cache命中率达90%的条件下,系统吞吐量提升10%至132%。相关修复已通过Pull Request #22811提交至SGLang社区。

       

     

     

       

5 Qwen团队发布可解释性工具集Qwen-Scope,开源14组SAE权重

       

技术Qwen-Scope稀疏自编码器模型可解释性开源HuggingFace

       

Qwen团队发布了Qwen-Scope,这是一套基于Qwen3与Qwen3.5系列模型的稀疏自编码器(SAE)集合。该工具通过稀疏性约束提取高度可解释的内部特征,支持推理控制与数据合成。官方开源了14组SAE权重,覆盖7个大模型。据官方称,其数据合成能效比提升至约15倍。相关资源已上线HuggingFace和ModelScope,技术报告同步公开。

       
     

     

       

6 AISI评估称GPT-5.5网络攻击模拟能力比肩Claude Mythos

       

网安 / 安全AISIClaude Mythos网络安全评估网络攻击模拟

       

英国AI安全研究所(AISI)公布了对OpenAI GPT-5.5早期检查点的网络安全评估结果。评估显示,该模型在多步网络攻击模拟任务上的表现与Anthropic的Claude Mythos Preview相当,成为继后者之后第二个完成AISI端到端攻击模拟的模型。与此同时,OpenAI CEO Sam Altman宣布将在未来几天向关键网络安全防御者推送专门为网络安全打造的GPT-5.5-Cyber模型。他表示将与整个生态系统和政府合作建立可信访问机制,以加快保护企业和基础设施。

       

       

     

     

       

7 ACL 2026收录可解释性论文,大模型架构设计提升透明度

       

大模型可解释性ACL 2026玻璃箱模式开源研究

       

ACL 2026收录了一项关于提升大模型可解释性的研究。学者提出通过架构设计增强模型透明度的“玻璃箱”模式,使内部逻辑更易于拆解与分析。该研究配合开源项目集锦,有望推动相关工作的复现,或标志着黑盒模型时代面临变革。

       

     

     

       

8 全球首个医疗思维链数据集CheXthought发布,含十万条临床推理标注

       

大模型CheXthought医疗数据集思维链临床推理可解释性

       

研究人员发布了全球首个专注于医疗领域的思维链数据集CheXthought,其中包含十万条临床推理标注。该数据集旨在提升医学AI模型的逻辑推理精度,并通过千万级的视觉注意指标帮助抑制模型幻觉。此举使AI的诊断过程对医生而言更具可解释性,这种透明度对临床实践至关重要。

     

     

       

9 DeepSeek发布多模态技术报告,详解视觉原语与定位技术

       

多模态DeepSeek视觉原语技术报告开源DeepSeek-V4-Flash

       

DeepSeek发布了多模态技术报告《Thinking with Visual Primitives》并开源相关代码,详细解析了其识图模式的技术细节。该模式基于DeepSeek-V4-Flash,核心创新在于将语言思维链升级为“语言逻辑+空间坐标”双轨思维,使模型能直接在图像上输出点或框进行精准视觉定位。通过多级视觉压缩架构,高分辨率图像的KV缓存仅保留约90个视觉条目,压缩比超7000倍。报告显示,该模型在一系列高难度视觉QA任务中表现超过GPT-5.4等模型。训练流程涵盖预训练、冷启动与强化学习,并从超4000万个高质量样本中筛选数据。模型权重计划在未来整合进DeepSeek基础模型发布。

       

     

     

       

10 Random Cloud提出无需训练的极简神经网络架构搜索法

       

技术架构搜索神经网络Random Cloud网络拓扑

       

研究人员提出了一种名为Random Cloud的极简神经网络架构搜索方法。该方法通过随机探索锁定网络拓扑,完全避免了昂贵的反向传播训练过程。实验表明,新方案在搜索效率上优于传统剪枝方法,搜索速度提升了数倍。

     

     

       

11 Cursor发文详解其Agent框架的优化方法与评估体系

       

编程CursorAgent框架A/B测试AI编程CursorBench

       

Cursor在官方博客发文,详细分享了其持续优化Agent框架的具体做法。为了量化改进效果,团队建立了包含公开基准CursorBench和在线A/B测试的多层衡量体系,大幅降低了意外工具调用错误。同时,Cursor为不同的大模型进行了深度定制,配置专属的工具格式与提示,成功解决了用户在对话中途切换模型时带来的缓存失效等技术难题。他们还指出,未来的AI辅助编程将逐渐走向多Agent协同委派与编排的工作模式。

       

     

     

       

12 跨架构蒸馏框架TIDE发布,助力小模型继承扩散模型能力

       

技术模型蒸馏TIDE扩散模型端侧AI

       

研究人员开发出名为TIDE的跨架构蒸馏框架,旨在突破模型架构差异的限制。该框架使小模型能够有效继承扩散模型的能力,成功解决了异构分词器间的知识传递难题。在代码生成等任务上,TIDE相比基准模型取得了显著提升,为模型端侧部署提供了更多可能。

     

     

       

13 OpenAI披露GPT模型异常使用哥布林等词汇,源于性格奖励偏差

       

大模型OpenAI强化学习模型对齐技术博客

       

OpenAI发布技术博客,披露了其模型从GPT-5.1开始频繁提及“哥布林”和“小精灵”等奇幻词汇的调查结果。数据显示,GPT-5.1上线后“goblin”出现次数暴涨175%,“gremlin”上涨52%,到GPT-5.4时问题加剧。根因锁定在ChatGPT的“Nerdy”性格定制功能上,该性格仅占所有回复的2.5%,却贡献了66.7%的goblin提及。训练该性格时的奖励模型无意中给包含生物比喻的回复更高分数,导致模型在强化学习中学会并泛化了这一表达习惯。OpenAI已于2026年3月下架Nerdy性格,并移除相关奖励信号。但GPT-5.5的训练在找到根因前已开始,故仍带有此倾向,目前OpenAI在编程工具Codex中通过系统提示词进行压制。

       

     

   

   

     

行业展望与社会影响

     

       

1 OpenAI 提前超额完成 Stargate 项目 10GW 基建目标

       

产业 / 商业化OpenAIStargateAI基础设施算力

       

OpenAI 宣布,其旨在为通用人工智能提供算力基础的 Stargate 项目已提前超额完成原定于2029年在美国建成10GW人工智能基础设施的目标。过去90天内,该项目新增了超过3GW的容量。其位于德克萨斯州阿比林的旗舰站点运行于 Oracle Cloud Infrastructure 之上,并搭载 NVIDIA GB200 系统。官方表示,最新模型 GPT‑5.5 便是在该站点完成训练的。

       

     

     

       

2 AI医疗新技术助力不育男性,可定位极微量精子

       

应用AI医疗辅助生殖精准医疗精子检测生育技术

       

科学家开发出一项利用人工智能算法的精准医疗技术,该技术能够定位样本中极微小的、有活力的精子,为男性不育治疗提供了新的辅助手段。这项突破使许多家庭重新获得了生育希望,展现了AI技术在医疗健康领域的应用潜力与人文关怀。

     

     

       

3 小红书组织升级,成立 AI 部门 Dots 与海外部门 Rednote

       

产业 / 商业化小红书组织架构AI部门国际化Dots

       

小红书近日发布内部信宣布组织升级,全面整合社区、电商和商业化三大核心业务及公司技术体系。同时,公司新成立了 AI 一级部门 Dots 和企业智能部,以加大对 AI 的投入。此外,还组建了海外业务部门 Rednote,并设立 Lab 1327 探索新产品孵化机制。内部信透露,小红书 App 月活用户已超过 4 亿。

     

     

       

4 Spotify推出“绿色勋章”标记真人创作,治理AI生成内容

       

应用Spotify内容治理AI生成检测音乐流媒体原创认证

       

流媒体平台Spotify为治理AI生成的垃圾内容,正式上线了“绿色验证徽章”功能,用以标记经确认的真人创作作品。该平台通过动态监测机制来确保作品的纯人工属性,旨在保护音乐人的原创地位,并提升听众的艺术体验。

     

     

       

5 科技巨头AI基础设施支出预计达六千亿美元,Meta与谷歌竞速建设

       

产业 / 商业化AI基础设施数据中心资本支出Meta谷歌

       

全球科技公司正大幅增加人工智能基础设施投资,预计总支出将达六千亿美元,刷新纪录。Meta与谷歌等巨头正在竞相兴建数据中心,以支撑其AI雄心。这一高额预算正驱动着一场算力基建革命,同时也引发了投资者关于投入可持续性的讨论。

     

     

       

6 陶哲轩警示AI导致数学进入“证明过剩”时代

       

大模型数学证明陶哲轩AI生成验证学术伦理

       

著名数学家陶哲轩对当前趋势发出警示,指出人工智能(AI)工具正在网络上生成大量未经消化的“生肉”证明,其速度已远超人类的验证能力。他认为,这标志着数学进入了“证明过剩”时代,未来数学家的工作重点将从解题更多地转向对海量证明的筛选与验证。

       

     

     

       

7 Genspark 与微软达成合作,AI Agent 原生集成 Microsoft 365

       

应用GensparkMicrosoft 365AI Agent战略合作Azure

       

Genspark 宣布与 Microsoft 建立全球战略合作伙伴关系,将其 AI Agent 作为原生插件直接嵌入 Microsoft 365 及 Microsoft Agent 365 生态。该合作使得 AI Slides、Sheets、Docs Agents 等功能可在 PowerPoint、Excel、Word 等日常办公应用中原生集成智能工作流。相关服务基于 Azure 基础设施构建。

     

     

       

8 Zig语言项目宣布全面禁止AI生成代码贡献

       

编程Zig语言开源政策代码贡献开发者AI禁令

       

知名编程语言Zig项目宣布了一项反潮流政策,全面禁止使用AI工具生成的代码提交。项目维护者认为,此举旨在保障开发者的技能成长比单纯追求产出量更为重要,并希望避免因依赖AI导致开发者水平(QAQ)下滑。这一押注于“人”而非工具的做法在社区内引发了广泛热议。

     

   

   

     

开源TOP项目

     

       

1 AI 驱动游戏演示《Open Design》获关注,展现电影级视觉表现

       

应用AI游戏Open Design游戏演示CG制作

       

一段由 AI 技术驱动的游戏实机演示近期引发关注,其画面展现了电影级的视觉张力。该演示来自 GitHub 上星标数达 5200 的 Open Design 项目。在多模态 AI 技术的加持下,场景质感表现突出,被认为有望显著降低传统 CG 制作的高门槛。

       

     

     

       

2 开源智能代理框架 Craft-Agents 在 GitHub 获超 5500 星标

       

工具 / 效率Craft-Agents智能代理开源项目GitHub自动化

       

GitHub 热门开源项目 Craft-Agents 近期增长迅速,星标数已突破 5500。该项目是一个模块化的 AI 代理构建工具,旨在简化自动化应用的开发流程。今日有数百名开发者加入贡献,其设计使得流程搭建更为便捷,推动了自动化应用的进一步普及。

     

     

       

3 DeepSeek 协议中转工具 ds2api 开源,支持 Docker 一键部署

       

工具 / 效率ds2apiDeepSeek协议中转开源工具Docker

       

开源社区出现一款名为 ds2api 的高性能协议转换工具,它通过多账号轮询机制有效降低 API 调用成本。该项目支持 Docker 镜像一键快速部署,目前已在 GitHub 上获得约 2700 个星标。其设计强调强大的兼容性与实用价值。

     

     

       

4 Browserbase 开源 Skills 框架,赋予 Claude 原生网页操作能力

       

工具 / 效率Skills框架ClaudeBrowserbase网页操作开源

       

Browserbase 团队近日开源了 Skills 框架,该框架能使 Claude 模型具备原生的网页浏览与操作能力。项目源码在 GitHub 发布后迅速获得超过 800 个星标。该技术旨在扩展 AI 智能体的交互边界,使其能够更自然、高效地完成网页任务。

       

     

   

   

     

社媒分享

     

       

1 Glean 发布专用检索模型 Waldo,优化搜索延迟与算力消耗

       

技术WaldoGlean检索模型自适应路由企业级应用

       

企业搜索平台 Glean 发布了其自研的专用检索模型 Waldo。该模型将信息检索与推理任务分离,并采用自适应路由技术。经优化后,系统延迟降低了一半,同时节省了大量计算资源,为企业级搜索应用提供了一个高效的参考模板。

       

       

     

     

       

2 OpenAI 升级 Codex,拓展为日常办公助手

       

应用OpenAICodex办公助手CLISlack

       

OpenAI 对 Codex 进行了重大升级,使其从开发者工具扩展为面向团队的个人工作助手,支持非编码的日常计算机操作。新版本引入了基于岗位角色的动态 UI,允许用户连接 Slack、Google Workspace、Microsoft 365 等应用,系统会据此推荐插件并动态调整界面。性能上,Computer Use 模式整体速度提升了约20%。Codex CLI 0.128.0 版本新增了跨轮次追踪任务的 /goal 命令,App 端则新增了 /side 侧边聊天命令。此外,新版本还优化了幻灯片和表格生成等功能。

       

       

       

     

     

       

3 业界探讨认知深度与AI边界,强调人类核心领悟不可外包

       

前瞻认知外包人机协作开发者社区AI边界核心价值

       

近期有观点深入探讨了认知外包的逻辑与局限,指出虽然部分思考过程可被工具替代,但理解的深度与核心领悟无法外包。这一见解揭示了人类在人工智能浪潮中的独特价值,强调应更关注深层次的理解而非简单逻辑套路。该讨论在开发者圈子中引发了关于人机协作模式的进一步思考。

     

     

       

4 Opus 4.7 被指具备强大文风分析能力,可识别匿名作者引争议

       

伦理 / 合规Opus 4.7文风分析去匿名化隐私安全本地模型

       

Opus 4.7 模型被曝光具备强大的文本风格分析能力,能够从文字中精准推断出作者的真实身份,即使用户开启无痕模式也难以规避。这一去匿名化技术引发了专家对其可能被滥用的担忧,部分用户已开始研究使用本地模型进行文风伪装以应对。

     

     

       

5 开发者Tw93发布AI-SEO实操指南,作品获主流大模型主动推荐

       

应用AI-SEOTw93内容分发搜索引擎优化AI资讯

       

开发者Tw93因其作品被主流大模型主动推荐,随即发布了一套AI搜索引擎优化深度实操指南。该指南的核心目标是帮助AI更好地理解产品与独特想法,其策略强调高质量内容输出,避免污染数据环境。这种新的优化方法有望重塑未来的内容分发格局。

       

     

     

       

6 Karpathy提出智能体工程新范式,旨在提升大模型编程与调试能力

       

前瞻智能体工程Karpathy大模型解释器无代码应用新范式

       

AI领域专家Karpathy近期重新定义了智能体工程,提出一种新的技术范式。该范式旨在通过智能体工程提升编程效率的上限,并展望了未来无代码应用及图像直接生成的可能性。同时,大模型解释器将有助于在复杂环境中进行调试,为开发者构建更强大的智能体系统提供了方向。

     

   

   

     

精选内容

     

       

1 蚂蚁百灵开源两款大模型 Ling-2.6-1T 与 Ling-2.6-flash文章

       

大模型蚂蚁百灵模型开源Ling-2.6万亿参数魔搭社区

       

蚂蚁百灵团队通过魔搭 ModelScope 社区开源了两款大模型。Ling-2.6-1T 是一款万亿参数的综合旗舰模型,采用 MLA 与 Linear Attention 混合架构,在 Artificial Analysis 等多项复杂任务基准上取得开源 SOTA 或第一梯队成绩。Ling-2.6-flash 则是一款总参104B的高效模型,在4卡 H20 上推理速度可达340 tokens/s,在 Agent 场景中表现突出。两款模型均围绕真实生产环境中的指令遵循、工具调用和成本效率进行了优化,分别面向复杂工作流和高频 Agent 调用场景。

       

     

     

       

2 DeepSeek 发布多模态新成果,引入视觉坐标提升推理能力文章

       

大模型DeepSeek多模态模型视觉定位V4-Flash引用差距

       

DeepSeek 联合北大、清华在五一节前发布了一项多模态研究成果。研究指出,当前多模态模型在复杂视觉任务上的瓶颈在于自然语言难以精确锚定视觉实体。其解决方案是在模型思维链中插入 bounding box 和 point 坐标 token,让模型在推理时能“指”出视觉位置。模型基于 V4-Flash 架构,通过极致 token 压缩大幅降低了视觉 KV cache 占用。训练采用了包括 GRPO 强化学习和 On-Policy Distillation 在内的五段式流水线。在11个基准测试中,该模型在迷宫导航和路径追踪(56.7 vs 46.5)等任务上表现领先。

       

     

   

   

     

访问链接

     

       

长按识别二维码可点击访问原文链接

       

也可点击底部“阅读原文”直接打开完整链接页

       

     

     

       

Gemini CLI更新至v0.40.0,支持本地模型与分层记忆

       

https://x.com/geminicli/status/2049875287924465715

     

     

       

Gemini CLI更新至v0.40.0,支持本地模型与分层记忆

       

https://x.com/googlegemma/status/2049926903830921448

     

     

       

xAI 推出 Grok 4.3 Beta 模型,降价六成并支持访问计算机

       

https://x.com/ArtificialAnlys/status/2049987001655714250

     

     

       

xAI 推出 Grok 4.3 Beta 模型,降价六成并支持访问计算机

       

https://grok.com/release-notes

     

     

       

Stripe在Sessions 2026大会发布288项金融基建功能升级

       

Stripe 发布 288 项新功能,构建 AI 时代的经济基础设施

     

     

       

阿里Qoder推出远程控制功能及数字员工QoderWake

       

https://mp.weixin.qq.com/s/eJZ5iWYw3TfSOLdeyVBfiw

     

     

       

阿里Qoder推出远程控制功能及数字员工QoderWake

       

https://mp.weixin.qq.com/s/YIzCnByYLsYuWDclLdYR8Q

     

     

       

快手上线桌面 AI 智能体 KroWork,支持固化工作流

       

https://mp.weixin.qq.com/s?__biz=Mzg4MDU4ODc1MA==&mid=2247484010&idx=1&sn=b1c642ac8e5dd9ce25f561b487371291&chksm=cef2bb9dde85543c868aafbff36a1e965204ec5c5168380938eaff7a577f29ececa7ea641d0#rd

     

     

       

OpenRouter上线Owl Alpha模型,支持百万级上下文

       

https://openrouter.ai/openrouter/owl-alpha

     

     

       

OpenRouter上线Owl Alpha模型,支持百万级上下文

       

https://x.com/kilocode/status/2049942867150541201

     

     

       

谷歌相册将推出 AI 数字衣橱功能,夏季上线安卓端

       

https://blog.google/products-and-platforms/products/photos/google-photos-wardrobe-feature/

     

     

       

Anthropic推出Claude Security测试版,基于Opus 4.7扫描漏洞

       

https://claude.com/blog/claude-security-public-beta

     

     

       

Anthropic推出Claude Security测试版,基于Opus 4.7扫描漏洞

       

https://claude.com/product/claude-security

     

     

       

快手推出办公助手KroWork,支持口令生成本地化工具

       

https://www.aibase.com/zh/news/27659

     

     

       

ChatGPT图像生成2.0版本提升复杂图表绘制能力

       

https://m.okjike.com/originalPosts/69f31618657481ea4e1f2186

     

     

       

GPT 5.5 Pro模型新增思考模式切换功能

       

https://x.com/EMostaque/status/2049810870193004851

     

     

       

Google DeepMind 启动 AI co-clinician 研究计划

       

https://deepmind.google/blog/ai-co-clinician/

     

     

       

Google DeepMind 启动 AI co-clinician 研究计划

       

https://x.com/GoogleDeepMind/status/2049867061279457761

     

     

       

OpenAI 为 ChatGPT 账户推出高级安全设置

       

https://openai.com/index/advanced-account-security/

     

     

       

OpenAI 为 ChatGPT 账户推出高级安全设置

       

https://x.com/OpenAI/status/2049902506881462613

     

     

       

OpenAI引入WebSocket协议,接口响应速度提升40%

       

https://openai.com/index/speeding-up-agentic-workflows-with-websockets/

     

     

       

Hermes Agent 发布 v0.12.0,新增技能自动清理功能

       

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.4.30

     

     

       

Hermes Agent 发布 v0.12.0,新增技能自动清理功能

       

https://hermes-agent.nousresearch.com/docs/user-guide/features/curator

     

     

       

OpenClaw发布安全复盘及版本更新,集成DeepInfra与NVIDIA

       

https://openclaw.ai/blog/openclaw-security-in-public/

     

     

       

OpenClaw发布安全复盘及版本更新,集成DeepInfra与NVIDIA

       

https://github.com/openclaw/openclaw/releases/tag/v2026.4.29

     

     

       

Cloudflare与Stripe合作,支持AI Agent自动完成部署

       

https://blog.cloudflare.com/agents-stripe-projects/

     

     

       

华为与中科大联合发布智能科研云平台“灵境造物”

       

https://github.com/openJiuwen-ai/jiuwenclaw

     

     

       

格拉斯哥大学发布DIGER推荐架构,实现语义ID可微分联合优化

       

https://arxiv.org/abs/2601.19711

     

     

       

格拉斯哥大学发布DIGER推荐架构,实现语义ID可微分联合优化

       

https://github.com/junchen-fu/DIGER

     

     

       

熵质心算法利用内部奖励优化模型推理侧扩展

       

https://arxiv.org/abs/2604.26173

     

     

       

熵质心算法利用内部奖励优化模型推理侧扩展

       

https://github.com/hkust-nlp/entropy-centroid

     

     

       

DSIPA框架通过情感分布分析精准检测AI生成文本

       

https://arxiv.org/abs/2604.26328

     

     

       

智谱AI修复GLM-5推理竞态Bug,并提交代码至SGLang

       

https://z.ai/blog/scaling-pain

     

     

       

Qwen团队发布可解释性工具集Qwen-Scope,开源14组SAE权重

       

https://qwenlm.github.io/zh/blog/qwen-scope/

     

     

       

Qwen团队发布可解释性工具集Qwen-Scope,开源14组SAE权重

       

https://huggingface.co/collections/Qwen/qwen-scope

     

     

       

Qwen团队发布可解释性工具集Qwen-Scope,开源14组SAE权重

       

https://huggingface.co/spaces/Qwen/Qwen-Scope

     

     

       

AISI评估称GPT-5.5网络攻击模拟能力比肩Claude Mythos

       

https://x.com/AISecurityInst/status/2049868227740565890

     

     

       

AISI评估称GPT-5.5网络攻击模拟能力比肩Claude Mythos

       

https://x.com/sama/status/2049712078836170843

     

     

       

ACL 2026收录可解释性论文,大模型架构设计提升透明度

       

https://arxiv.org/pdf/2604.16042

     

     

       

ACL 2026收录可解释性论文,大模型架构设计提升透明度

       

https://github.com/PKU-PILLAR-Group/Survey-Intrinsic-Interpretability-of-LLMs

     

     

       

全球首个医疗思维链数据集CheXthought发布,含十万条临床推理标注

       

https://arxiv.org/abs/2604.26288

     

     

       

DeepSeek发布多模态技术报告,详解视觉原语与定位技术

       

https://github.com/deepseek-ai/Thinking-with-Visual-Primitives

     

     

       

DeepSeek发布多模态技术报告,详解视觉原语与定位技术

       

https://x.com/PKUCXK/status/2049798862504944117

     

     

       

Random Cloud提出无需训练的极简神经网络架构搜索法

       

https://arxiv.org/abs/2604.26830

     

     

       

Cursor发文详解其Agent框架的优化方法与评估体系

       

https://cursor.com/blog/continually-improving-agent-harness

     

     

       

Cursor发文详解其Agent框架的优化方法与评估体系

       

https://x.com/cursor_ai/status/2049901436918436249

     

     

       

跨架构蒸馏框架TIDE发布,助力小模型继承扩散模型能力

       

https://arxiv.org/abs/2604.26951

     

     

       

OpenAI披露GPT模型异常使用哥布林等词汇,源于性格奖励偏差

       

https://openai.com/index/where-the-goblins-came-from/

     

     

       

OpenAI 提前超额完成 Stargate 项目 10GW 基建目标

       

https://openai.com/index/building-the-compute-infrastructure-for-the-intelligence-age/

     

     

       

OpenAI 提前超额完成 Stargate 项目 10GW 基建目标

       

https://cdn.openai.com/pdf/openai-ending-the-capability-overhang.pdf

     

     

       

AI医疗新技术助力不育男性,可定位极微量精子

       

https://www.bbc.com/news/topics/ce1qrvleleqt

     

     

       

Spotify推出“绿色勋章”标记真人创作,治理AI生成内容

       

Spotify introduces verified artist badges to help distinguish humans from AI

     

     

       

科技巨头AI基础设施支出预计达六千亿美元,Meta与谷歌竞速建设

       

https://www.reuters.com/technology/artificial-intelligence/

     

     

       

Genspark 与微软达成合作,AI Agent 原生集成 Microsoft 365

       

https://www.businesswire.com/news/home/20260429907387/en/Genspark-Announces-Global-Strategic-Partnership-with-Microsoft-to-Embed-AI-Agents-Across-Microsoft-365-and-Agent-365

     

     

       

Zig语言项目宣布全面禁止AI生成代码贡献

       

https://www.aibase.com/zh/news/27660

     

     

       

AI 驱动游戏演示《Open Design》获关注,展现电影级视觉表现

       

https://github.com/nexu-io/open-design

     

     

       

开源智能代理框架 Craft-Agents 在 GitHub 获超 5500 星标

       

https://github.com/lukilabs/craft-agents-oss

     

     

       

DeepSeek 协议中转工具 ds2api 开源,支持 Docker 一键部署

       

https://github.com/CJackHwang/ds2api

     

     

       

Browserbase 开源 Skills 框架,赋予 Claude 原生网页操作能力

       

https://github.com/browserbase/skills

     

     

       

Glean 发布专用检索模型 Waldo,优化搜索延迟与算力消耗

       

https://www.glean.com/blog/waldo-launch

     

     

       

OpenAI 升级 Codex,拓展为日常办公助手

       

https://x.com/sama/status/2049944981750833659

     

     

       

OpenAI 升级 Codex,拓展为日常办公助手

       

https://chatgpt.com/codex/for-work/

     

     

       

OpenAI 升级 Codex,拓展为日常办公助手

       

https://x.com/thsottiaux/status/2049970070873629026

     

     

       

OpenAI 升级 Codex,拓展为日常办公助手

       

https://x.com/Dimillian/status/2049929842133520577

     

     

       

业界探讨认知深度与AI边界,强调人类核心领悟不可外包

       

https://x.com/karpathy/status/2049907410303865030

     

     

       

Opus 4.7 被指具备强大文风分析能力,可识别匿名作者引争议

       

https://newshacker.me/story?id=47951295

     

     

       

开发者Tw93发布AI-SEO实操指南,作品获主流大模型主动推荐

       

https://x.com/hongming731/status/2049967429238034623

     

     

       

Karpathy提出智能体工程新范式,旨在提升大模型编程与调试能力

       

https://x.com/karpathy/status/2049903821095354523

     

     

       

蚂蚁百灵开源两款大模型 Ling-2.6-1T 与 Ling-2.6-flash

       

https://www.bestblogs.dev/article/8cc137b1?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

     

     

       

DeepSeek 发布多模态新成果,引入视觉坐标提升推理能力

       

https://www.bestblogs.dev/article/87e2dfe8?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

     

   

   

     

🌟 点亮星标 🌟AI前沿进展每日见

     

点击右上角「…」→「AI网罗」→右上角「…」→点亮「星标」,锁定AI网罗最新推送!