AI 资讯日报 2026-04-10 OpenAI 推出 ChatGPT 100 美元 Pro 档

2026年4月10日星期五 · 共 40 条 AI 资讯

今日摘要

OpenAI 推出 ChatGPT 100 美元 Pro 档
字节跳动发布原生全双工语音模型 Seeduplex，豆包可用
Overworld 发布实时扩散世界模型 Waypoint-1.5
LG AI Research 发布 EXAONE 4.5 开源视觉语言模型
阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型
Claude API 上线 Advisor 策略，平衡智能成本性能提升
Claude Code 升级配置向导，引入监控工具
Codex 官方上线 Build macOS Apps 插件
Codex 宣布将再次重置使用额度
OpenClaw 发布 2026.4.9，重构记忆系统与安全机制
MiniMax 发布 MMX-CLI 命令行工具
Google 宣布 Gemini 支持生成交互式可视化及 3D 模型
Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能
Claude Cowork 结束预览，全面开放并上线企业管控功能
扣子2.5开启Agent World时代。
腾讯龙虾QBotClaw浏览器智能体来了。
谷歌Gemini解锁Lyria 3音乐创作。
Mistral首款语音模型Voxtral开源。
巨量引擎品星云重塑AI营销。
通义实验室开源 VimRAG，支持图文视频混合知识库检索

产品与功能更新

1 阿里AIDC开源Marco-MoE稀疏大语言模型

大模型AIDC-AIMarco-MoE阿里AIDC-AI开源发布

阿里 AIDC-AI 团队开源了 Marco 系列两款稀疏多语言大模型，分别是总参数 173 亿、激活参数 8.6 亿的 Marco-Mini-Instruct 和总参数 80 亿、激活参数 6 亿的 Marco-Nano-Instruct。 Alibaba International Digital Commerce 近日推出了两款属于 Marco-MoE 家族的新型高度稀疏多语言大语言模型：Marco-Mini-Instruct 与 Marco-Nano-Instruct。这两款模型均采用 Decoder-only Transformer 架构，并利用 Drop-Upcycling 技术从 Qwen3-0.6B-Base 升级改造而来，以极低的激活参数量实现了高效的推理能力。其中，Marco-Mini-Instruct 拥有 17.3B 总参数，每个 token 仅激活 0.86B 参数；而 Marco-Nano-Instruct 拥有 8B 总参数，每个 token 仅激活 0.6B 参数。

📌 解读

阿里通过稀疏化技术实现小模型激活大模型能力，特别适合跨境电商的多语言场景。Drop-Upcycling技术将旧模型改造为新架构，大幅降低训练成本。6亿激活参数设计精准匹配边缘计算需求。

💡 启示

谁应该关注：边缘计算部门，多语言实时翻译格局变化：MoE架构成为降本增效新范式机会窗口：开发移动端多语种客服系统行动建议：测试稀疏模型在低功耗芯片表现

2 字节跳动发布全双工语音模型Seeduplex，误打断率降低50%

多模态Seeduplex字节跳动发布模型

字节跳动Seed团队推出原生全双工语音大模型Seeduplex，采用端到端建模技术，在复杂声学环境下将误回复率和误打断率降低50%，抢话比例下降40%。该模型判停延迟减少250ms，通话满意度提升8.34%。用户可通过更新豆包App体验该功能。

📌 解读

字节跳动通过全双工语音技术突破，在实时交互赛道建立技术壁垒。误打断率指标直击语音交互痛点，250ms延迟优化达到电信级标准。该技术可能优先应用于抖音电商客服场景，形成商业闭环。

💡 启示

谁应该关注：语音技术部门，实时语音交互场景格局变化：语音交互进入电信级可靠性竞争阶段机会窗口：开发会议场景的抢话预测功能行动建议：测试复杂环境下的多语种适配性

3 腾讯云发布龙虾浏览器智能体，支持远程操控电脑

应用QBotClaw发布AI Agent

腾讯云推出龙虾浏览器智能体，原生集成AI Agent能力，用户可通过微信扫码远程操控电脑，即使锁屏也能执行任务。该工具支持跨页面操作，Mac版已上线，Windows版即将发布。

📌 解读

腾讯通过微信生态整合AI Agent能力，强化其云服务与社交平台的协同效应，此举可能重新定义远程办公工具的市场标准。一个关键细节是支持跨页面操作，这意味着用户可以在不同应用间无缝切换，提升工作效率。

💡 启示

谁应该关注：产品部门，远程办公与跨设备协作格局变化：推动浏览器智能体成为办公标配机会窗口：开发更多跨平台AI办公工具行动建议：评估集成腾讯云AI Agent的可能性

4 Claude Cowork结束预览，全面开放并新增企业管控功能

大模型ClaudeCoworkClaude Cowork发布落地应用

Anthropic宣布Claude Cowork结束12周预览期，正式向所有付费用户开放桌面端应用。企业版新增基于角色的访问控制、团队支出限制等管控功能，支持macOS和Windows平台。

📌 解读

Anthropic通过企业管控功能强化B端市场壁垒，角色访问控制设计显示其对金融/医疗等强合规行业的针对性。预览期数据可能已用于优化团队协作场景的AI行为边界。

💡 启示

谁应该关注：企业服务部门，跨部门敏感信息处理格局变化：企业AI办公标准形成机会窗口：定制行业合规工作流行动建议：设计权限分级实施路线

5 Google Gemini新增交互式可视化功能，支持3D模型生成

大模型GoogleGemini发布落地应用模型

Google宣布Gemini应用推出交互式可视化功能，用户可在聊天界面生成可调整的3D模型与功能性模拟。该功能支持通过拖动滑块、输入数值调整系统变量，或旋转3D模型探索复杂概念。用户需选择Pro模型并输入特定指令或点击可视化按钮即可体验。

📌 解读

Google将Gemini定位为可视化思维工具而非单纯聊天机器人，通过交互式3D建模切入教育科研市场。这改变了AI助手仅处理文本信息的传统认知，其滑块调节功能可能成为STEM教育新范式。

💡 启示

谁应该关注：教育产品部门，复杂概念可视化教学格局变化：重塑知识传递方式机会窗口：开发学科专用交互模板行动建议：测试物理/化学课程适配性

6 Mistral开源语音模型Voxtral，支持声线克隆

多模态MistralVoxtralMistral首款语音模型Voxtral开源发布

Mistral发布开源TTS大模型Voxtral，该模型参数达4B，可在手机端运行，仅需3秒音频即可克隆声线。其首包延迟低至90毫秒，支持9种语言跨语迁移。

📌 解读

Mistral开源Voxtral模型，降低了语音克隆技术的门槛，可能引发语音合成领域的创新浪潮。手机端运行和低延迟使其在实时应用中具有优势，跨语迁移能力则扩大了市场覆盖范围。

💡 启示

谁应该关注：技术部门，实时语音合成与克隆格局变化：推动开源语音模型生态发展机会窗口：开发多语言语音交互应用行动建议：评估Voxtral在现有产品中的集成

7 Gemini向免费用户开放Lyria 3音乐生成功能

技术GeminiLyriaLyria 3发布

Gemini宣布免费用户现可通过Create music功能每天生成最多5首3分钟的完整歌曲，达到限额后仍可生成30秒短片。该功能上线不足50天已累计产出超1亿首歌曲。

📌 解读

Gemini通过音乐生成功能获取用户行为数据训练更精准的创作模型，免费策略实为数据采集手段。1亿首歌曲产生的隐式反馈比付费收入更具长期价值，这种数据飞轮效应可能改变AIGC竞争维度。

💡 启示

谁应该关注：数据战略部门，UGC内容平台运营格局变化：音乐创作民主化加速机会窗口：建立用户创作行为分析模型行动建议：监控生成内容版权风险

8 Claude Code新增自动化配置向导与监控工具

大模型ClaudeCodeClaude Code发布开发工具

Claude Code 推出了 Setup Wizard 和 Monitor Tool 两项更新。全新的 Setup Wizard 实现了第三方云服务的自动化配置。同时，开发者现在可以通过调用 Monitor Tool 来创建后台脚本并唤醒 Agent，从而在执行日志监控等高级任务时告别低效轮询，节省 Token 消耗。 Claude Code 推出了全新的 Setup Wizard 以及 Monitor Tool。针对过去需手动编写配置文件和环境变量才能将 Claude Code 与 Amazon Bedrock 或 Google Vertex 搭配使用的痛点，新推出的安装向导可自动代为处理这些流程。该向导还能主动建议用户升级至其有权限访问的较新模型。与此同时，Claude Code 还引入了 Monitor Tool。这项工具允许 Claude 创建后台脚本并在必要时唤醒 Agent，不仅避免了在 Agent 循环中进行低效轮询，还能极大节省 Token 消耗。在实际操作中，开发者需要显式地对 Claude Code 进行提示才能调用该工具，例如指示其“启动开发服务器并使用 MonitorTool 观察错误”。

📌 解读

Claude Code通过工具链自动化降低使用门槛，反映了AI开发工具向DevOps融合的趋势。监控工具的异步唤醒机制创新性地解决了LLM场景的轮询消耗问题，这种设计思路可能重塑AI运维工具标准。云服务自动配置功能直击多云环境管理痛点。

💡 启示

谁应该关注：DevOps团队，AI系统持续集成部署格局变化：加速AI工具链与现有CI/CD体系整合机会窗口：构建基于事件驱动的AI监控体系行动建议：评估Monitor Tool与现有告警系统集成

9 巨量引擎发布品星云系统，AI可自动识别视频高光插入广告

多模态AI发布

巨量引擎推出品星云系统，该系统能自动识别视频中的高光片段并插入广告。此外，AI还能生成短剧番外内容，将品牌自然融入剧情。系统通过分析爆款逻辑提升互动效果，据称流量裂变效果显著。

📌 解读

巨量引擎通过品星云系统将AI深度融入广告投放，实现了内容与广告的无缝结合。系统通过分析爆款逻辑优化广告效果，这可能改变传统广告的投放模式，提升ROI。

💡 启示

谁应该关注：市场部门，AI驱动的广告投放优化格局变化：重塑视频广告的投放策略机会窗口：利用AI生成高互动性广告内容行动建议：测试品星云系统的广告效果

10 OpenAI推出100美元ChatGPT Pro订阅档，提供5倍Codex使用量

大模型OpenAIChatGPTPro发布开发工具

OpenAI正式推出每月100美元的ChatGPT Pro订阅服务，该档位提供比Plus版本高5倍的Codex使用量，并保留所有Pro功能。6月前促销期间，用户可获得10倍使用额度。同时，OpenAI调整了Plus计划的Codex使用量分配，以支持用户更均衡地分布任务。

📌 解读

OpenAI通过推出高价Pro档位，瞄准企业级和专业用户市场，进一步细分用户群体并提升ARPU。调整Plus计划Codex分配策略，既缓解服务器压力，又避免低价值用户挤占资源。促销期10倍额度是典型的获客策略，但可能掩盖长期留存问题。

💡 启示

谁应该关注：产品部门，AI工具订阅模式优化格局变化：加速AI服务分层化，挤压中小玩家生存空间机会窗口：开发针对Pro用户的垂直场景插件行动建议：监控用户层级迁移数据，优化配额算法

11 OpenClaw 2026.4.9版本更新：重构记忆系统并强化安全机制

网安 / 安全OpenClaw发布网络安全模型

OpenClaw发布2026.4.9版本，重点重构了记忆与梦境系统，新增支持历史路径的REM回填通道和结构化日记视图。同时推出并行运行的character-vibes评估报告以加速模型行为比对。安全方面修复了SSRF隔离漏洞，并限制不受信任工作区对核心授权选项的非法覆盖。

📌 解读

OpenClaw的记忆系统重构标志着AI系统向类人认知架构演进，REM回填通道的提出可能影响后续记忆机制设计标准。并行评估报告功能展现了模型行为可解释性的新思路，安全机制的强化则回应了企业级部署的核心关切。

💡 启示

谁应该关注：AI研究院，复杂对话系统架构设计格局变化：推动认知架构研究进入工程化阶段机会窗口：开发记忆系统的可视化分析工具行动建议：测试结构化日记在客服场景的应用

12 Codex宣布将于4月10日重置使用额度

编程Codex开发工具

Codex负责人于4月9日表示，因近期重置间隔较短，决定次日再次重置使用额度。此次调整旨在庆祝平台活跃用户达到300万节点，距离上次重置约一周时间。

📌 解读

频繁重置额度暴露平台运营策略的灵活性，这种非周期性的用户激励手段可能成为AI服务留存用户的新模式。300万节点里程碑暗示平台已进入规模效应阶段，但持续的资源投入策略需要配套商业化方案支撑。

💡 启示

谁应该关注：运营部门，AI平台用户活跃度管理格局变化：促使竞品重新评估资源分配策略机会窗口：设计弹性资源定价模型行动建议：监测用户行为对额度重置的响应

13 Overworld发布Waypoint-1.5实时扩散世界模型，支持720p/60fps生成

大模型OverworldWaypoint-1.5发布落地应用模型

Overworld发布Waypoint-1.5实时扩散世界模型，训练数据量达前代100倍，采用双层级架构，可在RTX 3070显卡上实现720p/60fps的实时环境生成。该模型支持本地部署和网页端体验，未来将兼容Apple Silicon Mac平台。

📌 解读

Overworld通过消费级显卡实现实时环境生成，打破专业算力门槛。双层级架构设计平衡质量与速度，720p/60fps指标瞄准游戏/VR市场。兼容Apple Silicon显示其跨平台野心。

💡 启示

谁应该关注：图形技术部门，实时虚拟环境构建格局变化：降低AIGC内容生产硬件门槛机会窗口：开发UGC虚拟场景创作工具行动建议：测试不同光照条件下的渲染稳定性

14 谷歌开放Lyria 3模型，每日可免费生成5首歌曲

多模态GeminiLyria模型音乐生成

谷歌开放Lyria 3音乐创作模型，用户每天可免费生成5首完整歌曲，单曲时长可达3分钟。目前该生态内累计创作歌曲已突破1亿首。

📌 解读

谷歌通过免费策略快速扩大Lyria 3的用户基础，意在巩固其在AI音乐生成领域的领先地位。每天5首的限额既能吸引用户，又可能推动付费升级。1亿首的创作量显示了用户生成内容（UGC）的潜力。

💡 启示

谁应该关注：市场部门，AI音乐创作与内容生成格局变化：加速AI音乐生成工具普及机会窗口：探索AI音乐在营销中的应用行动建议：测试Lyria 3生成品牌定制音乐

15 MiniMax推出MMX-CLI命令行工具，支持多模态模型调用

编程MiniMaxMMX-CLI开源发布开发工具

MiniMax发布开源命令行工具MMX-CLI，支持AI Agent原生调用文本、图像、视频、语音和音乐等多模态模型。该工具具备七项核心能力，包括批量图像生成与理解、异步视频生成等，并优化了非交互式环境下的运行体验，生成消耗可直接计入用户Token Plan配额。

📌 解读

MiniMax通过开源MMX-CLI工具强化开发者生态，降低多模态AI应用门槛，意在吸引开发者构建基于其API的解决方案。此举可能挤压中小AI平台生存空间，尤其值得注意的是工具支持消耗计入用户Token Plan，暗示其商业化策略从单纯API调用转向开发者全生命周期服务。

💡 启示

谁应该关注：开发者关系部门，AI应用快速原型开发格局变化：加速多模态AI工具链标准化机会窗口：利用开源工具构建垂直领域Agent行动建议：评估工具与现有CI/CD流程整合

16 字节发布扣子2.5，支持智能体独立云设备

应用AgentWorld发布AI Agent

字节跳动发布扣子2.5，其智能体可运行在独立云设备上，支持7x24小时工作。该版本延续DeerFlow技术路线，具备长期记忆功能，并赋予智能体专属邮箱作为数字身份。

📌 解读

字节赋予智能体数字身份意味着向自主数字员工进化，专属邮箱使Agent具备对外沟通能力。独立云设备部署突破传统SaaS模式，可能引发边缘计算与AI结合的新硬件浪潮。

💡 启示

谁应该关注：IoT事业部，分布式智能终端管理格局变化：智能体实体化趋势显现机会窗口：开发专用硬件管理协议行动建议：研究边缘AI能耗优化方案

17 LG发布330亿参数开源视觉语言模型EXAONE 4.5

多模态LGAILG AI Research开源发布

LG AI Research推出开源视觉语言模型EXAONE 4.5，该模型包含330亿参数，其中视觉编码器12.9亿，语言模型317亿。在文档理解和韩语推理方面表现优于同级别模型，支持262,144 tokens的上下文长度，知识截止至2024年12月。

📌 解读

LG通过开源超大上下文窗口模型，在文档处理领域建立差异化优势。韩语优化显示其本土化战略，12.9亿视觉编码器规模暗示多模态侧重。知识截止日期设定可能影响金融/医疗等时效敏感领域应用。

💡 启示

谁应该关注：多模态研发部门，长文档跨模态分析格局变化：开源VL模型进入300亿参数竞赛机会窗口：开发合同条款自动比对系统行动建议：评估长上下文下的知识衰减曲线

18 Claude API推出Advisor策略优化成本与性能

大模型ClaudeAPIClaude API发布模型

Anthropic在Claude API中推出Beta版Advisor策略，通过将低成本Sonnet或Haiku模型作为执行者，仅在复杂决策时咨询顶级Opus模型，实现智能与成本的平衡。测试显示该策略在SWE-bench评测中提升2.7个百分点，同时降低11.9%任务成本。

📌 解读

Anthropic通过分层模型调用策略优化成本效益，体现了AI服务向精细化运营的转型。这种混合调用模式可能引发行业效仿，改变当前单一模型调用的竞争逻辑。值得注意的是，该策略在SWE-bench的评测提升证明其技术可行性，为模型组合应用提供新范式。

💡 启示

谁应该关注：技术部门，AI模型成本优化方案设计格局变化：推动行业从单一模型向混合架构演进机会窗口：开发跨模型调度中间件行动建议：测试Sonnet+Opus组合的本地化部署

19 Codex正式发布macOS应用构建插件

客户端侧产品CodexBuildApps发布落地应用

Codex官方发布Build macOS Apps插件，支持基于SwiftUI和AppKit的原生应用开发。该插件整合本地构建脚本与UI按钮，实现一键构建打包；增强Agentic Debugging功能，可添加遥测数据辅助实时调试，内置技能涵盖Apple设计规范与测试流程。

📌 解读

Codex聚焦垂直领域开发体验，通过深度集成原生开发工具链建立竞争壁垒。遥测数据与调试功能的结合展示了AI辅助开发的新方向，这种实时反馈机制可能成为开发者工具的标配功能。插件对Apple设计规范的覆盖体现了场景化知识的重要性。

💡 启示

谁应该关注：移动开发部，跨平台应用快速原型开发格局变化：推动AI编码工具向垂直领域专业化发展机会窗口：开发领域特定的代码生成模板行动建议：测试插件在SwiftUI迁移项目中的应用

前沿研究

1 清华AutoSOTA系统一周内刷新105个SOTA记录

大模型AutoSOTASOTA发布模型

清华大学发布AutoSOTA系统，该系统能自动调参和运行实验，实现端到端科研闭环。在一周内刷新了105个顶会SOTA记录，模型平均性能提升10%。相关论文已公开。

2 VGGT-SLAM++通过语义增强解决视觉定位漂移问题

多模态VGGT-SLAM

研究人员提出VGGT-SLAM++视觉定位新方案，引入DINOv2语义增强技术提升几何感知能力。该方案有效解决了机器人定位漂移问题，显著提高了大规模建图精度，推动视觉SLAM技术发展。

3 微软推出思维链压缩技术，推理效率显著提升

大模型开发工具模型

微软开发出思维链压缩技术，通过KV缓存保留关键信息。该技术使模型准确率提升15个百分点，吞吐量实现翻倍，进一步优化了推理资源使用。

4 PlaneCycle无需训练实现2D到3D转换

技术PlaneCycle开源模型

PlaneCycle方案通过将2D基础模型特征循环分布在三个平面，实现了无需重新训练或适配器的2D到3D转换。该方案已开源，在保持性能无损的同时提升了维度转换能力。

5 PRISM物理模型在去雾任务中达到SOTA水平

大模型PRISMSOTA模型

PRISM模型针对真实世界去雾任务，提出PSAR物理重建框架，专门解决非均匀雾气这一行业难题。其图像恢复效果达到商业级水平，清晰度显著提升。

6 腾讯混元MoT架构模型在22项评测中16项领先

大模型MoT发布模型

腾讯混元发布基于MoT架构的具身基础模型，参数规模达20亿。该模型在22项评测中获得16项最佳成绩，项目源码已公开。

7 SurFITR数据集发布，可检测13万张篡改图像

多模态SurFITR网络安全

AI造假正威胁视觉证据安全，SurFITR数据集包含13万张篡改图像，通过多模态LLM自动生成样本，显著提升了检测与定位能力，安全攻防对抗进一步升级。

8 通义实验室开源VimRAG框架，支持多模态知识库检索

多模态VimRAG通义实验室开源模型

通义实验室开源了VimRAG框架，该框架面向文本、图像和视频混合知识库检索。通过动态有向无环图和视觉能量分配机制，解决了多模态检索中的状态盲区问题。在Qwen3-VL-8B模型测试中，平均准确率达50.1%。

📌 解读

通义实验室开源VimRAG框架，解决了多模态检索中的关键技术难题，为混合知识库的应用铺平了道路。动态有向无环图和视觉能量分配机制是其创新点，50.1%的准确率显示了其潜力。

💡 启示

谁应该关注：技术部门，多模态知识库检索格局变化：推动多模态AI检索技术发展机会窗口：开发混合知识库的垂直应用行动建议：研究VimRAG在现有系统中的集成

9 智元GO-2具身智能机器人发布，测试成功率98.5%

大模型GO-2发布模型

智元机器人发布具身大模型GO-2，采用异步双系统架构和动作思维链机制。基准测试显示其成功率高达98.5%，标志着具身智能技术正逐步实用化。

行业展望与社会影响

1 Meta与CoreWeave签署210亿美元云计算协议

技术MetaCoreWeaveAI落地应用算力芯片

Meta与CoreWeave达成一项价值210亿美元的云计算协议，合作期限延长至2032年底。根据协议，Meta将获得英伟达下一代Vera Rubin芯片的初始部署权，以增强其AI研发能力。该协议是双方去年9月142亿美元合作的延续，消息公布后两家公司股价均有所上涨。

2 腾讯云下月起上调AI算力等产品价格5%

技术AI算力芯片

受全球AI算力需求激增及硬件成本上涨影响，腾讯云宣布自下月起将AI算力、弹性MapReduce等核心产品的刊例价统一上调5%，以保障服务质量与算力资源供给。

3 字节跳动面临AI人才持续流失

技术AI发布

字节跳动核心AI人才持续流失，前员工创办的爱诗科技等公司正积极争夺其业务。为应对人才流失，字节推出豆包股激励计划，并倾向于提拔校招生。管理层认为年轻人的学习能力是公司核心资产，正通过人员调整应对人才流失问题。

4 Intel与Google合作推进AI云基础设施与IPU开发

编程IntelGoogleAI落地应用开发工具

Intel与Google宣布达成多年期合作，Google Cloud将继续部署Intel Xeon处理器以满足AI需求，双方还将扩大基于定制ASIC的基础设施处理单元联合开发。

5 Nebius洽谈收购AI21 Labs以拓展AI云服务

投融资 / 创业NebiusAI21AI21 Labs模型

AI云服务商Nebius正在洽谈收购以色列AI公司AI21 Labs，旨在整合其Jamba模型与企业级AI平台，向全栈AI云服务转型。收购价格尚未披露，此前英伟达曾考虑以约30亿美元收购AI21 Labs未果。Nebius表示不对传闻置评，但确认正在构建全栈AI云服务。

开源TOP项目

1 Superpowers框架发布，支持智能体快速叠加技能

应用Superpowers发布开发工具AI Agent

智能体开发框架Superpowers正式发布，提供复杂逻辑处理方法论，支持快速为Agent叠加技能。该框架可提升开发效率，加速从手写代码到编排Agent的转变。

2 微软开源全能Markdown转换工具

多模态MarkItDown开源开发工具

微软开源了一款支持PDF、Word、音频及YouTube链接转换的Markdown工具，适配MCP协议和RAG流程，可通过插件扩展功能，开发者可通过简单命令安装使用。

3 Karpathy编程经验配置库上线，提升大模型代码质量

编程KarpathyKarpathy编程秘籍配置库发布落地应用开发工具

基于Karpathy方法论的编程经验配置库已发布，可精准修复大模型写代码的弱点，显著提升Claude等模型的代码产出质量。该项目已获得450个关注，部署流程较为简单。

4 金融大模型Kronos正式开源

大模型Kronos金融大模型Kronos开源开发工具模型

金融市场语言模型Kronos已开源，采用时序编码处理金融数据，能识别市场规律并优化量化交易，目前该项目在社区已获得2.8k关注。

5 港大推出智能私教系统DeepTutor

应用DeepTutor发布AI Agent

香港大学发布基于原生Agent架构的个性化智能导师系统DeepTutor，可实时捕捉学习痛点，旨在提供更个性化的教育体验。

社媒分享

1 OpenClaw发布memory-wiki记忆整理插件

应用OpenClawmemory-wiki发布AI Agent

延续此前"Light/Deep/REM"三阶段记忆巩固机制，OpenClaw再次跟进Karpathy方法论，发布 记忆整理插件 。自带置信度标注 和健康检查。杂乱Markdown秒变结构化知识库。过时信息自动清理。Agent检索精度大幅提升。

2 OpenAI模型成功解决五项Erdős数学难题

大模型OpenAIErd模型

OpenAI内部模型一次性攻克五项Erdős数学难题，其中Erdős 1091的解答尤为突出。数学家评价其证明过程相当优雅，显示出AI在逻辑推理方面的显著进步。

访问链接

阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型

https://huggingface.co/AIDC-AI/Marco-Mini-Instruct

阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型

https://huggingface.co/AIDC-AI/Marco-Nano-Instruct

字节跳动发布原生全双工语音模型 Seeduplex，豆包可用

https://seed.bytedance.com/zh/seeduplex

字节跳动发布原生全双工语音模型 Seeduplex，豆包可用

https://seed.bytedance.com/zh/blog/introducing-seed-full-duplex-speech-llm-attentive-listening-robust-interference-suppression-enabling-more-natural-interaction

字节跳动发布原生全双工语音模型 Seeduplex，豆包可用

https://mp.weixin.qq.com/s/ymyF-nBO-VT7ehnGO255qg

腾讯龙虾QBotClaw浏览器智能体来了。

https://www.aibase.com/zh/news/26980

Claude Cowork 结束预览，全面开放并上线企业管控功能

https://x.com/claudeai/status/2042273755485888810

Google 宣布 Gemini 支持生成交互式可视化及 3D 模型

https://blog.google/innovation-and-ai/products/gemini-app/3d-models-charts/

Mistral首款语音模型Voxtral开源。

https://x.com/shao__meng/status/2042231525576441885

Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能

https://x.com/Google/status/2042324699955237233

Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能

https://x.com/GeminiApp/status/2042316630253076945

Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能

https://x.com/joshwoodward/status/2042318148851188151

Claude Code 升级配置向导，引入监控工具

https://x.com/_catwu/status/2042345489778331915

Claude Code 升级配置向导，引入监控工具

https://x.com/trq212/status/2042335178388103559

OpenAI 推出 ChatGPT 100 美元 Pro 档

https://x.com/OpenAI/status/2042295688323875316

OpenClaw 发布 2026.4.9，重构记忆系统与安全机制

https://github.com/openclaw/openclaw/releases/tag/v2026.4.9

OpenClaw 发布 2026.4.9，重构记忆系统与安全机制

https://x.com/openclaw/status/2042072722902077938

Codex 宣布将再次重置使用额度

https://x.com/thsottiaux/status/2042067902392942790

Overworld 发布实时扩散世界模型 Waypoint-1.5

https://over.world/blog/waypoint-1-5

Overworld 发布实时扩散世界模型 Waypoint-1.5

https://github.com/Overworldai/Biome

MiniMax 发布 MMX-CLI 命令行工具

https://mp.weixin.qq.com/s/d067bWUdhqYwvfehoYKtVw

MiniMax 发布 MMX-CLI 命令行工具

https://github.com/MiniMax-AI/cli

LG AI Research 发布 EXAONE 4.5 开源视觉语言模型

https://github.com/LG-AI-EXAONE/EXAONE-4.5

LG AI Research 发布 EXAONE 4.5 开源视觉语言模型

https://huggingface.co/LGAI-EXAONE/EXAONE-4.5-33B

Claude API 上线 Advisor 策略，平衡智能成本性能提升

https://claude.com/blog/the-advisor-strategy

Claude API 上线 Advisor 策略，平衡智能成本性能提升

https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

Claude API 上线 Advisor 策略，平衡智能成本性能提升

https://x.com/claudeai/status/2042308622181339453

Codex 官方上线 Build macOS Apps 插件

https://x.com/OpenAIDevs/status/2042369696608239848

清华AutoSOTA一周刷新105个SOTA。

https://tsinghua-fib-lab.github.io/AutoSOTA/

清华AutoSOTA一周刷新105个SOTA。

https://arxiv.org/abs/2604.05550

VGGT-SLAM++解决视觉定位漂移。

https://arxiv.org/abs/2604.06830

微软思维链压缩技术惊艳亮相。

https://x.com/omarsar0/status/2042315710173528122

PlaneCycle无训练实现2D转3D。

https://arxiv.org/abs/2603.04165

PlaneCycle无训练实现2D转3D。

https://github.com/HINTLab/PlaneCycle

PRISM物理模型达成去雾SOTA。

https://arxiv.org/abs/2604.07048

腾讯MoT架构2B模型横扫榜单。

https://github.com/Tencent-Hunyuan/HY-Embodied

SurFITR数据集反制监控图像造假。

https://arxiv.org/abs/2604.07101

通义实验室开源 VimRAG，支持图文视频混合知识库检索

https://mp.weixin.qq.com/s/VyE8ayVY2DI5UYzliWp7aA

通义实验室开源 VimRAG，支持图文视频混合知识库检索

https://github.com/Alibaba-NLP/VRAG

智元GO-2刷新具身智能标杆。

https://www.aibase.com/zh/news/26983

Meta 与 CoreWeave 签 210 亿美元协议强化 AI 算力部署

https://www.coreweave.com/news/coreweave-and-meta-announce-21-billion-expanded-ai-infrastructure-agreement

腾讯云上调 AI 算力等产品刊例价 5% 下月起生效

https://cloud.tencent.com/announce/detail/2254

字节沦为AI人才黄埔军校。

https://m.okjike.com/originalPosts/69d7a05f800201ac6863cce1

Intel 与 Google 达成合作推进 AI 云基础设施与 IPU 开发

https://newsroom.intel.com/data-center/intel-google-deepen-collaboration-to-advance-ai-infrastructure

Superpowers框架给智能体叠技能。

https://github.com/obra/superpowers

微软MarkItDown万能格式转换神器。

https://github.com/microsoft/markitdown

微软MarkItDown万能格式转换神器。

https://www.xiaohu.ai/c/a066c4/markitdown-pdf-word-ppt-youtube-markdown

Karpathy编程秘籍配置库上线。

https://github.com/forrestchang/andrej-karpathy-skills

金融大模型Kronos开源登场。

https://github.com/shiyu-coder/Kronos

港大DeepTutor打造智能私教。

https://github.com/HKUDS/DeepTutor

OpenClaw发布memory-wiki记忆插件。

https://m.okjike.com/originalPosts/69d78bfe25bae56612921b7f

OpenAI模型一口气攻克五项Erdős难题。

https://x.com/kevinweil/status/2042073869880848481